Новости по тегу "learning"
Подборка публикаций, содержащих тег "learning". Актуальные темы и важные события.

Виртуальный рассказчик 2.0: эволюция нейросетевого рассказчика в Яндекс Книгах
Примерно год назад мы запустили виртуального рассказчика в Яндекс Книгах. Он хорошо решал задачу чтения книг вслух без предзаписанных аудиоверсий,...

Автоматизированная оценка стабильности скоринговых моделей на основе временных рядов метрик
Привет, Хабр! Меня зовут Зотов Глеб, я ML-инженер в команде скоринга в билайне. В статье расскажу о том, как не сойти с ума, мониторя десятки...

Топ-5 алгоритмов из курса матана, которые реально пригодятся в работе
Всем привет. Сегодня хочу затронуть тему матана, чтобы показать как его можно применять на реальных задачах. Думаю каждый, кто учил матан часто...

GSPO (Qwen RL Algorithm by Alibaba Cloud)
Qwen снова радуют релизом. Но на этот раз это не модель, а новый RL-алгоритм для обучения LLMМетод называется Group Sequence Policy Optimization...

Titanic + CatBoost (Первое решение, первый Jupyter Notebook)
Решение первого соревнования на kaggle титаник с помощью библиотеки от яндекса catboost. Два способа: обычная модель и второй: с перебором...

Как мы обучали модели для кода GigaCode
Привет, Хабр! Меня зовут Дмитрий Бабаев, я руководитель R&D GigaCode в Сбере. Сегодня расскажу о том, как мы создавали ИИ-помощника для...

Стратегия успеха: ключи к развитию карьеры в Data Science (ч.2)
Привет! Я Анна Ширшова, руководитель Кластера моделирования для CRM и оптимизации в ВТБ. Это вторая часть моего материала о карьерном росте в Data...

LLM-арсенал: от общих моделей до ESM-3 и DNABERT
В этой статье мы делимся практиками использования языковых моделей (LLM) в биологии и биомедицине — с акцентом на то, что действительно помогает...

Почему мы учим английский неправильно и как надо
Я написала и запустила продукт — тренажёр грамматики английского языка. Зачем я это сделала, если уже есть куча приложений, в т. ч. бесплатный в...

RL-агент для алгоритмической торговли на Binance Futures: архитектура, бэктест, результаты
Цель данной статьи - предоставить полное техническое руководство по созданию торгового агента, обученного с помощью Reinforcement Learning, на...

Semantic Error Correction Loop (SECL): самоисправляющиеся LLM-пайплайны с понятием доверия к контексту
В последние годы большие языковые модели кардинально изменили ландшафт искусственного интеллекта, открывая невероятные возможности для...

Новый метод поиска от Sakana: расширение inference-time scaling и коллективный разум
Аналитический центр red_mad_robot продолжает разбирать исследования японской лаборатории Sakana AI — в прошлый раз это была архитектура CTM,...