GR00T N1.5: архитектура, данные и эволюция VLA-моделей
Начинаем серию разборов современных Vision-Language-Action (VLA) моделей для...
Подборка публикаций, содержащих тег "deep learning". Актуальные темы и важные события.
Начинаем серию разборов современных Vision-Language-Action (VLA) моделей для...
Модель распознавания эмоций в речи GigaAM-Emo умеет классифицировать 4 эмоции:...
Примерно год назад мы запустили виртуального рассказчика в Яндекс Книгах. Он...
Цель данной статьи - предоставить полное техническое руководство по созданию...
Аналитический центр red_mad_robot разобрал объёмную научную статью «Advances...
В этой статье я не просто объясню, что такое ViT — я покажу вам, как создать...
Всем привет! На связи снова Константин Ушенин из AIRI, и мы продолжаем говорить...
Привет, Хабр! Мы – Даниил Соловьев и Михаил Никитин из команды направления...
Поговорим об методике дообучения LLM… спортсменке, комсомолке и просто...
Продолжаем статьи про практические тесты актуальных картонок от Nvidia (A5000...
Осенью 2021 года мы впервые представили пользователям технологию перевода видео...
Исследование эволюции AI аватаров — от примитивных говорящих голов до...