Новости по тегу "мультимодальные модели"
Подборка публикаций, содержащих тег "мультимодальные модели". Актуальные темы и важные события.

Жестовый язык: похожее в непохожем и наоборот
Привет, Хабр! Наша команда RnD CV продолжает приближать момент, когда компьютер по видео сможет распознавать жестовый язык (ЖЯ) глухих так же...

Мультимодальные LLM: ключик к AGI или зачем бизнесу модели, которые видят, слышат и понимают?
Мультимодальные модели — звучит как что-то для исследовательских лабораторий и презентаций на AI-конференциях. Но на самом деле они уже работают...

Правит картинки силой слов: редактор изображений от Сбера с попиксельной точностью
Эпоха умного редактирования изображений наступила: ChatGPT, Gemini и Grok — крупнейшие игроки мировой AI-арены — один за другим представили...

VLM против вмятин: Как нейросети оценивают повреждения авто по фото
Когда вы смотрите на фотографию автомобиля с помятым бампером, то вы сразу понимаете, что скорее всего случилось. А может ли также "понять"...

Как мы разработали LLM-модель, которая генерирует описания товаров для пользователей Авито
Привет! Я Сергей Кляхандлер, senior DS-инженер в команде LLM Авито. В статье рассказываю, как мы разработали ML-модель, которая автоматически...