Новости по тегу "мультимодальные модели"

Подборка публикаций, содержащих тег "мультимодальные модели". Актуальные темы и важные события.

Нет изображения

Realtime API вышел из беты: OpenAI представила gpt-realtime и снизила цены на 20%

OpenAI сделала важный шаг для рынка голосовых интерфейсов: Realtime API официально вышел из бета-версии и теперь доступен всем разработчикам....

29.08.2025 06:31
14
Нет изображения

Как мы строили KidFolio — цифровую платформу для родителей и детских садов

Массовые фото из детского сада в родительских чатах редко бывают персональными: на десятках снимков сложно найти именно своего ребенка. Выпускники...

09.07.2025 11:00
22
Нет изображения

Жестовый язык: похожее в непохожем и наоборот

Привет, Хабр! Наша команда RnD CV продолжает приближать момент, когда компьютер по видео сможет распознавать жестовый язык (ЖЯ) глухих так же...

19.06.2025 11:06
28
Нет изображения

Мультимодальные LLM: ключик к AGI или зачем бизнесу модели, которые видят, слышат и понимают?

Мультимодальные модели — звучит как что-то для исследовательских лабораторий и презентаций на AI-конференциях. Но на самом деле они уже работают...

04.06.2025 09:13
40
Нет изображения

VLM против вмятин: Как нейросети оценивают повреждения авто по фото

Когда вы смотрите на фотографию автомобиля с помятым бампером, то вы сразу понимаете, что скорее всего случилось. А может ли также "понять"...

21.05.2025 10:44
37
Нет изображения

Как мы разработали LLM-модель, которая генерирует описания товаров для пользователей Авито

Привет! Я Сергей Кляхандлер, senior DS-инженер в команде LLM Авито. В статье рассказываю, как мы разработали ML-модель, которая автоматически...

02.05.2025 15:18
44