Новости по тегу "распознавание"

Подборка публикаций, содержащих тег "распознавание". Актуальные темы и важные события.

Нет изображения

Realtime API вышел из беты: OpenAI представила gpt-realtime и снизила цены на 20%

OpenAI сделала важный шаг для рынка голосовых интерфейсов: Realtime API официально вышел из бета-версии и теперь доступен всем разработчикам....

29.08.2025 06:31
10
Нет изображения

Обучаем GigaAM-Emo распознавать ещё больше эмоций

Модель распознавания эмоций в речи GigaAM-Emo умеет классифицировать 4 эмоции: angry, sad, neutral, positive. Для некоторых задач бывает не...

26.08.2025 08:00
9
Нет изображения

Бенчмарк качества распознавания речи (ASR) в телефонии: как мы сравниваемся с Whisper, GigaAM и T-One

Привет! Распознаванием речи (ASR) уже никого не удивишь, но качественное распознавание на разговорном русском языке, а особенно в телефонии —...

19.08.2025 06:13
15
Нет изображения

Есть ли жизнь без споттера? Как мы внедряли быстрые команды в умные устройства Sber

Привет, Хабр! Меня зовут Айрат, я руковожу командой Embedded ML в Сбере. Сегодня мы выкатили быстрые команды для умных колонок SberBoom. Они...

14.08.2025 08:32
14
Нет изображения

Голос клиента на автомате: разбираем, как анализировать звонки с помощью речевой аналитики и LLM

Привет, Хабр! Это Катя Саяпина, менеджер продукта МТС Exolve.Самую честную обратную связь бизнес получает не из опросов, а из живых разговоров —...

13.08.2025 11:50
12
Нет изображения

Scribe: Управляем ПК голосом. Бесплатно, оффлайн и с открытым кодом

Всем привет!Многие знают, что в Windows есть встроенная функция «Распознавание речи», а в новых версиях — «Голосовой ввод» (Win + H). Это неплохие...

04.08.2025 17:16
15
Нет изображения

Как мы построили embedding-модель уха на Vision Transformers: от идеи до 88% точности

Пока весь мир гонится за распознаванием лиц и отпечатков пальцев, мы в решили взглянуть на человека чуть сбоку — буквально. Пришел клиент, принес...

25.07.2025 10:57
21
Нет изображения

Как мы строили KidFolio — цифровую платформу для родителей и детских садов

Массовые фото из детского сада в родительских чатах редко бывают персональными: на десятках снимков сложно найти именно своего ребенка. Выпускники...

09.07.2025 11:00
17
Нет изображения

Эмпатичный ИИ: как трансформеры учатся распознавать эмоции в разговорах

В эпоху чат-ботов и голосовых помощников ИИ всё чаще становится собеседником человека. Но чтобы стать по-настоящему полезным в коммуникации, он...

09.07.2025 10:24
23
Нет изображения

NAVIS — многоцелевой быстросборный беспилотный катамаран

Создание быстросборного маломерного беспилотного судна с возможностью быстрой интеграции различных полезных нагрузок для решения задач на воде и...

27.06.2025 17:15
29