Новости по тегу "распознавание"
Подборка публикаций, содержащих тег "распознавание". Актуальные темы и важные события.

Realtime API вышел из беты: OpenAI представила gpt-realtime и снизила цены на 20%
OpenAI сделала важный шаг для рынка голосовых интерфейсов: Realtime API официально вышел из бета-версии и теперь доступен всем разработчикам....

Обучаем GigaAM-Emo распознавать ещё больше эмоций
Модель распознавания эмоций в речи GigaAM-Emo умеет классифицировать 4 эмоции: angry, sad, neutral, positive. Для некоторых задач бывает не...

Бенчмарк качества распознавания речи (ASR) в телефонии: как мы сравниваемся с Whisper, GigaAM и T-One
Привет! Распознаванием речи (ASR) уже никого не удивишь, но качественное распознавание на разговорном русском языке, а особенно в телефонии —...

Есть ли жизнь без споттера? Как мы внедряли быстрые команды в умные устройства Sber
Привет, Хабр! Меня зовут Айрат, я руковожу командой Embedded ML в Сбере. Сегодня мы выкатили быстрые команды для умных колонок SberBoom. Они...

Голос клиента на автомате: разбираем, как анализировать звонки с помощью речевой аналитики и LLM
Привет, Хабр! Это Катя Саяпина, менеджер продукта МТС Exolve.Самую честную обратную связь бизнес получает не из опросов, а из живых разговоров —...

Scribe: Управляем ПК голосом. Бесплатно, оффлайн и с открытым кодом
Всем привет!Многие знают, что в Windows есть встроенная функция «Распознавание речи», а в новых версиях — «Голосовой ввод» (Win + H). Это неплохие...

Как мы построили embedding-модель уха на Vision Transformers: от идеи до 88% точности
Пока весь мир гонится за распознаванием лиц и отпечатков пальцев, мы в решили взглянуть на человека чуть сбоку — буквально. Пришел клиент, принес...

Как мы строили KidFolio — цифровую платформу для родителей и детских садов
Массовые фото из детского сада в родительских чатах редко бывают персональными: на десятках снимков сложно найти именно своего ребенка. Выпускники...

Эмпатичный ИИ: как трансформеры учатся распознавать эмоции в разговорах
В эпоху чат-ботов и голосовых помощников ИИ всё чаще становится собеседником человека. Но чтобы стать по-настоящему полезным в коммуникации, он...

Как мы научили нейросети читать паспорта: история борьбы с бликами, водяными знаками и кривыми фото
Привет, Хабр! Если вы когда-либо сталкивались с автоматическим распознаванием документов, то знаете, насколько сложно работать с документами...

NAVIS — многоцелевой быстросборный беспилотный катамаран
Создание быстросборного маломерного беспилотного судна с возможностью быстрой интеграции различных полезных нагрузок для решения задач на воде и...

Это камень? Это ветка? Это нос! Разбираем подходы, помогающие ИИ распознавать лица на картинках с низким разрешением
Привет, Хабр! Мы – Даниил Соловьев и Михаил Никитин из команды направления распознавания лиц. Сегодня фокусируемся на задаче распознавания лиц на...