Новости по тегу "аудио"
Подборка публикаций, содержащих тег "аудио". Актуальные темы и важные события.

Транскрипция речи. Офлайн и без ограничений
Привет, Хабр!Меня зовут Алексей Рудак, я основатель компании Lingvanex. Более 8 лет мы делаем перевод и распознавание речи удобными, быстрыми и...

Как телеграм-каналы похоронят новостное радио
Да, теперь телеграм-каналы можно слушать. В дороге, на тренировке, вместе с другими делами. И без ИИ здесь, конечно же, не обошлось. Читать далее

Мультимодальные LLM: ключик к AGI или зачем бизнесу модели, которые видят, слышат и понимают?
Мультимодальные модели — звучит как что-то для исследовательских лабораторий и презентаций на AI-конференциях. Но на самом деле они уже работают...

Новый вид контента: ИИллюстрированная аудиокнига
Недавно мне пришла в голову идея написать приложение для автоматической генерации иллюстраций к аудиокнигам. Видео-модели пока не умеют создавать...

Вас к тефифону! История удивительного и необычного аудио-проигрывателя
В мире аудиоэлектроники существовало великое множество необычных девайсов: радио в виде пепельницы, магнитофоны на магнитных дисках и даже...

[Перевод] Для чего я написал собственный аудиопроигрыватель
Как и у многих, у меня накопилось слишком много подписок: некоторые у Apple (iCloud, Apple Music), другие потерялись на разных платформах...

PCI-аудиокарта Creative E-MU 0404: история появления винтажного девайса и его возможности
Если 25 лет назад мне бы сказали слово Creative, то я бы автоматически ответил Sound Blaster. Эти карты де-факто стали стандартом для геймеров еще...

ТОП-5 нейросетей для транскрибации аудио в текст (часть 2)
В первой части мы проверили три сервиса: AssemblyAI, Riverside и Teamlogs. Все они пообещали точную и быструю транскрибацию, но на деле…Первый...

На входе аудио, на выходе — саммари. Собираем локальный транскрибатор из бесплатного софта
Однажды я устал расшифровывать аудио пачкой инструментов в духе «Балерино-Капучино и Бобрито-Бандито» и решил собрать свой пайплайн.В статье...

ТОП-5 нейросетей для транскрибации аудио в текст (часть 1)
Сегодня нас не удивишь тем, что нейросеть за пару секунд расшифровывает двухчасовую лекцию или превращает аудиозаметку в аккуратный текст с...

[Перевод] Конвертер звука: незаменимый девайс для набора AV-устройств
Pro Convert от Magewell - это новая линейка недорогих и надежных конвертеров, на которые ориентируются специалисты в области аудио- и телевещания,...

Обработка аудио на ESP32
В этой статье я хочу поделиться своим опытом портирования проекта распознавания музыкальных жанров аудиозаписей на ESP32-C3. Исходный проект взят...