Новости по тегу "аудио"
Подборка публикаций, содержащих тег "аудио". Актуальные темы и важные события.

ПФКИ поддержит создание 1000 музыкальных произведений для молодежи до конца 2025 года
Президентский фонд культурных инициатив (ПФКИ) в рамках специального конкурса планирует поддержать создание около 600 музыкальных композиций и 400...

О кинематографе и потребительском праве, оригинальности продукта, формате видеоматериала
Здавствуйте. Начну с того, что вчера встретился с старым приятелем и мы смотрели достаточно интересный фильм, после которого у нас произошёл...

Виртуальный рассказчик 2.0: эволюция нейросетевого рассказчика в Яндекс Книгах
Примерно год назад мы запустили виртуального рассказчика в Яндекс Книгах. Он хорошо решал задачу чтения книг вслух без предзаписанных аудиоверсий,...

Топ-5 бесплатных нейросетей для транскрибации: лучшие сервисы для перевода аудио в текст
Нас давно не удивишь тем, что нейросеть за пару секунд расшифровывает двухчасовую лекцию или превращает аудиозаметку в аккуратный текст с...

[Перевод] Разработка 3D-аудиовизуализатора с помощью Three.js, GSAP и Web Audio API
Визуализатор звука, в котором светящийся 3D-шар пульсирует и меняет цвет в такт музыке, а перетаскиваемые панели GSAP плавно перемещаются вокруг...

Использование ffmpeg в n8n
Обычно, когда речь заходит про автоматизацию с n8n, мы представляем что-то простое: формы, письма, таблички, API-запросы. И все довольно удобно —...

Почему так дорого? Сколько стоит переговорная с ВКС в 2025 году
Спецификации на переговорные, с которыми заказчики приходят за вторым мнением, — любимый жанр наших инженеров. Да, вопросы «как сделать это...

Транскрипция речи. Офлайн и без ограничений
Привет, Хабр!Меня зовут Алексей Рудак, я основатель компании Lingvanex. Более 8 лет мы делаем перевод и распознавание речи удобными, быстрыми и...

Как телеграм-каналы похоронят новостное радио
Да, теперь телеграм-каналы можно слушать. В дороге, на тренировке, вместе с другими делами. И без ИИ здесь, конечно же, не обошлось. Читать далее

Мультимодальные LLM: ключик к AGI или зачем бизнесу модели, которые видят, слышат и понимают?
Мультимодальные модели — звучит как что-то для исследовательских лабораторий и презентаций на AI-конференциях. Но на самом деле они уже работают...

Новый вид контента: ИИллюстрированная аудиокнига
Недавно мне пришла в голову идея написать приложение для автоматической генерации иллюстраций к аудиокнигам. Видео-модели пока не умеют создавать...

Вас к тефифону! История удивительного и необычного аудио-проигрывателя
В мире аудиоэлектроники существовало великое множество необычных девайсов: радио в виде пепельницы, магнитофоны на магнитных дисках и даже...