Новости по тегу "аудио"
Подборка публикаций, содержащих тег "аудио". Актуальные темы и важные события.
ПФКИ поддержит создание 1000 музыкальных произведений для молодежи до конца 2025 года
Президентский фонд культурных инициатив (ПФКИ) в рамках специального конкурса планирует поддержать создание около 600 музыкальных композиций и 400...
О кинематографе и потребительском праве, оригинальности продукта, формате видеоматериала
Здавствуйте. Начну с того, что вчера встретился с старым приятелем и мы смотрели достаточно интересный фильм, после которого у нас произошёл...
Виртуальный рассказчик 2.0: эволюция нейросетевого рассказчика в Яндекс Книгах
Примерно год назад мы запустили виртуального рассказчика в Яндекс Книгах. Он хорошо решал задачу чтения книг вслух без предзаписанных аудиоверсий,...
Топ-5 бесплатных нейросетей для транскрибации: лучшие сервисы для перевода аудио в текст
Нас давно не удивишь тем, что нейросеть за пару секунд расшифровывает двухчасовую лекцию или превращает аудиозаметку в аккуратный текст с...
[Перевод] Разработка 3D-аудиовизуализатора с помощью Three.js, GSAP и Web Audio API
Визуализатор звука, в котором светящийся 3D-шар пульсирует и меняет цвет в такт музыке, а перетаскиваемые панели GSAP плавно перемещаются вокруг...
Использование ffmpeg в n8n
Обычно, когда речь заходит про автоматизацию с n8n, мы представляем что-то простое: формы, письма, таблички, API-запросы. И все довольно удобно —...
Почему так дорого? Сколько стоит переговорная с ВКС в 2025 году
Спецификации на переговорные, с которыми заказчики приходят за вторым мнением, — любимый жанр наших инженеров. Да, вопросы «как сделать это...
Транскрипция речи. Офлайн и без ограничений
Привет, Хабр!Меня зовут Алексей Рудак, я основатель компании Lingvanex. Более 8 лет мы делаем перевод и распознавание речи удобными, быстрыми и...
Как телеграм-каналы похоронят новостное радио
Да, теперь телеграм-каналы можно слушать. В дороге, на тренировке, вместе с другими делами. И без ИИ здесь, конечно же, не обошлось. Читать далее
Мультимодальные LLM: ключик к AGI или зачем бизнесу модели, которые видят, слышат и понимают?
Мультимодальные модели — звучит как что-то для исследовательских лабораторий и презентаций на AI-конференциях. Но на самом деле они уже работают...
Новый вид контента: ИИллюстрированная аудиокнига
Недавно мне пришла в голову идея написать приложение для автоматической генерации иллюстраций к аудиокнигам. Видео-модели пока не умеют создавать...
Вас к тефифону! История удивительного и необычного аудио-проигрывателя
В мире аудиоэлектроники существовало великое множество необычных девайсов: радио в виде пепельницы, магнитофоны на магнитных дисках и даже...