Сегодня нас не удивишь тем, что нейросеть за пару секунд расшифровывает двухчасовую лекцию или превращает аудиозаметку в аккуратный текст с заголовками и абзацами. Мы живём в эпоху, где слова больше не нужно набирать вручную — достаточно просто их произнести. Остальное — за алгоритмами.
Одно дело — стерильное студийное аудио, где диктор звучит как утренний ведущий на радио. Совсем другое — голосовое, записанное на фоне вентилятора и междометий в стиле «эээ… ну короче».
Так что мы решили не просто составить список транскрибаторов с сухими характеристиками. Мы пошли дальше — устроили испытание! Взяли 5 популярных нейросетей и заставили их пройти 3 уровня сложности.
Обзор вышел объёмным, поэтому мы разбили его на две части. В первой расскажем про три сервиса. Во второй — про оставшиеся два, а ещё попробуем выбрать лучших.
Приятного Вам прочтения!
Читать далее