Животные

Когда данные говорят на разных языках: как LongCat-Flash-Omni объединяет текст, звук и видео

Автор: Денис Аветисян

Очередной "прорыв", конечно. 560 миллиардов параметров, "синергия модальностей", "реверс-инжиниринг реальности"... Знакомая песня. Как будто кто-то снова решил, что если сложить достаточно много кирпичиков, то получим не только стену, но и осознание бытия.

Впрочем, гибридный параллелизм и потоковая предварительная загрузка – это, безусловно, приятно. Как хорошо отлаженный "Запорожец" на автобане – вроде и не гонка, но едет, и даже довольно бодро. Главное, вовремя смазать.

Вопрос, как всегда, в интерпретации. Машина "понимает" или "имитирует"? Да какая разница, если результат устраивает? Главное, чтобы "Запорожец" доехал до пункта назначения, а там уж пусть сам разбирается, что он там увидел.

И да, очередной Human-in-the-Loop. А как иначе? Все эти "нейронные сети" – это просто очень сложные способы делегировать скучную работу человеку. Просто теперь он делает вид, что это машина работает.

🤔

Фильтры и сортировка