ИИ

Ускорение DeepSeek-R1 с подвохом: Когда токены в секунду врут о реальной скорости

Токены летят быстрее, а результат — медленнее: парадокс квантизации DeepSeek-R1. Замеры 4 версий модели доказали: уменьшение размера ускоряет генерацию отдельных токенов, но что происходит с общим временем ответа?

18.06.2025 07:44

ИИ

Источник: Все публикации подряд на Хабре

Вернуться к ленте

Фильтры и сортировка