Новости по тегу "benchmarking"

Подборка публикаций, содержащих тег "benchmarking". Актуальные темы и важные события.

Нет изображения

POLLUX: оценка генеративных способностей моделей для русского языка

Обычно мы оцениваем способности больших языковых моделей через бенчмарки вроде MMLU, RussianSuperGlue или первых версий MERA, которые напоминают...

30.06.2025 13:04
2
Нет изображения

[Перевод] Анатомия неудачного микробенчмарка

В новом переводе от команды Spring АйО подробно разбираются концептуальные, методологические и технические ошибки, на которые легко наткнуться при...

28.06.2025 13:29
3