Новости по тегу "ML4se"
Подборка публикаций, содержащих тег "ML4se". Актуальные темы и важные события.

Benchmark — разрушитель LLM'ок, или Как мы собрали свой мультиязычный SWE-Bench
В статье представлено многоязычное расширение SWE-Bench от команды Doubletapp — бенчмарка для оценки больших языковых моделей (LLM) на реальных...