Новости по тегу "bench"

Подборка публикаций, содержащих тег "bench". Актуальные темы и важные события.

Нет изображения

Function splitting и чистый код

Сложная и тяжелая статья с непропорционально простым выводом. Вспомним фон Неймана, затронем процессорный кеш, поговорим про регистры и...

11.06.2025 10:34
5
Нет изображения

Benchmark — разрушитель LLM'ок, или Как мы собрали свой мультиязычный SWE-Bench

В статье представлено многоязычное расширение SWE-Bench от команды Doubletapp — бенчмарка для оценки больших языковых моделей (LLM) на реальных...

07.06.2025 11:17
4
Нет изображения

Внутристраничная очистка в индексах PostgreSQL

Внутристраничная очистка (HOT cleanup) – это оптимизация, благодаря которой старые версии строк могут эффективно удаляться из блоков таблиц....

06.06.2025 13:46
6
Нет изображения

Работа с длинными строками в PostgreSQL

Если в таблицах БД PostgreSQL есть поля большого размера, при выгрузке часть строк таких таблиц может не выгружаться с выдачей ошибки ERROR: out...

23.05.2025 14:29
11
Нет изображения

Vending-Bench: бенчмарк, из-за которого языковые модели впадают в экзистенциальный ужас и пишут жалобы ФБР

Бенчмарк Vending-Bench шведского стартапа Andon Labs — это тест для больших языковых моделей, проверяющий их способность к долгосрочному...

28.04.2025 09:48
15
Нет изображения

Как мы собираем SWE-bench на других языках

Современная разработка ПО — это плавильный котел языков: Java, C#, JS/TS, Go, Kotlin… список можно продолжать. Но когда дело доходит до оценки...

15.04.2025 19:08
18