Новости по тегу: bench

ИИ

Модель Claude Opus 4.5 от Anthropic превзошла GPT-5.1 Codex Max в ряде тестов

Компания Anthropic представила новую модель искусственного интеллекта Claude...

25.11.2025 14:00

20

0

Новости bench - актуальные события на Toplenta

Технологии

А кто у вас отвечает за kube-api? Безопасность Kubernetes при помощи CIS Benchmark

Kubernetes в IT-инфраструктуре — это не просто про удобство деплоя. Это...

06.11.2025 08:00

27

0

Общество

Строка из чисел

Популярная задача — определить, состоит ли строка только из числовых символов....

07.08.2025 07:14

49

0

Общество

Выжимаем максимум из Postgres на RTABench Q0

Время от времени приходится слышать мнение, что Postgres никуда не годится для...

01.08.2025 08:11

46

0

Культура

[Перевод] Обработка асинхронных операций с Flowable: Бенчмарки производительности

Когда речь заходит о производительности BPM-ldb;rf, главным показателем...

15.07.2025 06:03

55

0

ИИ

От промтов к агентам: как мы дошли до трансформеров, что LLM умеют уже сейчас и что нас ждёт в 2027 году

Привет! Меня зовут Александр Фролов, я data scientist отдела машинного обучения...

11.07.2025 07:45

58

0

Технологии

Гайд: как не дать сайту упасть в сезон

Компании уделяют много внимания внешнему виду сайта и его юзабилити. Это...

07.07.2025 15:33

62

0

ИИ

POLLUX: оценка генеративных способностей моделей для русского языка

Обычно мы оцениваем способности больших языковых моделей через бенчмарки вроде...

30.06.2025 13:04

53

0

ИИ

Project Vend: может ли языковая модель продавать чипсы и вольфрам?

В феврале этого года стартап исследования рисков искусственного интеллекта...

29.06.2025 08:57

71

0

Технологии

[Перевод] Анатомия неудачного микробенчмарка

В новом переводе от команды Spring АйО подробно разбираются концептуальные,...

28.06.2025 13:29

72

0

Политика

Суров закон, но он закон: как мы собрали RuTaR — датасет для оценки reasoning-систем в сфере налогового права

Этот пост для нашего тг-канала Pro AI написал мой коллега Александр Мигаль,...

28.06.2025 10:41

61

0

ИИ

Эффективный инференс множества LoRA адаптеров

LoRA — популярный метод дообучения больших моделей на небольших датасетах,...

27.06.2025 08:19

64

0

Новости по тегу "bench"

Модель Claude Opus 4.5 от Anthropic превзошла GPT-5.1 Codex Max в ряде тестов

А кто у вас отвечает за kube-api? Безопасность Kubernetes при помощи CIS Benchmark

Строка из чисел

Выжимаем максимум из Postgres на RTABench Q0

[Перевод] Обработка асинхронных операций с Flowable: Бенчмарки производительности

От промтов к агентам: как мы дошли до трансформеров, что LLM умеют уже сейчас и что нас ждёт в 2027 году

Гайд: как не дать сайту упасть в сезон

POLLUX: оценка генеративных способностей моделей для русского языка

Project Vend: может ли языковая модель продавать чипсы и вольфрам?

[Перевод] Анатомия неудачного микробенчмарка

Суров закон, но он закон: как мы собрали RuTaR — датасет для оценки reasoning-систем в сфере налогового права

Эффективный инференс множества LoRA адаптеров

Фильтры и сортировка