Тег: бенчмарк

Бенчмарк качества распознавания речи (ASR) в телефонии: как мы сравниваемся с Whisper, GigaAM и T-One

Привет! Распознаванием речи (ASR) уже никого не удивишь, но качественное распознавание на разговорном русском языке, а особенно в телефонии —...

19.08.2025 06:13

33

0

ChatGPT 5 вышел! Что нового, бенчмарки и как получить доступ из России

В четверг, 7 августа, в 20:00 по мск состоялось долгожданное событие в мире ИИ — OpenAI представила ChatGPT 5. В этой статье я собрал всю важную...

08.08.2025 12:58

33

0

Битрикс24 бенчмарк для оценки LLM

Картинка сгенерированая по запросу "сгенерируй картинку про битрикс24 и искусственный интеллект" неплохо отражает итоговые результаты Читать далее

30.07.2025 08:00

22

0

Grok 4 — самая умная модель? Обзор новой нейросети от Илона Маска

В июле этого года Илон Маск и команда xAI выпустили Grok 4 — свою новую «самую умную модель в мире».Компания называет Grok 4 флагманской моделью с...

21.07.2025 16:00

25

0

Бенчмарки и метрики сравнения с продуктами-конкурентами как инструменты повышения качества приложения

Привет, Хабр. Я всё тот же разработчик, приложения для поиска и сравнения цен по маркетплейсам, интернет‑магазинам и классифайдам.В прошлый раз я...

19.07.2025 13:16

34

0

Data Lake 2.0: Iceberg и Parquet в бою за миллисекунды

Привет, Хабр! Меня зовут Валерий Бабушкин, я CDO МТС Web Services. Если достаточно много занимаешься машинным обучением, то однажды начинаешь...

17.07.2025 07:00

29

0

Пеликаны, сарказм и логические игры: забавные LLM-бенчмарки

Новые нейронки появляются чуть ли не еженедельно и каждая борется за первенство в лидербордах. Но есть и другой способ оценить их — например, с...

13.07.2025 13:30

28

0

Топ LLM для задач text‑to‑SQL: результаты теста DeepSeek R1-0528, Gemini 2.5 Pro, o3 (и ещё трёх моделей)

В первой части мы разобрали теорию text‑to‑SQL: как LLM заменяют разработчиков, почему RAG и CoT спасают от галлюцинаций и зачем Scale AI...

07.07.2025 15:22

30

0

Нельзя просто так взять и выбрать Any() или Count для проверки коллекции

Сравнивая различный code-style в проектах, я упоминал про методы проверки коллекций на наличие элементов. Самые очевидные способы – это...

02.07.2025 04:34

35

0

[Перевод] На сколько же медленнее произвольный доступ на самом деле?

Как вы, наверно, знаете, из-за наличия в компьютере различных кэшей (L1, L2, L3...) и того, что операции с памятью выполняются с линиями кэша...

28.06.2025 08:50

34

0

Что умеет RTX 4090 в 2025 году и как ее использовать для облачного рендеринга анимаций

RTX™ 4090 — не новинка, но одна из самых сбалансированных карт по цене и производительности. Под катом — не просто обзор железа. Показываем, как...

19.06.2025 08:51

38

0

SLAVA — бенчмарк социально‑политического ландшафта и ценностного анализа

Большой обзор: от идеи и структуры — до неожиданных выводов и практических сценариев применения SLAVA — это открытый русскоязычный бенчмарк,...

17.06.2025 13:56

33

0

Новости по тегу "бенчмарк"