Новости по тегу "бенчмарк"
Подборка публикаций, содержащих тег "бенчмарк". Актуальные темы и важные события.

Бенчмарк качества распознавания речи (ASR) в телефонии: как мы сравниваемся с Whisper, GigaAM и T-One
Привет! Распознаванием речи (ASR) уже никого не удивишь, но качественное распознавание на разговорном русском языке, а особенно в телефонии —...

ChatGPT 5 вышел! Что нового, бенчмарки и как получить доступ из России
В четверг, 7 августа, в 20:00 по мск состоялось долгожданное событие в мире ИИ — OpenAI представила ChatGPT 5. В этой статье я собрал всю важную...

Битрикс24 бенчмарк для оценки LLM
Картинка сгенерированая по запросу "сгенерируй картинку про битрикс24 и искусственный интеллект" неплохо отражает итоговые результаты Читать далее

Grok 4 — самая умная модель? Обзор новой нейросети от Илона Маска
В июле этого года Илон Маск и команда xAI выпустили Grok 4 — свою новую «самую умную модель в мире».Компания называет Grok 4 флагманской моделью с...

Бенчмарки и метрики сравнения с продуктами-конкурентами как инструменты повышения качества приложения
Привет, Хабр. Я всё тот же разработчик, приложения для поиска и сравнения цен по маркетплейсам, интернет‑магазинам и классифайдам.В прошлый раз я...

Data Lake 2.0: Iceberg и Parquet в бою за миллисекунды
Привет, Хабр! Меня зовут Валерий Бабушкин, я CDO МТС Web Services. Если достаточно много занимаешься машинным обучением, то однажды начинаешь...

Пеликаны, сарказм и логические игры: забавные LLM-бенчмарки
Новые нейронки появляются чуть ли не еженедельно и каждая борется за первенство в лидербордах. Но есть и другой способ оценить их — например, с...

Топ LLM для задач text‑to‑SQL: результаты теста DeepSeek R1-0528, Gemini 2.5 Pro, o3 (и ещё трёх моделей)
В первой части мы разобрали теорию text‑to‑SQL: как LLM заменяют разработчиков, почему RAG и CoT спасают от галлюцинаций и зачем Scale AI...

Нельзя просто так взять и выбрать Any() или Count для проверки коллекции
Сравнивая различный code-style в проектах, я упоминал про методы проверки коллекций на наличие элементов. Самые очевидные способы – это...

[Перевод] На сколько же медленнее произвольный доступ на самом деле?
Как вы, наверно, знаете, из-за наличия в компьютере различных кэшей (L1, L2, L3...) и того, что операции с памятью выполняются с линиями кэша...

Что умеет RTX 4090 в 2025 году и как ее использовать для облачного рендеринга анимаций
RTX™ 4090 — не новинка, но одна из самых сбалансированных карт по цене и производительности. Под катом — не просто обзор железа. Показываем, как...

SLAVA — бенчмарк социально‑политического ландшафта и ценностного анализа
Большой обзор: от идеи и структуры — до неожиданных выводов и практических сценариев применения SLAVA — это открытый русскоязычный бенчмарк,...