Новости по тегу "бенчмарк"
Подборка публикаций, содержащих тег "бенчмарк". Актуальные темы и важные события.

Grok 4 — самая умная модель? Обзор новой нейросети от Илона Маска
В июле этого года Илон Маск и команда xAI выпустили Grok 4 — свою новую «самую умную модель в мире».Компания называет Grok 4 флагманской моделью с...

Бенчмарки и метрики сравнения с продуктами-конкурентами как инструменты повышения качества приложения
Привет, Хабр. Я всё тот же разработчик, приложения для поиска и сравнения цен по маркетплейсам, интернет‑магазинам и классифайдам.В прошлый раз я...

Data Lake 2.0: Iceberg и Parquet в бою за миллисекунды
Привет, Хабр! Меня зовут Валерий Бабушкин, я CDO МТС Web Services. Если достаточно много занимаешься машинным обучением, то однажды начинаешь...

Пеликаны, сарказм и логические игры: забавные LLM-бенчмарки
Новые нейронки появляются чуть ли не еженедельно и каждая борется за первенство в лидербордах. Но есть и другой способ оценить их — например, с...

Топ LLM для задач text‑to‑SQL: результаты теста DeepSeek R1-0528, Gemini 2.5 Pro, o3 (и ещё трёх моделей)
В первой части мы разобрали теорию text‑to‑SQL: как LLM заменяют разработчиков, почему RAG и CoT спасают от галлюцинаций и зачем Scale AI...

Нельзя просто так взять и выбрать Any() или Count для проверки коллекции
Сравнивая различный code-style в проектах, я упоминал про методы проверки коллекций на наличие элементов. Самые очевидные способы – это...

[Перевод] На сколько же медленнее произвольный доступ на самом деле?
Как вы, наверно, знаете, из-за наличия в компьютере различных кэшей (L1, L2, L3...) и того, что операции с памятью выполняются с линиями кэша...

Что умеет RTX 4090 в 2025 году и как ее использовать для облачного рендеринга анимаций
RTX™ 4090 — не новинка, но одна из самых сбалансированных карт по цене и производительности. Под катом — не просто обзор железа. Показываем, как...

SLAVA — бенчмарк социально‑политического ландшафта и ценностного анализа
Большой обзор: от идеи и структуры — до неожиданных выводов и практических сценариев применения SLAVA — это открытый русскоязычный бенчмарк,...

ChatGPT o3 Pro: новый флагман OpenAI или маркетинговый ход? Разбираемся
OpenAI снова удивляет: новая модель ChatGPT o3 Pro обещает революцию в аналитике, науке и разработке. Но так ли она хороша? Читайте разбор...

ChatGPT o1 pro: Обзор бенчмарков и тест модели
Доброго времени суток, «Хабр»!Сегодня мы детально разберём, протестируем и раскроем все секреты языковой модели от OpenAI — ChatGPT‑o1 Pro. Первая...

Кто быстрее? Тестируем скорость языков программирования на Эльбрусе
Приветствую! Я разработчик в компании НИЦ ЦТ. Мы разрабатываем операционную систему, адаптированную под российские процессоры Эльбрус. Процессоры...