Тег: бенчмарк

Grok 4 — самая умная модель? Обзор новой нейросети от Илона Маска

В июле этого года Илон Маск и команда xAI выпустили Grok 4 — свою новую «самую умную модель в мире».Компания называет Grok 4 флагманской моделью с...

21.07.2025 16:00

5

0

Бенчмарки и метрики сравнения с продуктами-конкурентами как инструменты повышения качества приложения

Привет, Хабр. Я всё тот же разработчик, приложения для поиска и сравнения цен по маркетплейсам, интернет‑магазинам и классифайдам.В прошлый раз я...

19.07.2025 13:16

8

0

Data Lake 2.0: Iceberg и Parquet в бою за миллисекунды

Привет, Хабр! Меня зовут Валерий Бабушкин, я CDO МТС Web Services. Если достаточно много занимаешься машинным обучением, то однажды начинаешь...

17.07.2025 07:00

11

0

Пеликаны, сарказм и логические игры: забавные LLM-бенчмарки

Новые нейронки появляются чуть ли не еженедельно и каждая борется за первенство в лидербордах. Но есть и другой способ оценить их — например, с...

13.07.2025 13:30

8

0

Топ LLM для задач text‑to‑SQL: результаты теста DeepSeek R1-0528, Gemini 2.5 Pro, o3 (и ещё трёх моделей)

В первой части мы разобрали теорию text‑to‑SQL: как LLM заменяют разработчиков, почему RAG и CoT спасают от галлюцинаций и зачем Scale AI...

07.07.2025 15:22

9

0

Нельзя просто так взять и выбрать Any() или Count для проверки коллекции

Сравнивая различный code-style в проектах, я упоминал про методы проверки коллекций на наличие элементов. Самые очевидные способы – это...

02.07.2025 04:34

14

0

[Перевод] На сколько же медленнее произвольный доступ на самом деле?

Как вы, наверно, знаете, из-за наличия в компьютере различных кэшей (L1, L2, L3...) и того, что операции с памятью выполняются с линиями кэша...

28.06.2025 08:50

14

0

Что умеет RTX 4090 в 2025 году и как ее использовать для облачного рендеринга анимаций

RTX™ 4090 — не новинка, но одна из самых сбалансированных карт по цене и производительности. Под катом — не просто обзор железа. Показываем, как...

19.06.2025 08:51

18

0

SLAVA — бенчмарк социально‑политического ландшафта и ценностного анализа

Большой обзор: от идеи и структуры — до неожиданных выводов и практических сценариев применения SLAVA — это открытый русскоязычный бенчмарк,...

17.06.2025 13:56

14

0

ChatGPT o3 Pro: новый флагман OpenAI или маркетинговый ход? Разбираемся

OpenAI снова удивляет: новая модель ChatGPT o3 Pro обещает революцию в аналитике, науке и разработке. Но так ли она хороша? Читайте разбор...

16.06.2025 08:12

13

0

ChatGPT o1 pro: Обзор бенчмарков и тест модели

Доброго времени суток, «Хабр»!Сегодня мы детально разберём, протестируем и раскроем все секреты языковой модели от OpenAI — ChatGPT‑o1 Pro. Первая...

12.06.2025 10:34

15

0

Кто быстрее? Тестируем скорость языков программирования на Эльбрусе

Приветствую! Я разработчик в компании НИЦ ЦТ. Мы разрабатываем операционную систему, адаптированную под российские процессоры Эльбрус. Процессоры...

11.06.2025 18:46

16

0

Новости по тегу "бенчмарк"