Новости по тегу "бенчмарки"
Подборка публикаций, содержащих тег "бенчмарки". Актуальные темы и важные события.

Grok 4 — самая умная модель? Обзор новой нейросети от Илона Маска
В июле этого года Илон Маск и команда xAI выпустили Grok 4 — свою новую «самую умную модель в мире».Компания называет Grok 4 флагманской моделью с...

Бенчмарки и метрики сравнения с продуктами-конкурентами как инструменты повышения качества приложения
Привет, Хабр. Я всё тот же разработчик, приложения для поиска и сравнения цен по маркетплейсам, интернет‑магазинам и классифайдам.В прошлый раз я...

[Перевод] На сколько же медленнее произвольный доступ на самом деле?
Как вы, наверно, знаете, из-за наличия в компьютере различных кэшей (L1, L2, L3...) и того, что операции с памятью выполняются с линиями кэша...

Что умеет RTX 4090 в 2025 году и как ее использовать для облачного рендеринга анимаций
RTX™ 4090 — не новинка, но одна из самых сбалансированных карт по цене и производительности. Под катом — не просто обзор железа. Показываем, как...

ChatGPT o3 Pro: новый флагман OpenAI или маркетинговый ход? Разбираемся
OpenAI снова удивляет: новая модель ChatGPT o3 Pro обещает революцию в аналитике, науке и разработке. Но так ли она хороша? Читайте разбор...

ChatGPT o1 pro: Обзор бенчмарков и тест модели
Доброго времени суток, «Хабр»!Сегодня мы детально разберём, протестируем и раскроем все секреты языковой модели от OpenAI — ChatGPT‑o1 Pro. Первая...

Кто быстрее? Тестируем скорость языков программирования на Эльбрусе
Приветствую! Я разработчик в компании НИЦ ЦТ. Мы разрабатываем операционную систему, адаптированную под российские процессоры Эльбрус. Процессоры...

Почём ИИ для народа: протестировали платформу YADRO G4208P с восемью H100 NVL и RTX 4090 на десятке ИИ-моделей
Привет, Хабр! Меня зовут Артём Маклаев, вместе с командой я занимаюсь оценкой производительности серверных платформ для задач искусственного...

Тестирование производительности видеокарт на примере больших языковых моделей с использованием Llama.cpp
В последнее время большие языковые модели (LLM) становятся все более популярными, но для их эффективного запуска требуется значительная...

Зимняя школа RISC-V: измеряем латентность и пропускную способность, оптимизируем приложения на C#
Зимняя школа RISC-V — совместный проект YADRO и ведущих технических вузов России и Беларуси. В этом году зимняя школа прошла во второй раз: 12...

Leaderboard Illusion: что не так с Chatbot Arena
Опубликованная 29 апреля научная работа Leaderboard Illusion подставила под сомнение прозрачность и объективность рейтинговых механизмов Chatbot...

AI-агенты в реальном мире: почему они не работают и как это исправить
AI-агенты часто не оправдывают ожиданий при внедрении в реальные продукты. Разбираемся, почему сложно оценивать их эффективность, какие...