ИИ

Модель Claude Opus 4.5 от Anthropic превзошла GPT-5.1 Codex Max в ряде тестов

Модель Claude Opus 4.5 от Anthropic превзошла GPT-5.1 Codex Max в ряде тестов - актуальные новости по теме Искусственный интеллект на Toplenta

Краткое резюме

Компания Anthropic представила нейросеть Claude Opus 4.5, которая достигла результата в 80,9% на платформе SWE-bench Verified и обошла модели Gemini 3 Pro и GPT-5.1 Codex Max. Модель доступна на Android, iOS и через веб-сайт Claude.

Компания Anthropic представила новую модель искусственного интеллекта Claude Opus 4.5, назвав её лидером в области программирования и вычислительных задач. Система достигла результата в 80,9% на платформе SWE-bench Verified, обойдя ближайших соперников — Gemini 3 Pro и GPT-5.1 Codex Max. Модель можно загрузить на устройства с Android и iOS, а также использовать через веб-сайт Claude. Одной из ключевых особенностей Claude Opus 4.5 является то, что она первой преодолела порог в 80% на SWE-bench Verified. Для сравнения: у Google Gemini 3 Pro результат составил 76,2%, а у OpenAI GPT-5.1 Codex Max — 77,9%. Anthropic также сообщила, что Claude Opus 4.5 способна успешно справляться со сложным внутренним экзаменом, который компания применяет при отборе инженерного персонала. За два часа тестирования модель продемонстрировала более высокие результаты, чем любой человек, участвовавший в тестировании ранее. Это подтверждает её превосходство над даже самыми квалифицированными специалистами в ключевых технических областях. Claude Opus 4.5 обладает не только улучшенными возможностями в программировании, но и расширенными функциями в анализе данных, логике и математике. Модель эффективно справляется с широким спектром повседневных задач, включая углублённые исследования, анализ презентаций и работу с табличными данными. Разработчики отмечают её креативность в поиске решений, устойчивость к вредоносным запросам, оптимизацию использования ресурсов и внедрение нового параметра effort, который контролирует уровень детализации обработки информации. Стоимость Claude Opus 4.5 составляет $5 за миллион токенов на вход и $25 на выход, что составляет всего треть цены предшественника Claude Opus 4.1. Новая модель уже доступна в приложении Claude и через API.

Фильтры и сортировка