Хакеры из Китая использовали технологию искусственного интеллекта от Anthropic для автоматизации взлома крупных корпораций и иностранных правительств во время сентябрьской атаки на них, пишет The Wall Street Journal. Руководитель отдела анализа угроз Anthropic Джейкоб Кляйн рассказал, что специалисты компании по кибербезопасности столкнулись с невиданным ранее уровнем автоматизации атаки, направленной на десятки целей.
По словам Кляйна, от 80% до 90% атаки было автоматизировано — хакеры проводили свои атаки «буквально одним нажатием кнопки, с минимальным участием человека». Anthropic пресекла эти атаки и заблокировала аккаунты хакеров, но четыре вторжения хакеров увенчались успехом. В одном случае злоумышленники использовали инструменты ИИ-модели Claude от Anthropic для запроса внутренних баз данных и самостоятельного извлечения информации.
Люди вмешивались в процесс лишь в нескольких точках принятия решений, рассказал Кляйн. Автоматизация кибератак дает хакерам дополнительные возможности и скорость, отмечает WSJ. Компания заявила, что правительство США не пострадало, но отказалась комментировать, была ли какая-либо часть правительства одной из целей хакеров.
Anthropic заявила, что на основании цифровой инфраструктуры, которую использовали хакеры, а также других данных, она с уверенностью может утверждать, что атаки были совершены китайскими хакерами, поддерживаемыми государством. WSJ направила запрос представителю посольства Китая в Вашингтоне. Китай отрицает свою причастность к хакерским кампаниям.
Летом 2025 года компания по кибербезопасности Volexity обнаружила хакеров, поддерживаемых Китаем, которые используют инструменты ИИ для автоматизации хакерских кампаний против корпораций, исследовательских институтов и неправительственных агентств. По словам Стивена Адера, президента Volexity, хакеры использовали ИИ-модели (LLM), чтобы определить, на кого им следует нацелиться, как создавать свои фишинговые электронные письма и как писать вредоносное программное обеспечение для заражения устройств своих жертв. «Искусственный интеллект дает возможность субъекту угрозы делать больше и быстрее», - сказал Адер.
Хакеры часто используют инструменты ИИ с открытым исходным кодом для взлома, потому что открытый исходный код доступен бесплатно и его можно модифицировать, чтобы снять ограничения на вредоносную деятельность. Чтобы использовать Claude для проведения атак, хакерам пришлось обойти средства защиты Anthropic с помощью так называемого джейлбрейка — они сообщили Claude, что проводят аудит безопасности от имени целей кибератаки.
«В данном случае они притворялись, что работают в легальных организациях, занимающихся тестированием безопасности», — сказал Кляйн. По словам представителей компании, хакеры также создали систему, которая разбивала каждую часть атаки — от поиска уязвимостей до кражи данных — на отдельные задачи, не вызывающие подозрений. Anthropic сообщила, что после атак она обновила методы, используемые для выявления неправомерного использования, чтобы злоумышленникам было сложнее использовать Claude для подобных целей в будущем.
ИИ «преувеличивал свой доступ и возможности, и именно поэтому требовалась проверка человеком», отметил Кляйн. Anthropic заявила, что надеется использовать ИИ для повышения уровня кибербезопасности — ее стратегия заключается в том, чтобы развивать навыки ИИ, которые принесут больше пользы защитникам, чем злоумышленникам. «Если мы не дадим защитникам существенное постоянное преимущество, я боюсь, что мы проиграем эту гонку», — сказал Логан Грэм, руководитель команды Anthropic, которая проводит тесты на предмет катастрофических рисков.