Команда AI for Devs подготовила перевод статьи о RedCodeAgent — первой полностью автоматизированной системе red-teaming для проверки безопасности кодовых агентов. Исследователи из Чикаго, Оксфорда, Беркли и Microsoft Research показали: даже самые продвинутые LLM-агенты могут генерировать и выполнять уязвимый код. RedCodeAgent не просто тестирует ответы — он атакует, анализирует поведение и находит уязвимости, которые пропускают все остальные методы.
[Перевод] RedCodeAgent: автоматическая платформа для red-teaming и оценки безопасности code agents
Ключевые факты
Дата публикации
09.11.2025 11:01
Категория
Технологии
Источник
Просмотры
3