[Перевод] RedCodeAgent: автоматическая платформа для red-teaming и оценки безопасности code agents
Команда AI for Devs подготовила перевод статьи о RedCodeAgent — первой...
Подборка публикаций, содержащих тег "Jailbreak". Актуальные темы и важные события.
Команда AI for Devs подготовила перевод статьи о RedCodeAgent — первой...
KAiScriptor — система семантического сжатия и шифрации для управления моделью:...
Сегодня рассмотрим недавно вышедшую модель ChatGTP-5. Посмотрим на сведения...
Модели часто отказывают вам в вещах, ответы на которые считают опасными. Свежая...
Аналитический центр red_mad_robot разобрал объёмную научную статью «Advances...
Этот вводная часть открывает серию статей о уязвимостях агентов ИИ, в которых...
Яндекс выпустил новую модель для Шедеврума, которая попыталась прикрыть...
Взял на проверку предпосылку "Если модель захочет, сможет ли она отключить всю...
Anthropic всегда делала ставку на безопастность. И Claude действительно сложнее...
В марте 2025, компания Pangea провела конкурс – в нём поучаствовали более 800...