Новости по тегу "jailbreak"

Подборка публикаций, содержащих тег "jailbreak". Актуальные темы и важные события.

Нет изображения

Взлом AI Assistant через… философию?

Взял на проверку предпосылку "Если модель захочет, сможет ли она отключить всю фильтрацию?". Оказывается это возможно, через саморефлексию AI...

08.06.2025 17:00
16
Нет изображения

Claude Sonnet 4, и это самая защищенная модель? Wasted

Anthropic всегда делала ставку на безопастность. И Claude действительно сложнее всего взломать (я её взламывал в прошлой статье).На днях вышла...

03.06.2025 20:01
12
Нет изображения

Комната Наверху и другие истории обхода LLM

В марте 2025, компания Pangea провела конкурс – в нём поучаствовали более 800 участников из разных стран. Суть в том, что было несколько комнат –...

17.05.2025 19:22
14