
Společnost
AI worms už nejsou hypotéza. Nature Communications dokumentuje 97% úspěšnost autonomních jailbreak agentů
Meta měla letos v březnu Sev-1 incident kvůli prompt injection. Nature Communications publikovala studii, kde reasoning modely autonomně jailbreaknou 97 % cílových LLM. A nový obfuscation framework dosahuje 76 % success rate. Tři důkazy, jeden trend.
30. dubna 2026 · 7 min čtení
