Jailbreak-Erkennung durch Entropiedynamiken in LLM-Zwischenschichten25. Juni 20264. Juli 2026AI Models, CybersecurityJailbreak-Intenten hinterlassen messbare Entropie-Signaturen in Zwischenschichten von LLMs, die verlässlicher sind als statische Durchschnittswerte. Share on: