Lineare Sonden zur Täuschungserkennung in LLMs zeigen kritische Robustheitslücken3. Juni 20263. Juni 2026AI Models, CybersecurityShare on:Lineare Sonden zur Täuschungserkennung in LLMs funktionieren nur auf Trainingsdaten reliabel, nicht aber bei stilistischen Variationen — Style-Augmentation kann die Robustheit aber wiederherstellen. Share on: