SafePyramid: Benchmark zeigt Schwächen von LLM-Guardrails bei kontextabhängigen Richtlinien30. Juni 20264. Juli 2026AI Models, CybersecuritySelbst GPT-4.5 erkennt bei kontextabhängigen Sicherheitsrichtlinien vollständig kritische Regelkonfigurationen nur in 54% der einfachen, 35% der mittleren und 13% der komplexen Fälle. Share on: