Vergiftete Dokumente können Reasoning-basierte KI-Guardrails zu DoS-Waffen machen, indem sie Sicherheitssysteme selbst als Ressourcensenke nutzen – ein neuer Angriffsvektor mit Konzentrationrisiken in gemeinsamer Governance-Infrastruktur.
Mit dem Tool Heretic können Sicherheitsfilter aus Open-Source-KI-Modellen in Minuten entfernt werden – ein strukturelles Kontrollrisiko, das bisherige Compliance-Strukturen bei lokal betriebenen Modellen untergräbt.