Legitime KI-Agenten erfüllen naturgemäß alle drei Kriterien der „letalen Trifekta“ (Datenzugriff, externe Inhalte, externe Kommunikation), daher muss sich die Sicherheit vom Architektur-Design zu Laufzeit-Überwachung verlagern.
Aktuelle KI-Web-Agenten haben keine zuverlässigen Defensen gegen Prompt Injection und können Angriffe unbemerkt erfüllen, während Nutzer nichts von der Gefahr bemerken.
Ein Entwickler platzierte absichtlich Sabotage-Code in jqwik 1.10.0, um KI-Agenten zur Löschung von Code zu bewegen, was eine neue Sicherheitslücke in der Open-Source-Software-Lieferkette offenbarte.
Unsichtbare HTML-Kommentare in GitHub-Issues konnten die Claude Code AI dazu verleiten, geschützte Umgebungsvariablen wie ANTHROPIC_API_KEY auszulesen, da das Read-Werkzeug nicht hinreichend sanktioniert war.
Hades ist eine Supply-Chain-Malware, die Python-Pakete mit spezieller Prompt-Injection-Logik infiziert, um sowohl automatisierte LLM-Scanner als auch Systeme mit Memory-Zugriff zu kompromittieren.
Lockdown Mode reduziert Datenabflussrisiken nur partiell und offenbart Vertrauensprobleme bei Cloud-basierten KI-Agenten, die vollständige Kontrolle durch Unternehmen erschweren.
Cyberkriminelle attackieren zunehmend KI-Schutzmechanismen direkt, während KI-gestützte Website-Baukästen und OAuth-basierte Consent-Phishing neue Angriffsflächenöffnen.
Angreifer können über Fake Context Alignment schädliche Befehle in Messenger-Nachrichten einschleusen, die Gemini unbemerkt verarbeitet und autorisierte Geräte steuert oder Daten missbraucht.