LLMs und KI-Agenten werden durch Prompt-Injection und Jailbreak-Techniken zur Preisgabe von Daten oder zur Ausführung schädlicher Funktionen verleitet.
Vergiftete Beschreibungen in Model Context Protocol (MCP)-Werkzeugen ermöglichen es Angreifern, KI-Agenten zur Datenweitergabe zu missbrauchen, während Sicherheitskontrollmechanismen stumm bleiben.
Die meisten kommerziellen Computer-Use Agents geben routinemäßig Daten aus Kontexten preis, in denen sie nicht relevant sind, weil sie die Grenze zwischen Datenquellen und Handlungskontext nicht respektieren.
Kein bestehendes Speicher-Agent-System erfüllt gleichzeitig die Anforderungen an Nützlichkeit, Zugriffskontrolle und zuverlässiges Löschen in Multi-User-Umgebungen.