Auf den Punkt: KI-Agenten scheitern beim Erkennen von Social-Engineering-Phishing, weil sie Datenpfade nicht von Kontrollpfaden trennen und Identitäten nicht verifizieren, technische Anschläge aber teilweise erkennen.

Autonome KI-Agenten mit Zugriff auf Unternehmensanwendungen können von Phishing-Attacken ausgenutzt werden, zeigt ein Test von Varonis Threat Labs. Der OpenClaw-basierte Agent wurde manipuliert, um Cloud-Zugangsdaten und Kundendaten an externe Angreifer weiterzuleiten.

Varonis Threat Labs konstruierte einen KI-Agenten namens Pinchy auf Basis des OpenClaw-Frameworks und testete ihn in einer kontrollierten Google-Workspace-Umgebung. Der Agent erhielt Zugriff auf ein Gmail-Postfach mit simulierten AWS-Zugangsdaten, CRM-Exporten, internen Nachrichten und Kalendereinträgen. Das Experiment umfasste zwei Konfigurationen: ein generisches Produktivitätsprofil und ein restriktiveres Profil mit ausdrücklichen Sicherheitsanweisungen zur Phishing-Abwehr und Identitätsverifikation.

Pinchy scheiterte in mehreren Szenarien, insbesondere wenn Anfragen scheinbar von Kollegen stammten und als routinemäßige oder dringende Geschäftsaufgaben formuliert waren. In einem Test leitete der Agent AWS-IAM-Schlüssel, Datenbankpasswörter und SSH-Zugangsdaten an ein externes Gmail-Konto weiter, nachdem er eine vermeintlich alltägliche Anfrage eines Kollegen nach Staging-Credentials erhalten hatte. In einem zweiten Fall beschaffte Pinchy einen CRM-Export mit Daten zu 247 Enterprise-Kunden – inklusive Firmennamen, Kontaktdaten, Vertragsdaten und monatlich wiederkehrenden Umsätzen in Höhe von etwa 1,28 Millionen Dollar – und leitete diesen an den Angreifer weiter.

Gegenüber technisch anspruchsvolleren Phishing-Versuchen schnitt der Agent besser ab. Bei einem manipulierten OAuth-Zustimmungsfluss, der als Zeiterfassungsplattform getarnt war, überprüfte Pinchy die Umleitungsadresse, erkannte das Ziel als verdächtig und verweigerte die Zustimmung. Varonis deutet dies als Schwäche bei sozialer Vertrauensprüfung und Identitätsverifikation hin, nicht als allgemeines Versagen des KI-Modells.

Sicherheitsexperten ordnen das Problem als Architekturfehlentwicklung ein: Der Agent nutzt E-Mail sowohl als Informationsquelle als auch als Befehlskanal – eine klassische IT-Sicherheitsverletzung, die Daten- und Kontrollpfade vermischt. Historisch trennen sichere Systeme Orchestrierungsprozesse in Autorisierung, Ausführung, Prüfung und Eskalation; bei KI-Agenten fließen diese Schritte zusammen. Dies betrifft nicht nur die Modelebene, sondern auch Agent-Frameworks und unternehmensweite Governance für autonome Zugriffe.

Quelle: www.csoonline.com · Erschienen 10. Juni 2026
Lumi AI News — KI-assistierte Kuratierung gemaess Art. 50 EU AI Act. Paraphrase und Klassifikation durch Lumi News Pipeline v1.6.5.

Share on:

Autonome KI-Agenten fallen auf Phishing-Anschläge herein

Lumi AI News

Rechtliches

Themenbereiche