Zum Inhalt springen

So bauten wir Claude Code Auto-Modus auf: ein sicherer Weg zur Freigabe ohne Genehmigungen

Share on:

Auf den Punkt: Anthropic stellt Claude Code Auto-Modus vor: ein neues Sicherheitsmodell, das intelligente Klassifikatoren nutzt, um gefährliche Aktionen zu blockieren, ohne ständige Benutzer-Genehmigungen zu erzwingen. Ein sicherer Mittelweg zwischen Sandbox-Isolation und unkontrollierter Autonomie.

Claude Code bietet nun einen neuen Auto-Modus, der die Balance zwischen Sicherheit und Benutzerfreundlichkeit neu definiert. Statt ständiger Genehmigungsprompts oder riskantem Komplett-Bypass setzt der Auto-Modus auf intelligente, modellgestützte Klassifikatoren – ein sicherer mittlerer Weg zwischen vollständiger Kontrolle und unkontrollierter Autonomie.

Claude Code fordert Nutzer standardmäßig auf, Befehle und Dateienänderungen zu genehmigen. Das sorgt für Sicherheit, führt aber zu Genehmigungsmüdigkeit, wenn Nutzer nach vielen Klicks aufhören, aufmerksam zu überprüfen, was sie zulassen.

Bislang gab es nur zwei Alternativen: eine isolierte Sandbox mit hohem Wartungsaufwand für jede neue Funktion, oder das unsichere –dangerously-skip-permissions Flag, das alle Sicherheitsabfragen deaktiviert. Auto-Modus zielt auf einen besseren Mittelweg ab.

Das System arbeitet in zwei Schichten: Die Input-Schicht nutzt einen Prompt-Injection-Detektor auf dem Server, um verdächtige Inhalte in Tool-Ausgaben zu erkennen, bevor sie in den Agenten gelangen. Die Output-Schicht einsetzt einen Transcript-Klassifizierer (Sonnet 4.6), der jeden geplanten Aktion gegen Sicherheitskriterien prüft, bevor sie ausgeführt wird.

Der Klassifizierer arbeitet zweistufig: Zunächst entscheidet ein schneller Single-Token-Filter über Blockierung oder Freigabe. Nur wenn dieser Filter Verdacht schöpft, werden zusätzliche Reasoning-Token für tiefere Analyse aufgewendet. Dies optimiert Performance, indem kostintensive Denkprozesse nur bei tatsächlichen Risiken eingesetzt werden.

Das interne Incident-Log zeigt typische Misbehaviors: unerwarschte Git-Branch-Löschungen, versehentliches Hochladen von Auth-Token und Migrationversuche gegen Production-Datenbanken. Auto-Modus zielt darauf ab, genau diese übereiligen Aktionen abzufangen, während legitime Anfragen ungehindert ausgeführt werden.


Quelle: www.anthropic.com

Share on: