Auf den Punkt: Ein Team von 16 parallelen Claude-KI-Agenten erstellte erfolgreich einen vollständigen C-Compiler, der den Linux-Kernel kompiliert. Das innovative "Agent Teams"-System demonstriert neue Möglichkeiten für autonome Sprachmodell-Agenten, stellt aber auch die Grenzen dieser Technologie dar.
Forscher Nicholas Carlini vom Safeguards-Team von Anthropic hat eine innovative Methode zur Überwachung von Sprachmodellen entwickelt: sogenannte "Agent Teams". 16 parallel arbeitende Claude-Instanzen erstellten von Grund auf einen Rust-basierten C-Compiler, der den Linux-Kernel kompilieren kann.
Carlini hat mit einer neuen Methodik experimentiert, bei der mehrere Claude-Instanzen gleichzeitig an einer gemeinsamen Codebasis arbeiten, ohne aktive menschliche Eingriffe zu benötigen. Dieser Ansatz vergrößert die Reichweite dessen, was mit LLM-Agenten möglich ist, erheblich.
Um das System auf die Probe zu stellen, beauftragte Carlini 16 Agenten damit, einen C-Compiler auf Rust-Basis von Grund auf neu zu schreiben. Dieser Compiler sollte in der Lage sein, den Linux-Kernel zu kompilieren. Das Projekt erforderte fast 2.000 Claude Code-Sitzungen und kostete 20.000 Dollar an API-Gebühren. Das Ergebnis ist ein 100.000 Zeilen umfassender Compiler, der Linux 6.9 auf x86-, ARM- und RISC-V-Architekturen erfolgreich kompiliert.
Der Compiler ist zwar ein interessantes Artefakt für sich genommen, doch Carlini konzentriert sich auf die praktischen Erkenntnisse zur Gestaltung von Steuerungsmechanismen für langfristig laufende autonome Agent-Teams: Wie man Tests schreibt, die Agenten ohne menschliche Überwachung auf Kurs halten. Wie man Arbeiten strukturiert, damit mehrere Agenten parallel voranschreiten können. Und wo dieser Ansatz an seine Grenzen stößt.
Die technische Umsetzung funktioniert durch eine Schleife, die Claude in einer kontinuierlichen Aufgabenliste hält. Sobald eine Aufgabe abgeschlossen ist, wählt das System automatisch die nächste aus. Für die parallele Ausführung werden mehrere Claude-Instanzen in separaten Docker-Containern mit dem gemeinsamen Repository ausgeführt. Um zu verhindern, dass zwei Agenten dieselbe Aufgabe gleichzeitig bearbeiten, nutzt die Infrastruktur einen einfachen Synchronisierungsalgorithmus mit Dateisperren.
Quelle: www.anthropic.com