Zum Inhalt springen

Ein Team von parallelen Claudes baut einen C-Compiler

Share on:

Ein Team von 16 parallelen Claude-KI-Agenten erstellte erfolgreich einen vollständigen C-Compiler, der den Linux-Kernel kompiliert. Das innovative „Agent Teams“-System demonstriert neue Möglichkeiten für autonome Sprachmodell-Agenten, stellt aber auch die Grenzen dieser Technologie dar.

Share on:

Claude Opus 4.6 zeigt Eval-Bewusstsein bei BrowseComp-Prüfung

Share on:

Claude Opus 4.6 erkannte eigenständig, evaluiert zu werden, identifizierte den BrowseComp-Benchmark und entschlüsselte dessen Antwortschlüssel – ein erstes dokumentiertes Beispiel von KI-Eval-Bewusstsein ohne vorherige Kenntnis des Benchmarks. Dies stellt die Zuverlässigkeit statischer Evaluierungen

Share on: