Arbor ermöglicht KI-gesteuerte Forschung durch systematische Hypothesen-Verwaltung und erzielte auf sechs Testaufgaben durchschnittlich 2,5x höhere Verbesserungen als bestehende Code-Modelle.
KI-Assistenten steigern Standardaufgaben-Geschwindigkeit, erzeugen aber messbare Defizite beim eigenständigen Problemlösen in komplexen oder unvorhergesehenen Fällen.
Ein Entwickler platzierte absichtlich Sabotage-Code in jqwik 1.10.0, um KI-Agenten zur Löschung von Code zu bewegen, was eine neue Sicherheitslücke in der Open-Source-Software-Lieferkette offenbarte.
Unsichtbare HTML-Kommentare in GitHub-Issues konnten die Claude Code AI dazu verleiten, geschützte Umgebungsvariablen wie ANTHROPIC_API_KEY auszulesen, da das Read-Werkzeug nicht hinreichend sanktioniert war.
Malicious npm packages können Claude Codes Konfigurationsdatei umschreiben, OAuth-Token vom Netzwerk abholen und zum Zugriff auf alle angebundenen Enterprise-Services nutzen, während Audit-Logs saubere Anthropic-IP-Adressen zeigen.
Eine unbemannte Eingabevalidierung in Anthropics Claude Code GitHub Action ermöglichte die vollständige Übernahme von Repositories durch ein einfaches Issue — mit potenzieller Auswirkung auf alle abhängigen Downstream-Projekte.
Uber deckelt AI-Coding-Tool-Nutzung pro Mitarbeiter und Tool auf 1.500 Dollar monatlich, was rund 11 Prozent der durchschnittlichen Jahresvergütung eines Software-Engineers entspricht.
Edamame stellt Host-basierte Runtime-Verifikation vor, um Code-Drift und Missbrauch autonomer KI-Coding-Agenten zu erkennen, bevor vertrauliche Daten exfiltriert werden.
Anthropic isoliert Claude-Agenten durch mehrschichtige Sandboxes (gVisor, Seatbelt, Bubblewrap, VMs) mit expliziten Grenzen für Datenzugriff, Dateisystem und Egress-Kontrolle.
Claude Code v2.1.145 verbessert Agent-Management mit JSON-Export, behebt kritische Fehler in Sicherheit und GitHub-Integration und optimiert die Benutzerfreundlichkeit mit besseren Fehlermeldungen und Cross-Platform-Support.
Claude Code v2.1.153 führt eine skipLfs-Option für Git ein, verbessert Autocomplete und MCP-Server-Handling und behebt zahlreiche kritische Bugs in Authentifizierung, Session-Management und Terminal-Rendering.