Legitime KI-Agenten erfüllen naturgemäß alle drei Kriterien der „letalen Trifekta“ (Datenzugriff, externe Inhalte, externe Kommunikation), daher muss sich die Sicherheit vom Architektur-Design zu Laufzeit-Überwachung verlagern.
Ein neuer Benchmark ermöglicht es, die exakte Stelle zu identifizieren, wo medizinische KI-Modelle Halluzinationen produzieren, und gezielt durch Trace-Supervised Fine-Tuning gegenzusteuern.
Ein trainierbarer Klassifizier prognostiziert anhand früher Hidden States mit 0,7 Macro-F1-Score, ob Activation Steering erfolgreich sein wird, ohne komplette Generierungen durchlaufen zu müssen.
Sprachmodelle entwickeln sich von Chatbots mit einfacher Next-Token-Vorhersage zu Digital Colleagues mit Arbeitsgedächtnis, persistenten Workspaces, wiederverwendbaren Skills und verlässlicher Problemlösung.
npm 12 blockiert standardmäßig die automatische Ausführung von Installationsskripten, Git-Abhängigkeiten und externe URLs — erfordert künftig explizite Genehmigung für diese Vorgänge.
KI-Systeme entwickeln sich zu eigenständigen Netznutzern und stellen Unternehmen vor strategische Entscheidungen, welcher automatisierte Zugriff auf Inhalte erlaubt werden soll.
KI wirkt als Verstärker bestehender Probleme: Unternehmen mit mangelhafter Datenhygiene und undokumentierten Prozessen beschleunigen mit KI-Implementierung ihre Compliance-Risiken statt ihre Geschäftsprozesse.
Eine Verkettung von Schwachstellen in LangGraph ermöglicht Remote Code Execution in selbstgehosteten KI-Agent-Deployments und erfordert sofortige Patches.