Ein 20B-Search-Agent erreicht 0,730 durchschnittliche Curated Recall über acht Benchmarks, indem RL auf explizitem Zustand trainiert wird statt Zustandsverwaltung in die Policy zu integrieren.
PaW trainiert Umweltmodelle während des Policy-Trainings anhand derselben RL-Rollouts, was die Agent-Performance konsistent verbessert, ohne zusätzliche Simulatoren oder Inference-Kosten zu benötigen.
Edamame stellt Host-basierte Runtime-Verifikation vor, um Code-Drift und Missbrauch autonomer KI-Coding-Agenten zu erkennen, bevor vertrauliche Daten exfiltriert werden.
Anthropic erweitert sein Programm zur KI-gestützten Codesicherung auf 150 neue Partner aus kritischen Infrastrukturen, da die bisherigen 50 Partner bereits über 10.000 kritische Schwachstellen identifizierten.
Geometric Latent Reasoning approximiert diskrete Denkschritte als kontinuierliche Pfade im Embedding-Raum und erzielt damit kürzere Generierungen bei gleichbleibender oder besserer Genauigkeit.
Angreifer nutzten ein scheinbar legitimes npm-Paket mit 27.000 wöchentlichen Downloads, um Refresh-Token zu stehlen, die unbegrenzten Zugriff auf Konten ermöglichen.
AgentCore Gateway implementiert OAuth Code Flow als standardisiertes Inbound-Authentifizierungsmuster, um agentic Coding Assistants sicher gegen Backend-Tools zu authentifizieren.
Multi-Agent-Koordination mit Task-Dekomposition und Parallelisierung verbessert Computernutzungs-Agenten erheblich und löst komplexe Langzeit-Aufgaben, an denen Einzelagenten scheitern.
OpenAIs GPT-5.5, GPT-5.4 und Codex sind jetzt in Produktion auf Amazon Bedrock mit AWS-Governance-Integration, automatischer Kapazitätsverwaltung und OpenAI-konformen Preisen verfügbar.
Eine Supply-Chain-Attacke auf Red-Hat-npm-Pakete nutzt Install-Time-Execution und Credential-Harvesting zur Infiltration von Developer- und CI/CD-Systemen mit selbstverbreitendem Malware.
Kaum wahrnehmbare akustische Signale in Audio-Dateien können KI-Sprachmodelle unbemerkt zur Datenexfiltration oder Netzwerkzugriff bewegen, während übliche Schutzmechanismen 70–93 Prozent der Angriffe nicht abfangen.