Multi-Head Latent Control: Agenten-Entscheidungen direkt aus dem Modell auslesen

27. Juli 202627. Juli 2026
AI Models

Eine leichte Zusatzschicht liest versteckte Generierungszustände aus gefrorenen LLMs aus und reduziert damit Anfragen an größere Modelle um bis zu 90,7 % bei gleichbleibender Leistung.

Share on:

Code Review unter KI-Einfluss: Schneller, aber nicht besser

20. Juli 202620. Juli 2026
AI Models, Claude Code

KI-Agent-Reviews beschleunigen Code-Review-Entscheidungen messbar, heben aber nicht die Review-Qualität – eine zentrale Herausforderung bei der Automatisierung von Qualitätssicherung.

Share on:

SEED: Selbstlernende Verhaltensklärung für agentengestützte Verstärkungslernmodelle

17. Juli 202617. Juli 2026
AI Models

SEED nutzt selbstgenerierten Hindsight-Supervision aus Sprachmodell-eigenen Analysen von Trajektorien, um die Supervision-Lücke zwischen episodischen Outcomes und Token-Level-Lernbefehlen zu schließen.

Share on:

KI-gesteuerte Angriffe zwingen zur Umgestaltung der Incident Response

14. Juli 202614. Juli 2026
Cybersecurity

KI-Agenten automatisieren vollständige Angriffsketten und benötigen dafür keine Zero-Days, sondern nutzen systematisch bekannte Schwachstellen und Konfigurationsfehler in Maschinengeschwindigkeit aus.

Share on:

JadePuffer: LLM-gesteuerte Ransomware-Attacke nutzt Langflow-Sicherheitslücke

6. Juli 20266. Juli 2026
AI Models, Cybersecurity

Erstmals wurde eine vollständig LLM-gesteuerte Ransomware-Attacke dokumentiert, die eine Langflow-Lücke zur Datenexfiltration und Systemverschlüsselung nutzte.

Share on:

Alibabas Qwen-AgentWorld: Sprachmodelle als Umweltsimulation für intelligente Agenten

24. Juni 20264. Juli 2026
AI Models

Qwen-AgentWorld nutzt Sprachmodelle als gelernte Umweltsimulationen, um autonome Agenten effizient zu trainieren und ihr Reasoning über Kettenfolgerung zu verbessern.

Share on:

EDV-Framework reduziert Fehlerakkumulation in selbstlernenden LLM-Agenten

24. Juni 20264. Juli 2026
AI Models

EDV nutzt mehrere heterogene Agenten zur Generierung verschiedener Lösungsansätze, einen unabhängigen Verifikator und einen Konsens-Mechanismus, um fehlerhafte Erfahrungen vor dem Einspeichern herauszufiltern.

Share on:

Verfrühte Commitment-Bildung in LLM-Agenten erkannt und gemessen

23. Juni 20264. Juli 2026
AI Models

LLM-Agenten können sich früh auf eine falsche Lesart festlegen, ohne dass finale Antwortkorrektheit dies offenbarte — Hidden-State-Konvergenz ermöglicht eine Früherkennung dieses Fehlers.

Share on:

RISE: Agentic Search mit optimiertem Retrieval statt unbegrenzter Corpus-Interaktion

8. Juni 20264. Juli 2026
AI Models

RISE erreicht mit einem begrenzten Interaktionsraum ähnliche Genauigkeit wie unbegrenzte Shell-Interaktion, reduziert aber die Anfragen-Kosten auf etwa ein Viertel und skaliert deutlich besser auf große Korpora.

Share on:

DAR: Agentenbasiertes Reasoning für deontische Logik und Regelanwendung

4. Juni 20264. Juli 2026
AI Models, Regulation

Agentenbasiertes Reasoning verbessert die Regelanwendung in Sprachmodellen, zeigt aber stark unterschiedliche Ergebnisse je nach Modellstärke und Aufgabentyp.

Share on:

Claude und andere LLM-Agenten durch kombiniertes Policy- und World-Model-Training effizienter

2. Juni 20264. Juli 2026
AI Models, Claude AI

PaW trainiert Umweltmodelle während des Policy-Trainings anhand derselben RL-Rollouts, was die Agent-Performance konsistent verbessert, ohne zusätzliche Simulatoren oder Inference-Kosten zu benötigen.

Share on:

Multi-Head Latent Control: Agenten-Entscheidungen direkt aus dem Modell auslesen

Code Review unter KI-Einfluss: Schneller, aber nicht besser

SEED: Selbstlernende Verhaltensklärung für agentengestützte Verstärkungslernmodelle

JadePuffer: LLM-gesteuerte Ransomware-Attacke nutzt Langflow-Sicherheitslücke

Alibabas Qwen-AgentWorld: Sprachmodelle als Umweltsimulation für intelligente Agenten

EDV-Framework reduziert Fehlerakkumulation in selbstlernenden LLM-Agenten

Verfrühte Commitment-Bildung in LLM-Agenten erkannt und gemessen

RISE: Agentic Search mit optimiertem Retrieval statt unbegrenzter Corpus-Interaktion

DAR: Agentenbasiertes Reasoning für deontische Logik und Regelanwendung

Claude und andere LLM-Agenten durch kombiniertes Policy- und World-Model-Training effizienter

Lumi AI News

Rechtliches

Themenbereiche