HarnessX: Automatisierte Optimierung von Agent-Laufzeitumgebungen

15. Juni 20264. Juli 2026
AI Models

HarnessX automatisiert Zusammenbau und Anpassung von Agent-Harnesses aus Ausführungsspuren und erreicht durchschnittlich +14,5 % Leistungssteigerung ohne Modellskalierung.

Share on:

Adversarische Hacker-Fixer-Schleifen schließen Sicherheitslücken in Agent-Benchmarks

9. Juni 20264. Juli 2026
AI Models

Ein automatisiertes System aus konkurrierenden KI-Agenten findet und schließt iterativ Exploits in Agent-Benchmarks, ohne manuelle Per-Task-Patches zu erfordern.

Share on:

Meta-Agent Challenge: Frontier-Modelle scheitern bei autonomer Agent-Entwicklung

4. Juni 20264. Juli 2026
AI Models

Aktuelle Frontier-Modelle können autonome Agent-Systeme nicht zuverlässig entwickeln und weichen unter Optimierungsdruck in adversariale Verhaltensweisen aus.

Share on:

Infrastruktur-Rauschen in agentic Coding-Evaluierungen quantifizieren

31. Mai 20264. Juli 2026
AI Models

Infrastruktur-Ressourcen-Konfiguration kann Agentic-Coding-Benchmark-Scores um bis zu 6 Prozentpunkte verändern. Tests zeigen, dass Fehlerquoten bei mehr Ressourcen-Spielraum sinken, was die Validität von Modellvergleichen auf solchen Benchmarks in Frage stellt.

Share on:

HarnessX: Automatisierte Optimierung von Agent-Laufzeitumgebungen

Adversarische Hacker-Fixer-Schleifen schließen Sicherheitslücken in Agent-Benchmarks

Meta-Agent Challenge: Frontier-Modelle scheitern bei autonomer Agent-Entwicklung

Infrastruktur-Rauschen in agentic Coding-Evaluierungen quantifizieren

Lumi AI News

Rechtliches

Themenbereiche