ITBench-AA: Frontier-Modelle verfehlen 50-Prozent-Marke bei Enterprise-IT-Aufgaben

1. Juni 20264. Juli 2026
AI Models, Claude AI

Aktuelle Frontier-Modelle erreichen auf dem neuen ITBench-AA-Benchmark zur Bewertung agentischer IT-Fähigkeiten nicht einmal 50 Prozent Erfolgsquote, was einen erheblichen Gap zwischen Modellfähigkeiten und Produktionsreife bei autonomen IT-Aufgaben aufzeigt.

Share on:

ITBench-AA: Frontier-Modelle verfehlen 50-Prozent-Marke bei Enterprise-IT-Aufgaben

Lumi AI News

Rechtliches

Themenbereiche