GauntletBench: Neue Messlatte zeigt Grenzen von KI-Agenten auf26. Juni 20264. Juli 2026AI ModelsAktuelle KI-Agenten scheitern bei komplexen visuellen Aufgaben in professionellen Anwendungen deutlich häufiger als bisherige Benchmarks suggerieren. Share on: