PACE: Prognosen für Agent-Benchmarks aus günstigen Einzeltests

3. Juli 20263. Juli 2026
AI Models

Ein Framework zum Vorhersagen von Agent-Benchmark-Scores aus günstigen Einzeltests erreicht 85-prozentige Ranking-Genauigkeit bei unter 1 % der Evaluierungskosten.

Share on:

PACE: Prognosen für Agent-Benchmarks aus günstigen Einzeltests

Lumi AI News

Rechtliches

Themenbereiche