Auf den Punkt: Ein Sprachmodell-Agent mit strukturierten Trainings-Schnittstellen übertrifft CLI-basierte Verfahren beim autonomen Nachtraining deutlich.
Forscher präsentieren AutoTrainess, einen KI-Agenten, der das autonome Nachtraining von Sprachmodellen automatisiert. Das System nutzt strukturierte Schnittstellen statt roher CLI-Befehle und erreicht dabei nachweislich bessere Trainingsergebnisse als herkömmliche Ansätze.
AutoTrainess externalisiert menschliche Trainings-Expertise als explizite Workflows, Regeln und Ausführungsvorgaben, die einen Sprachmodell-Agenten bei der autonomen Post-Training-Optimierung anleiten. Statt den Agenten in einer unterdefinierten CLI-Umgebung operieren zu lassen, exponiert das System strukturierte Schnittstellen für Planung, Datenvorbereitung, Trainingsausführung, Evaluierung und Protokollierung.
Das eigentliche Problem liegt nicht primär im Code: Der Agent muss Trainings-Iterationen wiederholt planen, Benchmark-konforme Daten konstruieren, stabile Trainingsjobs durchführen, Modell-Checkpoints evaluieren und Experiment-Status über mehrstündige Interaktionen hinweg erhalten. AutoTrainess kapselt diese Operationen als wiederverwendbare Agent-Computer-Schnittstellen.
In Benchmarks auf PostTrainBench erreichte AutoTrainess mit GPT-5.4 (Codex) einen Durchschnittsscore von 26,94, während reine CLI-Baselines bei 23,21 lagen. Das System generalisiert über verschiedene Modelle hinweg: Bei DeepSeek-V4-Flash mit OpenCode verbesserten sich die Werte von 12,13 auf 19,58.
Quelle: arxiv.org · Erschienen 29. Juni 2026
Lumi AI News — KI-assistierte Kuratierung gemaess Art. 50 EU AI Act. Paraphrase und Klassifikation durch Lumi News Pipeline v1.7.2.