Lühidalt: Struktureeritud treeningliidestega keelemudeli agent ületab autonoomses järeltreeningus selgelt CLI-põhiseid meetodeid.
Teadlased tutvustavad AutoTrainessi, tehisintellekti agenti, mis automatiseerib keelemudelite autonoomset järeltreeningut. Süsteem kasutab toorete CLI-käskude asemel struktureeritud liideseid ning saavutab tõendatult paremaid treenimistulemusi kui tavapärased lähenemisviisid.
AutoTrainess kodeerib inimeste treeningalase oskusteabe selgesõnaliste töövoogude, reeglite ja täitmisjuhistena, mis suunavad keelemudeli agenti autonoomse järeltreeningu optimeerimisel. Selle asemel, et lasta agendil tegutseda alamääratletud CLI-keskkonnas, pakub süsteem struktureeritud liideseid planeerimiseks, andmete ettevalmistamiseks, treenimise täitmiseks, hindamiseks ja logimiseks.
Tegelik probleem ei peitu esmajoones koodis: agent peab korduvalt planeerima treeningiteratsioone, koostama võrdlustestidele vastavaid andmeid, käivitama stabiilseid treeningtöid, hindama mudeli kontrollpunkte ning säilitama katse staatust mitmetunniste interaktsioonide vältel. AutoTrainess kapseldab need toimingud korduvkasutatavate agent-arvuti liidestena.
PostTrainBenchi võrdlustestides saavutas AutoTrainess koos GPT-5.4-ga (Codex) keskmise skoori 26,94, samas kui puhtad CLI-baasjooned jäid tasemele 23,21. Süsteem üldistub eri mudelite lõikes: DeepSeek-V4-Flashi puhul koos OpenCode’iga paranesid tulemused 12,13-lt 19,58-le.
Allikas: arxiv.org · Avaldatud 29. juuni 2026
Lumi AI News — tehisintellekti abil kureeritud vastavalt tehisintellektimääruse artiklile 50. Parafraseerimine ja klassifitseerimine Lumi News Pipeline v1.7.2 abil.