Skip to content

Evolution Fine-Tuning: keeleмudelid õpivad optimeerimisstrateegiaid mitme ülesande lõikes

Lühidalt: Evolution Fine-Tuning õpetab keelemudeleid üldistama lahendusstrateegiaid erinevate optimeerimisprobleemide vahel ja saavutama seejuures 10,22 protsenti paremaid tulemusi kui baasmudelid.

Teadlased on välja töötanud meetodi, mis treenib keelemudeleid üldistama optimeerimisülesannetest saadud lahendusstrateegiaid, selle asemel et alustada iga probleemi lahendamist nullist. Mudel õpib seejuures, milliseid lahenduse osi tuleks muuta ja millal tuleks teha samm tagasi.

Uus meetod Evolution Fine-Tuning (EFT) lahendab seni lahendamata probleemi: kuigi suured keelemudelid (LLM-id) saavutavad evolutsioonilistes otsingualgoritmides juba tipptulemusi GPU-tuumade disainis, matemaatiliste probleemide ja kombinatoorsete mõistatuste lahendamisel, visatakse omandatud teadmised pärast iga üksikut ülesannet minema. Iga uut probleemi käsitletakse nullist alates, kuigi otsingu käigus omandatud strateegiad võiksid olla ülekantavad ka teistele probleemidele.

EFT puhul kasutatakse optimeerimisülesannete evolutsioonilisi teekondi otse treeningsignaalina. Teadlased koostasid Finch Collection’i — 156 000 evolutsioonilise trajektoori andmestiku, mis hõlmab kümmet valdkonda ja 371 optimeerimisülesannet. Selle materjaliga viidi läbi avatud lähtekoodiga mudelite (2 kuni 9 miljardit parameetrit) peentäälestamine (fine-tuning). Meetod õpetab mudelile endale, millised mutatsioonid on mõistlikud ja millal on lokaalsete miinimumide vältimiseks vaja teha samm tagasi — selle asemel, et see loogika programmeerida ainult välisesse otsingustruktuuri.

Hindamisel ilmnes 22 varem nägemata ülesande peal keskmiselt 10,22-protsendiline paranemine võrreldes baasmudelitega. Koos testiaegse tugevdusõppega (test-time reinforcement learning) saavutas mudel tipptasemel tulemused kahe ringide pakkimise probleemi puhul ning ületas võrdlusalust Erdős-i minimaalse kattumise probleemi lahendamisel. EFT toimib seega omamoodi „treeningfaasina” universaalsetele avastusagentidele, kes ei pea uusi probleeme lahendama ilma eelteadmisteta.


Allikas: arxiv.org · Avaldatud 26. juuni 2026
Lumi AI News — tehisintellekti abil kureeritud vastavalt tehisintellektimääruse artiklile 50. Parafraseerimine ja klassifitseerimine Lumi News Pipeline v1.7.2 poolt.

Share on: