Lühidalt: Xiaomi-GUI-0 treenitakse simuleeritud keskkondade asemel päris seadmetel, mis vähendab lõhet laborimõõdikute ja tegeliku rakenduskeskkonna stabiilsuse vahel.
Xiaomi on välja töötanud GUI-agendi, mida on treenitud päris mobiilseadmetel ning mis täidab tegelikes rakenduskeskkondades mobiilseid ülesandeid 72% edukusmääraga. Mudel ei toetu simulatsioonidele, vaid tootmiskeskkonnast pärit stsenaariumidele, nagu autentimisdialoogid ja riskikontrollid.
Olemasolevad GUI-agendid põhinevad nägemis-keele mudelitel ja täidavad mobiilseid ülesandeid otseste liidesega toimingute kaudu – puudutamine, pühkimine, teksti sisestamine, navigeerimine. Probleem seisneb selles, et neid treenitakse valdavalt simuleeritud keskkondades tehtud offline-salvestiste ja standardiseeritud võrdlusaluste (benchmark) põhjal. Need erinevad tegelikest rakendusstsenaariumidest märkimisväärselt paigutuse, interaktsioonilogika ja vigade jaotuse poolest.
Xiaomi kõrvaldab selle lõhe Xiaomi-GUI-0 abil, kasutades hübriidset füüsilist taristut, kus päris seadmed on peamine täitmiskeskkond ja liivakastid (sandbox) täidavad üksnes tugifunktsiooni. Nii katavad andmekogumine, treenimine, kasutuselevõtt ja hindamine sama jaotust nagu tegelik kasutuselevõtt. Mudel õpib kolmest andmeallikast: sageli täidetavatest põhiülesannetest, erijuhtude jaoks üldistatavatest andmetest ning refleksiooni ja mälu jaoks mõeldud võimekust suurendavatest andmetest. „Vigadest juhitud andmehoovaratas” (Error-Driven Data Flywheel) muudab ebaõnnestunud trajektoorid parandatud toiminguteks, reflekteerivateks selgitusteks ja taastamisdemonstratsioonideks.
Treening toimub kolmes etapis: juhendatud peenhäälestus, sammupõhine tugevdusõpe ja agentne tugevdusõpe. Xiaomi sisemisel RealMobile’i võrdlusalusel saavutab Xiaomi-GUI-0 72,0% edukusmäära; avalikul AndroidWorld’i võrdlusalusel 78,9%. Määravaks osutub see, et mudel näitab paremat stabiilsust ebatavaliste olekute korral tegelikes stsenaariumides – autentimisdialoogide, õiguste küsimise ja maksete kinnitamise puhul, kus traditsioonilised agendid tihti ebaõnnestuvad.
Allikas: arxiv.org · Avaldatud 29. juuni 2026
Lumi AI News — tehisintellekti abil kureeritud vastavalt tehisintellektimääruse artiklile 50. Parafraseerimine ja klassifitseerimine Lumi News Pipeline v1.7.2 poolt.