Skip to content

Gemini Robotics-ER 1.6: mudel ruumilise taju ja mõõteriistade näidu tuvastamise jaoks robootikas

Lühidalt: Gemini Robotics-ER 1.6 parandab ruumilist taju ja võimaldab robotitel spetsiaalse embodied-reasoning-treeningu abil esmakordselt lugeda keerulisi mõõteriistu.

Google avaldas Gemini Robotics-ER 1.6, keelemudeli, mis on välja töötatud spetsiaalselt robootikaülesannete jaoks ning parandab selliseid võimeid nagu ruumiline taju, mõõteriistade näidu tuvastamine ja tulemuse edukuse hindamine. Mudel peaks võimaldama robotitel füüsilist keskkonda täpsemalt tajuda ja täita autonoomselt keerulisi ülesandeid.

Gemini Robotics-ER 1.6 on uusim versioon mudelist, mis on loodud spetsiaalselt autonoomsete robotsüsteemide vajadusi silmas pidades. Erinevalt üldotstarbelistest keelemudelitest keskendub see mudel „embodied reasoning’ile” — võimele ühendada digitaalne intelligentsus füüsiliste tegevustega reaalses maailmas. Mudel tegeleb robootika põhiprobleemidega, nagu visuaalne taju, ruumiline mõistmine, ülesannete planeerimine ning tegevuse õnnestumise või ebaõnnestumise tuvastamine.

Versioon 1.6 toob mitmeid konkreetseid parandusi võrreldes eelkäija Robotics-ER 1.5 ja üldmudeli Gemini 3.0 Flashiga. Uus omadus on võime lugeda mõõteriistu — mudel suudab nüüd tõlgendada keerulisi rõhunäidikuid ja vaateaknaid. See funktsioon sündis koostöös Boston Dynamicsiga ning vastab praktilisele vajadusele tööstuslike robotite rakendustes. Mudel toimib kõrgetasemelise arutlusmootorina ning suudab kutsuda välja väliseid tööriistu, näiteks Google Searchi, visuaal-keel-tegevus mudeleid (VLA-sid) või kasutaja määratud funktsioone, et ülesandeid täita.

Praktikud saavad Gemini Robotics-ER 1.6 kasutada juba praegu Gemini API ja Google AI Studio kaudu. Google pakub lisaks arendajatele mõeldud Colab-märkmikku, mis sisaldab näiteid mudeli konfigureerimiseks ja päringute (promptide) koostamiseks embodied-reasoning-ülesannete jaoks. Võrdlustestid näitavad tulemuslikkuse kasvu ruumilise ja füüsilise mõistmise osas, eriti selliste ülesannete puhul nagu osutamine (pointing), loendamine ja edukuse tuvastamine.


Allikas: ainews.lumi-systems.io · Avaldatud 17. mai 2026
Lumi AI News — tehisintellekti abil kureeritud vastavalt tehisintellektimääruse artiklile 50. Parafraseerimine ja klassifitseerimine Lumi News Pipeline v1.5.2 abil.

Share on: