Muudetud transformer, mis kasutab kahte sõltumatut arvutusahelat oleku haldamiseks ja tokenite ennustamiseks, vähendab vajaminevaid ressursse ning parandab jõudlust järgülesannetes 2–3 protsendipunkti võrra.
Orca ühendab video, keele ja visuaalsed küsimused ühtsesse varjatud ruumi ning näitab, et selline ühtne maailmamudel võib teksti-, pildi- ja tegevusennustuses ületada spetsialiseeritud mudeleid.