DiffusionGemma erzeugt mehrere Tokens gleichzeitig statt sequenziell und steigert damit die Hardwareauslastung, erkauft dies aber mit geringerer Genauigkeit.
Apple setzt die neue Siri-Generation in iOS 27 auf Googles Gemini-Modelle um und nutzt Google Cloud für komplexe KI-Anfragen, weil die eigene Private-Cloud-Compute-Infrastruktur nicht skalierbar genug ist.