Zum Inhalt springen

Apple nutzt Google Cloud für komplexe Siri-Anfragen statt eigener Private-Cloud-Infrastruktur

Share on:

Auf den Punkt: Apple setzt die neue Siri-Generation in iOS 27 auf Googles Gemini-Modelle um und nutzt Google Cloud für komplexe KI-Anfragen, weil die eigene Private-Cloud-Compute-Infrastruktur nicht skalierbar genug ist.

Apple lagert komplexe Siri-Anfragen für iOS 27 auf Google Cloud aus, obwohl der Konzern ursprünglich mit seiner eigenen Private-Cloud-Compute-Infrastruktur arbeiten wollte. Kapazitätsengpässe bei der Ausführung von Googles Gemini-Modellen auf Apple-eigenen Servern erzwingen diese Abweichung von der geplanten Datenschutzstrategie.

Die kommende iOS-27-Generation, die Apple zur WWDC 2026 vorstellen wird, integriert eine grundlegend überarbeitete Siri mit generativer KI – basierend auf Googles Gemini-Modellarchitektur. Apples ursprüngliches Versprechen einer primär lokalen Datenverarbeitung zum Schutz der Privatsphäre erweist sich als technisch nicht umsetzbar: Eine vollwertige kontextuelle Konversations-KI mit mehrstufigen Dialogen und logischen Analysen kann auf Smartphone-Hardware nicht lokal betrieben werden.

Apple setzt daher ein Hybrid-System um, das auf Modelldestillation basiert. Das große, in Google-Rechenzentren gehostete Gemini-Modell fungiert als „Lehrer“ für ein kompaktes lokales Modell mit geschätzten 3 bis 7 Milliarden Parametern. Durch systematisches Training mit Frage-Antwort-Paaren lernt das Modell die Strukturen des großen Vorbilds nachzuahmen. Im Anschluss werden weniger relevante Gewichtungen (Pruning) entfernt und die mathematische Präzision reduziert (Quantisierung). Das resultierende On-Device-Modell ist auf Apples Neural Engine optimiert, reicht aber für komplexere Anfragen nicht aus.

Ursprünglich wollte Apple solche komplexen Anfragen über seine eigene Private-Cloud-Compute-Infrastruktur verarbeiten – dedizierte KI-Server mit M-Serie-Chips, die eine staatenlose Datenverarbeitung ohne dauerhafte Speicherung versprechen. Interne Berichte offenbaren jedoch fundamentale Kapazitätsengpässe: Apple gelang es nicht, Geminis unkomprimierte Modelle stabil und effizient auf den M-Chip-Clustern zu betreiben. Die Serverkapazitäten reichen nicht für das massive Datenaufkommen bei iOS-27-Einführung aus. Folglich werden komplexe Sprachanfragen direkt an Google Cloud weitergeleitet – eine deutliche Abweichung von Apples ursprünglicher Datenschutzstrategie.


Quelle: www.it-daily.net · Erschienen 3. Juni 2026
Lumi AI News — KI-assistierte Kuratierung gemaess Art. 50 EU AI Act. Paraphrase und Klassifikation durch Lumi News Pipeline v1.2.9.

Share on: