Auf den Punkt: Vollständig ausgelastete Pauschalabos für ChatGPT und Claude erzeugen Kosten, die die monatlichen Gebühren um ein Vielfaches übersteigen, weshalb Anbieter auf niedrige Durchschnittsauslastung angewiesen sind und Unternehmenskunden zunehmend auf günstigere Alternativen oder eigene Systeme ausweichen.
Laut einer Analyse von SemiAnalysis können vollständig ausgelastete ChatGPT-Pro-Abos für OpenAI Kosten von bis zu 14.000 Dollar monatlich verursachen, obwohl nur 200 Dollar Gebühr eingehen. Die Gewinnspannen der KI-Anbieter hängen daher stark davon ab, dass die Nutzung deutlich unter den Limits bleibt.
Nach einer Berechnung von SemiAnalysis auf Basis regulärer API-Tarife entstehen bei OpenAI massives Missverhältnis zwischen Abonnementgebühren und tatsächlichen Rechenkosten. Das ChatGPT-Pro-Abo für 200 Dollar monatlich könnte bei vollständiger Ausschöpfung der wöchentlichen Limits tokenbasierte API-Kosten von bis zu 14.000 Dollar pro Monat verursachen. Anthropics vergleichbares Angebot Claude Max 20x für ebenfalls 200 Dollar monatlich erreicht eine theoretische Kostengrenze von etwa 8.000 Dollar.
Die Rentabilitätsgrenzen liegen deutlich unter maximaler Nutzung. OpenAI verzeichnet bereits ab einer durchschnittlichen Auslastung von 11,4 Prozent Verluste bei den Standard-Tarifen ChatGPT Plus und ChatGPT Pro 5x. Bei Anthropic liegt die Rentabilitätsschwelle für Claude Pro und Claude Max 5x bei circa 20 Prozent Auslastung. Bei den teuersten Spitzentarifen verschärft sich die Situation erheblich: OpenAI gerät ab 5,7 Prozent Nutzungsrate in die Verlustzone, Anthropic bereits ab 10 Prozent. Ein wachsender Kostentreiber sind autonome KI-Agenten, die pro Anfrage bis zu 1.000-mal mehr Token verbrauchen als Standard-Eingaben.
Große Technologieunternehmen haben auf diese Kostendynamiken bereits reagiert. Microsoft, Meta und Amazon haben die interne Bereitstellung intensiver KI-Anwendungen eingeschränkt oder neu strukturiert. In einem dokumentierten Fall verursachte die unbegrenzte Nutzung von Claude-Modellen in einer einzelnen Organisation monatliche Kosten von 500 Millionen Dollar. Als Gegenmittel implementieren viele Organisationen dynamische Lastenverteilungssysteme: Komplexe Anfragen werden gezielt an teure High-End-Modelle weitergeleitet, während Routineaufgaben von günstigeren Alternativen bearbeitet werden. Nach Berichten des Wall Street Journal lassen sich Betriebskosten durch diese selektive Steuerung um bis zu 95 Prozent reduzieren.
Einige Technologieunternehmen haben ihre Infrastruktur bereits vollständig umgestellt. Das KI-Assistenten-Startup Lindy etwa verlagerte seinen gesamten Traffic von Anthropic-Modellen auf das Modell DeepSeek V4, wodurch Geschäftsführer Flo Crivello zufolge die Leistung bei drastisch gesenkten Kosten erhalten blieb und dem Unternehmen Millionen Dollar einspart wurden. Weitere Organisationen investieren in die Entwicklung eigener Systeme auf Basis von Open-Source-Modellen, die mit internen Unternehmensdaten trainiert werden, um Kostenkontrolle zu gewährleisten.
Experten rechnen damit, dass die Betriebskosten für Modelle der mittleren Leistungsklasse langfristig durch Infrastruktur-Ausbau auf etwa 20 Dollar monatlich sinken könnten. Die fortschrittlichsten Spitzenmodelle bleiben im Unterhalt jedoch extrem kostspielig.
Quelle: www.it-daily.net · Erschienen 16. Juni 2026
Lumi AI News — KI-assistierte Kuratierung gemaess Art. 50 EU AI Act. Paraphrase und Klassifikation durch Lumi News Pipeline v1.7.1.