Eine Analyse von SemiAnalysis zeigt, dass OpenAI und Anthropic bei intensiver Nutzung von KI-Modellen wie ChatGPT pro Abo massive Verluste drohen.
Die wirtschaftliche Kalkulation hinter den monatlichen Pauschalpreisen für künstliche Intelligenz erweist sich bei intensiver Nutzung als defizitär. Eine Untersuchung des Analyseunternehmens SemiAnalysis hat die Differenz zwischen den Einnahmen aus Abonnementgebühren und den tatsächlichen Kosten für die Rechenleistung auf Basis regulärer API-Tarife berechnet.
Demnach könnte ein Abonnement für ChatGPT Pro zum Preis von 200 US-Dollar bei einer vollständigen Auslastung der wöchentlichen Limits tokenbasierte API-Kosten von bis zu 14.000 US-Dollar verursachen. Das vergleichbare Angebot Claude Max 20x von Anthropic für ebenfalls 200 US-Dollar pro Monat erreicht eine theoretische Kostengrenze von rund 8.000 US-Dollar.
Geringe Auslastung als Grenze zur Profitabilität
Aufgrund dieser Verhältnisse hängen die Gewinnmargen der KI-Anbieter stark von einer niedrigen Auslastung durch die Endnutzer ab. Bei den Standard-Abonnements Claude Pro und Claude Max 5x erreicht Anthropic die Rentabilitätsschwelle bei einer durchschnittlichen Auslastung von etwa 20 Prozent. OpenAI verzeichnet bei den Tarifen ChatGPT Plus und ChatGPT Pro 5x bereits ab einer Nutzungsrate von 11,4 Prozent Verluste.
Bei den teureren Spitzenabonnements verringern sich diese Spielräume weiter. Anthropic verzeichnet ab einer Auslastung von zehn Prozent keine Bruttomarge mehr, während OpenAI bei seinen teuersten Tarifen bereits ab einer Nutzungsrate von 5,7 Prozent in die Verlustzone gerät. Ein wesentlicher Faktor für den steigenden Ressourcenbedarf ist der zunehmende Einsatz autonomer KI-Agenten, die pro Anfrage bis zu 1.000-mal mehr Token verbrauchen als eine herkömmliche Standard-Eingabe.
Strategiewechsel und Kostenkontrolle in Unternehmen
Die unkontrollierte Nutzung hat in großen Organisationen bereits zu erheblichen finanziellen Belastungen geführt. Unternehmen wie Microsoft, Meta und Amazon haben die interne Bereitstellung intensiver KI-Anwendungen wieder eingeschränkt. In einem dokumentierten Fall verursachte die unbegrenzte Nutzung von Anthropics Claude-Modellen in einem einzigen Unternehmen monatliche Kosten von 500 Millionen US-Dollar.
Als Gegenmaßnahme etablieren viele Betriebe dynamische Systeme zur Verteilung der Arbeitslasten. Komplexe Anfragen werden gezielt an teure Spitzenmodelle weitergeleitet, während Routineaufgaben von günstigeren Alternativen verarbeitet werden. Laut Berichten des Wall Street Journal lassen sich die Betriebskosten durch diese selektive Steuerung um bis zu 95 Prozent senken. Vishal Misra, Vizedekan der Columbia University, äußerte sich dazu:
„Sie brauchen kein Modell, das Quantengravitation versteht. Diese Open-Source-Modelle sind sehr leistungsfähig, und die Fähigkeit, einen großen Aufpreis für KI zu verlangen, wird abnehmen.“
Vishal Misra, Vizedekan der Columbia University
Umstellung auf Open-Source-Modelle und eigene Infrastrukturen
Einige Technologieunternehmen haben ihre Infrastruktur bereits vollständig umgestellt. Flo Crivello, Geschäftsführer des KI-Assistenten-Startups Lindy, gab bekannt, dass sein Unternehmen den gesamten Datenverkehr von Anthropic-Modellen abgezogen und vollständig auf das Modell DeepSeek V4 verlagert hat. Die Leistung sei vergleichbar, während die Kosten drastisch sanken. Laut Crivello hat dieser Schritt „dem Unternehmen Millionen von Dollar gespart“. Andere Organisationen investieren in die Entwicklung eigener Systeme auf Basis von Open-Source-Modellen, die gezielt mit internen Unternehmensdaten trainiert werden, um eine präzise Kostenkontrolle zu behalten.
Während Experten davon ausgehen, dass die Betriebskosten für Modelle der mittleren Leistungsklasse durch den Ausbau der Infrastruktur langfristig auf etwa 20 US-Dollar pro Monat sinken könnten, bleiben die fortschrittlichsten Spitzenmodelle im Unterhalt extrem teuer. OpenAI-Chef Sam Altman bestätigte, dass die steigenden Token-Kosten eine Herausforderung darstellen und das Unternehmen an Lösungen arbeitet, um den Nutzern mehr Effizienz bei geringeren Ausgaben zu ermöglichen.
(red)