Die jüngsten Vorfälle bei Google und Anthropic zeigen, wie schnell „AI as a Public API“ zum operativen Risiko wird.
Störungen und Nutzungsbeschränkungen unterstreichen die Abhängigkeiten, die Unternehmen bei der Nutzung öffentlicher Large Language Models (LLMs) eingehen und die sich kaum kontrollieren lassen. Private AI ist daher kein Luxus, sondern Risikomanagement.
Die vergangenen Wochen waren ein Stresstest für alle, die KI als extern gehosteten Dienst nutzen. Erst ging Google Gemini zeitweise offline und plötzlich stand ein produktiver Prozess ohne eigenes Zutun still. Kurz darauf wurde der Zugriff auf Anthropics neueste Modelle „Fable 5“ und „Mythos 5”, aufgrund einer von der US-Regierung kurzfristig erlassenen Exportbeschränkung für alle nicht-US-amerikanischen Staatsbürger, unterbunden. Ähnlich auch bei der neuesten Modell-Serie von OpenAI „GPT-5.6”, welche, angewiesen durch die US-Regierung, ebenfalls nur für ausgewählte Kunden in den USA verfügbar gemacht werden soll – mit dem Unterschied, dass das Modell erst gar nicht für den breiten Markt verfügbar gemacht und später wieder zurückgezogen wird. Diese Beispiele offenbaren eine unangenehme Realität: Verfügbarkeit ist zu einer Variablen geworden, die aufgrund externer Einflüsse weder kontrollierbar noch verhandelbar ist.
Resilienz, Kontrolle und Planbarkeit statt Technik
Tatsächlich liegt das Problem nicht in der Technik der öffentlichen LLMs – es liegt in der unternehmerischen Resilienz. Durch die Nutzung öffentlicher Modelle sind Unternehmen geopolitischen Entscheidungen und Konflikten, globalen Ausfällen und intransparenten Produkt- und Pricing-Änderungen ausgeliefert, die vor allem die Verfügbarkeit und den operativen Betrieb treffen. Dort schafft KI inzwischen den größten Mehrwert.
Hinzu kommt eine betriebswirtschaftliche Komponente, die in vielen KI-Programmen zu spät ernst genommen wird. Durch variable Preismodelle steigt mit wachsender Adoption zwar der Nutzen der KI, gleichzeitig können sich insbesondere durch den Einsatz agentischer KI-Systeme die Kosten exponentiell entwickeln. Besonders dann, wenn KI kein Experiment mehr ist, sondern als fester Bestandteil der Wertschöpfungskette integriert wird. Ein aktuelles Beispiel liefert GitHub Copilot: Nach der Umstellung auf ein tokenbasiertes Abrechnungsmodell berichten zahlreiche Entwickler von drastischen Budgetabzügen bei normaler Nutzung. Auch Uber musste kürzlich feststellen, dass das Unternehmen sein gesamtes Budget für KI-Programmierwerkzeuge und Tokens für generative KI-Tools wie Claude Code für das Jahr 2026 bereits nach nur vier Monaten aufgebraucht hatte, nachdem es seine Mitarbeiter zur Einführung der Technologie motiviert hatte. Diese Entwicklungen treffen in der Praxis ganze Teams und zeigen, wie schnell intransparente Kostenlogiken bei öffentlichen KI-Diensten zur betrieblichen Belastung werden können.
Sensible Daten müssen im Unternehmen bleiben
Im Kontext von öffentlich gehosteten Modellen müssen aber auch Themen wie Datenschutz und die Herausgabe sensibler Unternehmensinformationen und intellektuellen Eigentums diskutiert werden. Laut dem Stanford AI Index Report 2025 stieg die Zahl der dokumentierten Vorfälle rund um KI-Privacy und -Security innerhalb eines Jahres um 56,4 Prozent an. Gleichzeitig wird es schwierig, mit der Nutzung öffentlicher APIs die durch den EU AI Act zukünftig geforderte lückenlose Nachverfolgbarkeit von Trainings- und Validierungsdaten sowie Infrastruktur-Provenienz für als Hochrisiko kategorisierte KI-Systeme sicherzustellen.
Das ist der Punkt, an dem die Prämisse „wir haben doch einen Vertrag“ häufig überschätzt wird: Verträge können Pflichten definieren, aber verhindern weder Störungen noch geopolitische Zugriffsbeschränkungen.
Private AI: Risikomanagement statt Luxus
Private AI setzt genau hier an. Der wesentliche Unterschied liegt im Zusammenspiel der KI-Applikationen, der Modelle und der Daten. Anders als bei der Nutzung externer KI-Modelle verbleiben sämtliche Informationen im eigenen Souveränitätsgebiet – unabhängig davon, ob es sich hierbei nachher um ein Setup in einer Public Cloud, einer Sovereign Cloud, ggf. On-Premises oder eine private Cloud im eigenen Datacenter handelt. Das erhöht die Sicherheit, schützt geistiges Eigentum und schafft die notwendige Nachvollziehbarkeit und Auditierbarkeit, die in Zeiten digitaler Souveränitätsbestrebungen immer wichtiger werden. Vor allem aber behalten Unternehmen die Kontrolle über Verfügbarkeit, Governance und Kosten.
Dabei ist Private AI nicht nur defensiv zu denken. Wer KI in einer kontrollierten, eigenen Umgebung betreibt, kann maßgeschneiderte Lösungen entwickeln, die gezielt auf individuelle Geschäftsziele und Anwendungsfälle zugeschnitten sind. Durch die Automatisierung wiederkehrender Aufgaben lassen sich Entscheidungsprozesse beschleunigen und die Produktivität steigern, ohne dabei Abstriche bei der Sicherheit oder Compliance machen zu müssen.
Obwohl bei Private AI anfangs oft höhere Investitionen als bei öffentlichen Diensten notwendig sind, rechnet sich die Anwendung langfristig. Die Abhängigkeit von Drittanbietern nimmt ab, laufende Kosten für Speicherung, Verarbeitung und Lizenzen sinken und werden vor allem planbarer. Das beweist: Private AI ist keine kosmetische Optimierung. Sie ist Voraussetzung dafür, KI stabil und wirtschaftlich zu betreiben.
Öffentliche Modelle bleiben Option – aber nicht das Fundament
Wer KI ernsthaft in großem Maßstab einsetzen will, sollte öffentliche Modelle als Option betrachten aber nicht als Basis. Denn das Fundament heißt digitale Souveränität. Die eingangs erwähnten Beispiele machen das greifbar: Ein Ausfall bei Gemini, oder eine politisch erzwungene Zugriffsbeschränkung wie im Beispiel Anthropic und OpenAI, sind offensichtlich keine Ausnahmefälle, sondern vielmehr wiederkehrende Risiken, mit denen Unternehmen auch künftig rechnen müssen. Private AI schafft hier Abhilfe: KI ist nicht länger ein externer Risikofaktor, der weitere Abhängigkeiten schafft, sondern wird zur belastbaren, regelkonformen Plattform, auf der Unternehmen Innovation vorantreiben und entsprechend skalieren können, ohne bei Ausfällen, Exportkontrollen oder Preissprüngen beeinträchtigt oder gar handlungsunfähig zu werden.
Autor: Steffen Märkl, Director Solutions Engineering bei Cloudera