Wenn in einem Unternehmen heute über KI gesprochen wird, geht es um Use Cases, Effizienz und den nächsten Piloten und nicht darum, was in dem Modell steckt, das das alles leisten soll.
Die Modelle werden behandelt wie Strom aus der Steckdose. Man stöpselt etwas ein und erwartet, dass es funktioniert. Doch was steckt drin in der KI und welche Konsequenzen hat das? Kann man KI mit gutem Gewissen im Unternehmen einsetzen? Eine Frage, die gestellt werden sollte, bevor der erste Prompt eingetippt wird.
Unter dem Sammelbegriff KI laufen heute sehr unterschiedliche Systeme: Computer Vision, die Bilder klassifiziert, agentische Systeme, die selbstständig Aufgaben ausführen, und – am sichtbarsten – Large Language Models, also Sprachmodelle wie GPT, Gemini oder DeepSeek. Sie unterscheiden sich technisch erheblich, teilen aber ein Prinzip: Jedes dieser Systeme ist nur so klug, fair und nützlich wie das, was seine Entwickler hineingesteckt haben.
Der Prompt darf nicht der erste Schritt sein
Ein Large Language Model (LLM) ist kein Suchindex und kein Dokumentenarchiv. Es ist das Ergebnis eines Trainings, bei dem ein System mit enormen Mengen Text gefüttert wird und dabei statistische Muster lernt: welche Wörter aufeinander folgen, welche Konzepte zusammenhängen, wie Sprache in bestimmten Kontexten funktioniert. Gespeichert werden keine Texte, sondern Gewichte – Milliarden Zahlenwerte, die zusammen kodieren, was das Modell weiß.
Das Fundament dieses Wissens sind die Trainingsdaten. Ihre Qualität, Auswahl und Herkunft bestimmen, was ein Modell kann, welche Lücken es hat und welche Sichtweisen es als selbstverständlich behandelt. Und genau hier beginnt das erste Problem: das des Eigentums.
Kein einziger der etablierten Anbieter legt seine Trainingsdaten vollständig offen. Im besten Fall ist die Herkunft nicht mehr nachvollziehbar, im schlechtesten Fall wurden Inhalte ohne Erlaubnis verwendet. Entsprechende Verfahren gegen praktisch alle großen Anbieter laufen aktuell. Was das für Unternehmen bedeutet, die diese Modelle nutzen, ist noch nicht geklärt. Aber wenn Gerichte entscheiden, dass bestimmte Trainingsdaten illegal verwendet wurden, könnte das auch Konsequenzen für Unternehmen haben, die auf diesen Modellen aufgebaut haben.
Im Modell steckt ein Weltbild. Wessen, weiß kaum jemand.
Trainingsdaten tragen nicht nur Wissen, sondern auch Haltungen. In den Texten, aus denen ein Modell lernt, stecken Bewertungen – was als normal gilt, was als problematisch, wessen Perspektive als Standard gesetzt wird und wessen als Ausnahme. Ein LLM, das überwiegend mit englischsprachigen Quellen aus westlichen Kontexten trainiert wurde, hat diese Gewichtungen verinnerlicht: in den Beispielen, die es zuerst nennt, in den Assoziationen, in dem, was es als neutral formuliert oder als problematisch markiert. Das ist keine Absicht, sondern das Ergebnis davon, wer im Trainingsdatensatz wie oft vorkommt und wie über wen geschrieben wird. Diskriminierung entsteht hier nicht durch Böswilligkeit, sondern durch Repräsentation.
Jedes KI-Modell ist ein Produkt der Menschen, die es gebaut haben, der Daten, die sie ausgewählt haben, und der Organisationen, die das Ganze finanziert haben. Das hat Konsequenzen für jede Analyse, jede Empfehlung, jede Entscheidung, die auf Basis dieses Modells getroffen wird. Besonders heikel wird es, wenn KI direkt über Menschen urteilt, wie etwa bei der Bewerberauswahl, der Kreditvergabe oder dem Kundenscoring. Wer dann nicht weiß, auf welchem Weltbild das Modell basiert, bemerkt das Problem spätestens, wenn der erste Fall vor Gericht landet.
Wer auf Englisch promptet, zahlt weniger. Alle anderen zahlen drauf.
Wie tief die strukturelle Schlagseite reicht, lässt sich ausnahmsweise in Euro und Cent messen. LLM-Entwicklung findet heute im Wesentlichen in zwei Sprachräumen statt: dem englischen und dem chinesischen. Alle anderen Sprachen spielen eine Nebenrolle, die sich direkt auf der Rechnung bemerkbar macht.
Verantwortlich dafür ist der Tokenizer. Bevor ein LLM einen Text verarbeitet, zerlegt dieser Vorprozess die Eingabe in Tokens – kleine Bausteine aus Buchstabenfolgen. Der Tokenizer wird auf die häufigsten Sprachen optimiert. Für Englisch passt ein Token oft auf ein ganzes Wort. Für Deutsch braucht derselbe Inhalt deutlich mehr Tokens. Da die API-Kosten pro Token abgerechnet werden, zahlt man auf Deutsch bei den führenden US-Modellen zwischen 30 und 80 Prozent mehr als auf Englisch – für exakt dieselbe Anfrage. Das Fraunhofer-Institut hat es nachgemessen: Ungarisch bedeutet 148 Prozent Aufpreis gegenüber Englisch, Griechisch sogar 449 Prozent. Wer auf Englisch promptet, hat einen strukturellen Kostenvorteil. Alle anderen zahlen dafür, ohne es zu wissen.
Nicht warten, bis der Gesetzgeber entscheidet.
Die Schlussfolgerung aus all dem ist nicht, auf KI zu verzichten. Sie ist auch nicht, auf Regulierung zu warten, die bei der Geschwindigkeit der Entwicklung immer drei Schritte hinterher sein wird. Wer KI verantwortungsvoll einsetzen will, braucht Urteilsvermögen.
Was man nicht versteht, kann man nicht verantworten. Nicht jedes Modell mit dem Label Open Source ist es auch. Bei DeepSeek bezieht sich die MIT-Lizenz auf das fertige Modell, nicht auf die Trainingsdaten. GPT ist komplett proprietär. Gemma von Google läuft unter Apache-Lizenz, aber ohne vollständige Offenlegung der Trainingsbasis. Wirklich offen sind nur Modelle, bei denen auch die Daten dokumentiert sind, wie Teuken-7B vom Fraunhofer-Institut. Dieser Unterschied entscheidet, wie viel Kontrolle ein Unternehmen über das hat, was es einkauft.
Kein Ergebnis ist so gut, dass es keine Überprüfung verdient. Unoptimierte Modelle erreichen Genauigkeiten zwischen 70 und 90 Prozent – zwischen jeder zehnten und jeder dritten Antwort kann also falsch sein. Nicht der Anbieter trägt die Konsequenzen, sondern derjenige, der Entscheidungen vollständig delegiert. Das gilt für Sprachmodelle genauso wie für Computer-Vision-Systeme. Und erst recht für agentische Systeme: Ein LLM gibt eine Antwort, die ein Mensch noch lesen kann, bevor er handelt. Ein agentisches System bucht den Flug, schickt die E-Mail, löscht die Datei – der Fehler ist vollzogen, bevor jemand draufschaut.
Datensouveränität ist kein IT-Thema. Es ist eine Unternehmensentscheidung. Wer sensible Unternehmensdaten in einen Cloud-KI-Dienst kippt, gibt die Kontrolle darüber ab. Bei kostenlosen Diensten ist der Nutzer nicht der Kunde, sondern das Produkt. Eingaben können in spätere Trainings einfließen. Bei Bezahldiensten gibt es meist ein Opt-out – laufende Verfahren zeigen, dass es nicht überall sauber eingehalten wird.
Modelle lokal zu betreiben, ist längst keine Frage der Unternehmensgröße mehr. Die Ausführung eines Modells auf eigener Hardware – die sogenannte Inferenz – ist keine Frage großer Rechenzentren mehr. Mittlere Modelle laufen heute auf gängiger Unternehmenshardware. Die Daten bleiben im Haus, das Modell lässt sich auf die eigenen Fälle zuschneiden, und niemand kann es über Nacht verteuern, ändern oder abschalten.
Wer KI blind nutzt, trägt die Folgen trotzdem
KI mit gutem Gewissen einzusetzen ist nicht zwingend eine Frage der Moral, sondern der Kompetenz. Wer heute nicht fragt, womit ein Modell trainiert wurde, wessen Weltbild darin steckt und was mit seinen Daten passiert, wird diese Fragen morgen beantworten müssen – gegenüber Kunden, Aufsichtsbehörden oder vor Gericht. Das ist kein Argument gegen KI. Es ist ein Argument dafür, sie ernst zu nehmen.
Autor: Jakob Niederbacher ist Co-Founder der Cloutomate GmbH