Saubere Daten zuerst

Kann KI schlechte Stammdaten wirklich verbessern?

30. April, 2026
12:30

Künstliche Intelligenz ist aktuell ein zentrales Thema in Vorstandsmeetings, erhält Budgets und weckt hohe Erwartungen – auch für das Stammdatenmanagement.

Gerade dort ist die Hoffnung groß, ein seit Jahren bekanntes Problem nun endlich mit KI lösen zu können. Doch „beißt sich die Katze hier nicht in den Schwanz“? Wie kann KI fehlerhafte Stammdaten verbessern, wenn sie doch saubere Daten als vorheriges Trainingsmaterial benötigt? Welche Wege gibt es überhaupt, KI im Stammdatenmanagement zu nutzen?

Gute KI braucht dauerhaft gute Stammdaten

Fest steht: Um sich deutliche Marktvorteile zu verschaffen, reicht ein Finetuning des vorhandenen ERP-Systems heute kaum mehr aus. Unternehmen suchen nach Wegen, wie sie mit Künstlicher Intelligenz dauerhaft Verbesserungen ihrer Prozesse erreichen können. Dafür können nur durchgängig optimierte und saubere Stammdaten als Basis dienen. Punktuelle Datenbereinigungsinitiativen sind hier nur wenig zielführend.

KI aus sauberen Datenmengen lernen lassen

Ein zentraler Ansatz für das Stammdatenmanagement besteht darin, KI gezielt mit verlässlichen Daten zu trainieren. In der Praxis bedeutet das: Ein Unternehmen identifiziert zunächst einen Teilbestand seiner Stammdaten, der als korrekt und vollständig gilt. Dieser geprüfte Datenbestand wird dann als Trainingsgrundlage für die KI herangezogen. Hieraus kann sie Vorschläge für andere, weniger zuverlässige Datensätze liefern – etwa zur Korrektur einzelner Felder, zur Plausibilisierung von Kennzahlen oder zur Ableitung realistischer Werte aus Echtdaten. Entscheidend ist dabei: Die KI lernt nicht aus „irgendwelchen“ Daten, sondern aus bewusst als richtig definierten Informationen. Sie arbeitet sich also Stück für Stück immer weiter vor und bereinigt so immer weitere Bereiche. Dieser Ansatz erfordert initialen Aufwand, eröffnet aber die Möglichkeit, KI im Stammdatenmanagement immer umfassender einzusetzen.

Beispiel Dubletten: KI findet und vergleicht Datensätze, der Mensch entscheidet

Gerade bei der Dublettenprüfung erscheint es naheliegend, KI einzusetzen. Denn heutige KI-Modelle sind in der Lage, ähnliche Datensätze zu erkennen, etwa mehrfach angelegte Geschäftspartner mit leicht unterschiedlichen Schreibweisen. Die Herausforderung kommt danach: Was passiert mit diesen Dubletten? Welche Datensätze bleiben bestehen, welche werden zusammengeführt oder aus dem System entfernt? An den Stammdaten hängen zahlreiche Folgeobjekte: Bestellungen, Aufträge, Buchungen. Alle diese Beziehungen müssen korrekt mitberücksichtigt werden. Was, wenn eine KI im Lieferantenstamm zwei sehr ähnliche Datensätze autonom zusammenführt, weil Name und Bankverbindung übereinstimmen, aber übersieht, dass es sich um zwei rechtlich getrennte Tochtergesellschaften handelt? Die Folge wären falsch verbuchte Rechnungen und ausgelöste Zahlungen.

Die Kernidee: KI unterstützt Menschen, ersetzt sie aber nicht

Das Beispiel der KI-basierten Dublettenbereinigung zeigt: Autonom von der KI geänderte Stammdaten können fatale Konsequenzen haben. Die KI kann nicht alle Aufgaben mit einem „Knopfdruck“ übernehmen. Bei Prozessen rund ums Stammdatenmanagement bleibt der Mensch als prüfende und entscheidende Instanz zentral. Der Grundsatz „Human in the loop“ sollte aber möglichst konsequent durch KI unterstützt werden, indem sie die übrigen Teilaufgaben abnimmt. Hierzu muss sie trainiert werden und für die jeweilige Aufgabe möglichst gut ausgearbeitete Regeln erlernen.

Regelwerke und KI: Keine Gegensätze

Im Stammdatenmanagement gibt es sehr viele regelbasierte Ansätze, wie beispielsweise die Zuordnung von Warengruppen oder Ableitung von Pflichtfeldern. Mit diesen Regeln wird eine Vollständigkeit und Richtigkeit der Daten erreicht. Die KI sollte solche Regeln keinesfalls ersetzen, sondern ergänzen. Besonders effektiv ist die Kombination beider Ansätze: Zentrale, fachlich eindeutige Regeln werden fest definiert. In weniger klaren Bereichen liefert die KI ergänzend Vorschlagswerte. Diese werden im Prozess überprüft und bei Bedarf korrigiert. Abweichungen lassen sich analysieren und gezielt nachschärfen – entweder durch zusätzliche Regeln oder durch Anpassung der KI-Modelle. So entsteht ein lernendes System, das nicht unkontrolliert agiert, sondern innerhalb klarer fachlicher Leitplanken arbeitet.

Unendlich viele Einsatzszenarien für KI im Stammdatenmanagement

Der Einsatz Künstlicher Intelligenz im Stammdatenmanagement ist mit initialem Aufwand verbunden, da zunächst Bereiche mit geprüften Stammdaten und Regelwerke für den KI-Einsatz definiert werden müssen. Doch in den vielen Stammdaten-Prozessen von der Anlage über die Pflege bis zur Nutzung in operativen und analytischen Prozessen gibt es unendlich viele sinnvolle Einsatzszenarien für KI, immer als Unterstützer für menschliche Entscheidungen. Mit einer soliden Datenbasis ebnen sie den Weg in die Zukunft.

Weitere Informationen zum effizienten Stammdatenmanagement

Jürgen

Königsdorfer

Head of Digital Processes

Akquinet

Kann KI schlechte Stammdaten wirklich verbessern?

Gute KI braucht dauerhaft gute Stammdaten

KI aus sauberen Datenmengen lernen lassen

Beispiel Dubletten: KI findet und vergleicht Datensätze, der Mensch entscheidet

Die Kernidee: KI unterstützt Menschen, ersetzt sie aber nicht

Regelwerke und KI: Keine Gegensätze

Unendlich viele Einsatzszenarien für KI im Stammdatenmanagement

Jürgen

Königsdorfer

Weitere Artikel

Meistgelesene Artikel

Fehler eingeräumt: Mark Zuckerberg bedauert Meta-Umbau

Google Gemini down: KI seit Stunden nicht erreichbar

Apple WWDC 2026: Das sind die wichtigsten Neuheiten

KI-Agenten: Architektur schlägt Modell

US-Prozessoren hebeln europäische Cloud-Souveränität aus

IT Verlag

Wichtige Links

Kontakt