Data Warehouse: Basis für Big Data und neue Technologien

Data WarehouseRelevante Daten in Echtzeit, kosteneffizient sowie flexibel über die Cloud erreichbar und dort jahrelang verfügbar – gibt es diese „eine Lösung“ überhaupt? Und wird dadurch das Data Warehouse, das sich auf historische Daten spezialisiert hat, abgelöst?

Relevante strukturierte und unstrukturierte Informationen in Echtzeit, kosteneffizient und flexibel über die Cloud erreichbar, jahrelang gespeichert, formatübergreifend und leicht verständlich – am besten in einer Lösung: Software-Entwickler, Big-Data-Experten, IT- und Fachabteilungen sind auf der Suche nach der „einen IT-Plattform“, die alle Systeme, Infrastrukturen, Tools und interne sowie externe Dateien miteinander vereint. Eine Utopie? Und wird dadurch das auf historische Daten spezialisierte Data Warehouse obsolet?

Anzeige

„Eine, alle Daten und Systeme umfassende Lösung halte ich für utopisch“, meint Ursula Flade-Ruf, Gründerin und Geschäftsführerin der mip GmbH. „Und Echtzeitlösungen ersetzen nicht das Data Warehouse, da sie völlig unterschiedliche Aufgaben erfüllen müssen.“ Dennoch schreitet die Integration von Data-Warehouse- und Big-Data-Technologien im Zuge von Digitalisierung und Internet of Things weiter voran. Dabei sind die Anforderungen an ein Data Warehouse (DWH) nahezu gleich geblieben: Es wird immer noch als zentraler Anlaufpunkt für alle Unternehmensinformationen und deren Aufbereitung genutzt.

„Geändert haben sich hingegen Verarbeitungsgeschwindigkeit und Datenvolumen, die beide stetig zunehmen“, so Flade-Ruf. „Heute arbeiten wir im Big-Data- und Data-Lake-Umfeld daran, wie sich qualitative Informationen an das Data Warehouse ankoppeln lassen.“ Markus Ruf, Daten-Experte bei mip: „Viele verstehen unter Data Lake unstrukturierte Daten, die erst einmal alle in einem Hadoop-Cluster für spätere Analysen abgelegt werden.“ Data Scientists sollen hieraus dann wertvolle Erkenntnisse gewinnen. „Das Data Warehouse bleibt aber immer noch für die Aufbereitung von Standard-Reportings und -Analysen notwendig – gerade auch in Hinblick auf Vergleiche mit Vergangenheitsdaten“, ergänzt Ruf.

Data Warehouse vs. Big Data: Alles eine Frage der Frage

Data Warehouse: Basis für Big Data und neue TechnologienBig-Data- mit DWH-Vorhaben unterscheiden sich bereits in der Fragestellung. Flade-Ruf: „In Data-Warehouse-Projekten haben wir über Jahre mit unseren Kunden klären können, welche Kennzahlen und Resultate in die Auswertungen miteinfließen sollen. Bei Big-Data-Projekten ist jedoch noch nicht einmal das gewünschte Ergebnis bekannt.“ Dabei gelten vor allem unstrukturierte Daten als größte Herausforderung. „Wir beobachten gerade, dass Unternehmen zunächst mit neuen Technologien und Data Lakes experimentieren“, gibt Flade-Ruf zu bedenken. Doch umso unstrukturierter die Daten sind, desto schwerer ist es, vernünftige Fragen oder gar Ziele zu formulieren.

„Dafür benötigt es ein ausgewähltes Team von Spezialisten aus den Fachbereichen und Daten-Experten, die mit den neuen Technologien umgehen können“, erklärt Flade-Ruf. Denn ein Data Scientist kennt sich nicht unbedingt mit den unternehmensspezifischen Zielen und Prozessen aus. Erst gemeinsam wird eine zielgerichtete Annäherung an die enormen Informationsmengen möglich. „Um die Suche nach relevanten Fragen zu beschleunigen, können Advanced-Analytics-Lösungen oder beispielsweise Produkte wie der von IBM entwickelte, lernfähige Computer Watson unterstützen“, so Flade-Ruf.

Alt und neu – erst Vergleiche machen Daten wertvoll

Dabei spielen neue Quellen beim Thema Daten eine entscheidende Rolle. Flade-Ruf: „Hier existieren keine Standards. Wir arbeiten im Umfeld von Big Data und Data Warehouse darauf hin, die in diesen Quellen erzeugten, unstrukturierten Daten zu analysieren und darin Muster zu erkennen.“ Die Daten sollen dann in ein DWH überführt werden. Flade-Ruf: „Muster lassen sich aber nur unterscheiden und bewerten, wenn irgendwelche Vergleichsgrößen existieren – und die liegen in der Vergangenheit.“ Aus heutiger Sicht halten operative Systeme kaum historische Daten vor. Solche transaktionalen Systeme sind auf die Ausführung ausgerichtet. „Die Transaktion selbst ist flüchtig“, beschreibt Flade-Ruf. „Es ist nicht die Aufgabe von operativen Systemen, Daten über einen längeren Zeitraum zu speichern oder zu vergleichen.“ Diese Aufgabe fällt dem DWH zu.

Selbst wenn heute über KI-gesteuerte Systeme wie Watson oder Roboter nachgedacht wird, die kognitive Fähigkeiten entwickeln sollen, funktioniert Lernen nur über den Vergleich mit bestimmten Systematiken, Mustern oder Profilen, die aus gespeicherten Informationen abgeleitet wurden. „Erst so lassen sich neue kognitive Verknüpfungen herstellen“, erklärt Ruf. „Lernen benötigt also immer den Vergleich mit der Vergangenheit.“

Bedarf für Data Warehouse und historische Daten

Anwendungsgebiete für DWHs finden sich zahlreich. Beispielsweise benötigen Unternehmen aufgrund steuerrechtlicher Vorgaben immer eine langfristige Dokumentation von Daten. Unterschiedliche Anforderungen in den Industriezweigen schaffen weitere Einsatzszenarien. „In dynamischen Branchen wie dem Handel zum Beispiel verändert sich das Kaufverhalten der Verbraucher sehr schnell“, erklärt Flade-Ruf. „Predictive Analytics und Voraussagen benötigen aber stets den Vergleich mit vorliegenden Datenprofilen, um Muster oder neue Trends identifizieren zu können.“ In der Produktion existieren feststehende Kriterien für die Qualität von Produkten oder Prozessen. Diese basieren ebenfalls auf Vergangenheitsdaten. Ergebnisse aus Datenaufzeichnungen lassen sich nur validieren, indem die Qualität über eine gewisse Zeitspanne hinweg analysiert und gemessen wird.

Ein DWH bleibt also eine wesentliche Säule für den Unternehmenserfolg. Das bestätigt auch eine Umfrage unter Daten-Experten: 99 Prozent halten Data Warehousing für wichtig bis sehr wichtig für ihre Geschäftsprozesse. „Unsere Empfehlung an Unternehmen lautet deshalb, ein solides Data Warehouse aufzubauen, Daten zielgerichtet zu säubern und aufzubereiten, um so die Basis für neue Technologien und Tools zu schaffen“, fasst Flade-Ruf zusammen.

Weitere Informationen:

http://mip.de/data-warehouse-big-data-data-lake/

Anzeige

Weitere Artikel

Newsletter
Newsletter Box

Mit Klick auf den Button "Jetzt Anmelden" stimme ich der Datenschutzerklärung zu.