Anzeige

Data Warehouse

Unternehmen haben erkannt, dass die Fähigkeit zur bestmöglichen Nutzung aller Unternehmensdaten zu einem zentralen Faktor für die Wettbewerbsfähigkeit einer Organisation geworden ist.

Für die Speicherung dieser Daten sowie ihrer Verarbeitung setzen sie häufig auf ein Data Warehouse (DWH) oder ein Data Lake (DL). Allerdings übersteigt die Komplexität der Unternehmensdaten, insbesondere durch den Anstieg an unstrukturierten oder semi-strukturierten Daten, immer mehr die Möglichkeiten dieser Architekturen, den gewünschten Business Value zu generieren. Um diese Herausforderung zu lösen, bietet es sich für Unternehmen an, mittels Datenvirtualisierung ihre DWH- und DL-Systeme in einer einheitlichen Plattform (Unified DWH/DL) miteinander zu verbinden.

Data Warehouse und Data Lake als Grundlage

Data Warehouses haben ihren Ursprung in Business Intelligence (BI): Es sind Datenbanken, die für Analysezwecke optimiert sind und dafür Daten aus bestimmten Quellen strukturieren, bereinigen und kuratieren. Data Lakes dienen dagegen in erster Linie dazu, Daten aus unterschiedlichen Quellen in ihrem ursprünglichen, rohen Format zentral in einem Repository zusammenzuführen und sie für Advanced Analytics oder Machine Learning (ML) bereitzustellen. Je nach ihren konkreten Bedürfnissen können Unternehmen ein DWH, ein DL oder beides On-Premises oder in der Cloud betreiben.

So zeigt der aktuelle TDWI-Report Building the Unified Data Warehouse and Data Lake, dass mehr als die Hälfte der befragten Unternehmen (53 Prozent) auf ein On-Premises Data Warehouse setzen. Mehr als ein Drittel (36 Prozent) nutzt jeweils bereits ein solches oder einen Data Lake in der Cloud, wobei etwa die Hälfte bislang nur eines von beiden implementiert hat.

Unified DWH/DL – ein einheitlicher Blick auf alle Daten

Auch zeigt der Report, dass 36,7 Prozent der Unternehmen ihren Data Lake bereits als Ergänzung zu ihrem Data Warehouse nutzen, um dort beispielsweise multistrukturierte Daten zu verarbeiten oder IoT-Daten zu analysieren und die Ergebnisse anschließend im Data Warehouse in Reports oder Visualisierungstools zu verwenden. Beim nächsten Schritt, dem Unified DWH/DL, nähern Data Warehouses sich Data Lakes (und umgekehrt) so stark an, dass die Architektur beider Konzepte auf mehreren Ebenen verschmilzt und funktionale Dienste umfasst, die für alle Datentypen, Workloads, Anwendungen und Use Cases gleich sind.

Für diese neue Architektur existieren verschiedene Begriffe, die die Weiterentwicklung der bisherigen Systeme verdeutlichen: Enterprise Data Architecture, Hybrid Data Architecture, Modern Warehouse Architecture oder Multiplatform Data Architecture. Unabhängig davon, welcher Ausdruck sich durchsetzen wird, stimmen bereits 84 Prozent der Teilnehmer zu, dass Unified DWH/DL wichtig oder sehr wichtig ist. Die Gründe hierfür sind vielfältig, so nutzen Unternehmen eine solche Plattform, um Datensilos auflösen und einen Single Source of Truth schaffen. Damit können sie innovative KI-gestützte Analysen durchführen, in Echtzeit weitreichende Erkenntnisse aus ihren Daten gewinnen und wichtige Entscheidungen so mithilfe aller relevanten Daten treffen.

Die Integration eines Data Warehouse und eines Data Lake kann auf verschiedenen Wegen angegangen werden. Zum einen durch eine physische Konsolidierung der Daten, bei der entweder ein Teil des Data Warehouses in den Data Lake (oder umgekehrt) verschoben wird oder Daten aus beiden Systemen in ein neues Repository verlagert werden. Dies führt jedoch zu redundanter Datenhaltung und erscheint aufgrund physischer Datenbewegungen auch aus wirtschaftlichen Gesichtspunkten als nicht sinnvoll. Hingegen bietet die Datenvirtualisierung die Möglichkeit einer Integration mittels einer logischen Datenschicht. Hierbei verbleiben die Daten an ihrem Ursprungsort und die Datenkonsumenten erhalten mittels eines einheitlichen semantischen Modells Zugriff auf alle zugrundeliegenden Daten aus dem Data Warehouse und Data Lake. Hierbei spielt es keine Rolle, ob die Daten (jetzt oder in Zukunft) in der Cloud, On-Prem oder einer hybriden Architektur gehalten werden. Ebenso ist dank dieses adaptiven Designs eine hohe Zukunfts- und somit Investitionssicherheit der Dateninfrastruktur sichergestellt.

Fazit: Die richtige Lösung für anspruchsvolle Bedürfnisse

Nicht jedes Unternehmen muss zwangsläufig ein Unified DWH/DL implementieren. Wenn allerdings die bestehenden Systeme die Bedürfnisse nicht mehr decken, weil das Unternehmen vermehrt unstrukturierte Daten verarbeiten oder KI-Analysen vornehmen will, kommt man um diese Lösung wohl kaum herum. Dieser Prozess sollte allerdings nicht überstürzt vollzogen werden, sondern schrittweise, um Abläufe und Daten optimieren zu können und die Zeit zu nutzen, um Mitarbeitern die benötigten Skills beizubringen oder neue Mitarbeiter einzustellen.

www.denodo.com


Artikel zu diesem Thema

Tennisball
Jul 19, 2021

Digitalisierung ohne Business Intelligence ist wie Tennis ohne Schläger

Die Digitalisierung ist für viele Unternehmen das größte und wichtigste…
Datenbank
Jun 17, 2021

Die fünf wichtigsten Datenbank-Anforderungen für TK-Unternehmen

Telekommunikations-Anbieter benötigen eine IT-Infrastruktur mit hochperformanten und…
Data Warehouse
Mai 30, 2021

Beschleunigung der Data Warehouse-Entwicklung durch Automatisierung

WhereScape hat gemeinsam mit TDWI (Transforming Data With Intelligence) eine Studie…

Weitere Artikel

2022

5 Trends, mit denen sich Daten 2022 effektiver nutzen lassen

Die Beschleunigung der digitalen Transformation in den letzten zwei Jahren hat den Verantwortlichen deutlich aufgezeigt, dass sie mehr darauf achten sollten, wie sie Unternehmensdaten managen, die über verschiedene Speicherorte verteilt sind, gleichzeitig…
Geschäftsmann

Banken stehen beim digitalen Kundenmanagement noch am Anfang

Kundenstammdaten werden von Banken im DACH-Raum noch nicht in ausreichendem Masse systematisch erhoben, aktualisiert und für personalisierte Kundenbeziehungen eingesetzt. Das ergab eine Studie* des CRM-Herstellers BSI in Kooperation mit dem Institut für…
Datenanalyse

Mit Embedded Analytics maximalen Nutzen aus den Daten gewinnen

Rund um den Zugriff und die Analyse von Daten steigen die Investitionen von Unternehmen, nicht zuletzt auch in der Fertigungsindustrie. Durch die Optimierung des Datenmanagements sollen die Herausforderungen der Digitalisierung gemeistert werden und der…
Recruiting

Wie Tools für maschinelles Lernen und Low-Code/No-Code beim IT-Fachkräfte-Mangel helfen

Die Ergebnisse einer kürzlich von Quanthub veröffentlichten Studie zeigen, dass bereits im Jahr 2020 weltweit 250.000 Data Scientists fehlten. Außerdem bleiben Data Scientists im Durchschnitt nur 2,6 Jahre im Unternehmen. Angesichts der monatelangen…
business intelligence

Scalable BI Self Service – der Boost für BI-Architekturen

Bei Business Intelligence (BI)-Initiativen lassen sich gleich mehrere zentrale Zielsetzungen ausmachen. Auf der Wunschliste vieler BI-Anwender stehen einfache und schnelle Auswertungen. Ein unkomplizierter Zugriff und die Analyse relevanter Daten zur…
2022

Prognosen 2022: Smarte Datennutzung als Wettbewerbsvorteil

Exasol hat seine Prognosen für das Jahr 2022 veröffentlicht. Sie zeigen, wie Daten Unternehmen zu einem Wettbewerbsvorteil verhelfen werden. In den letzten Jahren haben die Unternehmen auf der ganzen Welt erkannt, welche Macht Daten haben.

Anzeige

Jetzt die smarten News aus der IT-Welt abonnieren! 💌

Mit Klick auf den Button "Zum Newsletter anmelden" stimme ich der Datenschutzerklärung zu.