Marktübersicht Hadoop-Distributionen

Hadoop BigData onlineMit der Untersuchung “Hadoop-Distributionen im Vergleich” des Business Application Research Center (BARC) erhalten Unternehmen jetzt erstmals einen Überblick über die diversen auf Apache Hadoop basierenden, aber funktional oft unterschiedlichen Angebote für die Verwaltung von Big-Data-Daten. 

Der Wunsch nach einer geschäftlichen Nutzung von Big Data hat in den vergangenen Monaten auch die Nachfrage nach neuen Techniken verstärkt, mit denen sich solche großen, polystrukturierten Datenbestände verwalten sowie schnell und fortschrittlich auswerten lassen. Einer der größten Hoffnungsträger ist hierbei „Hadoop“, eine Sammlung von Komponenten für unterschiedliche Aufgabenstellungen für die Verwaltung und den Zugriff auf strukturierte und unstrukturierte Daten.

Anzeige

Hadoop ist ein seit 2008 bei der Apache Software Foundation angesiedeltes Top-Level-Projekt, das sich aufgrund des großen Interesses von Anwenderunternehmen rasant weiterentwickelt. Arbeitsschwerpunkte sind aktuell die Performance, die Stabilität, Sicherheitsmechanismen sowie die Analysefähigkeit, Nutzbarkeit, Wartbarkeit und die Administrierbarkeit des komplexen Frameworks. Das Versprechen kommerzieller Softwareanbieter ist es somit, die Community-getriebene Open Source Apache Hadoop Distribution „unternehmensfähig“ auch für die Ansprüche von Großunternehmen nutzbar zu machen. Begleitend ist hierfür ein verlässlicher Support anzubieten und Fragen der Haftung zu klären. 

Aufbauend auf dem Apache-Projekt versuchen diverse Anbieter mit ihren eigenständigenHadoop-Distributionen die genannten Schwächen zu beseitigen, Lücken zu füllen und durch einen „Added Value“ im Markt zu punkten. So konkurrieren aktuell reine Hadoop-Distributionen (Cloudera, Hortonworks, MapR), Software-Stack-Anbieter (IBM), Speicherlösungs-Anbieter mit Hadoop-Angebot (NetApp, Pivotal) und Cloud-Service-Anbieter (Amazon, Microsoft, Rackspace) um die Gunst der Kunden. 

Vielfalt der Hadoop-Distributionen

Entsprechend unübersichtlich ist mittlerweile das Hadoop-Angebot für Unternehmen geworden. Eine gute Orientierung bietet die neue Marktübersicht „Hadoop-Distributionen im Vergleich“ des BARC. Nach einer kurzen Einführung zu Hadoop und seinen Komponenten stellt die Untersuchung die fünf eigenständigen kommerziellen Hadoop-Distributionen Cloudera, Hortonworks, IBM, MapR und Pivotal detailliert gegenüber und gibt dem Leser dabei Auswahlkriterien für deren Bewertung an die Hand. 

Allen Distributionen gemein ist laut BARC-Studie, dass ihre Entwickler angesichts der hohen Anzahl von Komponenten und Werkzeuge, die in Hadoop-Umgebungen für die Integration, Speicherung, Zugriff, Analyse und das Reporting zum Einsatz kommen, das Datenmanagement durch eine einheitliche Administrationskomponente vereinfachen wollen. Dabei zeigen sich in der Praxis vor allem in den Bereichen Datenmanagement, Security, Analytics und Benutzerfreundlichkeit einige Unterschiede zwischen den Angeboten.

„In dem Maße wie in den kommenden Monaten solche Datenmanagementfunktionen in Open-Source-Distributionen wie „Hortonworks“ verfügbar werden, wird sich der bislang noch teuer bezahlte „Added Value“ anderer Distributionen nicht mehr rechtfertigen lassen“, kommentiert Timm Grosser, Co-Autor und Senior Analyst beim BARC, die weitere Entwicklung. „Unternehmen sollten aufgrund seiner großen Dynamik den Hadoop-Markt die eingesetzten Distributionen kontinuierlich evaluieren.“ 

BARC Hadoop klein

Die BARC-Studie „Hadoop-Distributionen im Vergleich“ kostet 490 Euro und ist unter www.barc.de/studien zu finden. 

Anzeige

Weitere Artikel

Newsletter
Newsletter Box

Mit Klick auf den Button "Jetzt Anmelden" stimme ich der Datenschutzerklärung zu.