On premise und in der Cloud: Datenbank-Power erschließen

Kaj Arnö, Vice President Collaboration bei SkySQLKaj Arnö über die wachsende Bedeutung von Tools.


Das Internet hat Unternehmen und staatlichen Behörden eine geradezu explosionsartige Vermehrung ihrer Datenbestände beschert. In den letzten fünf Jahren hat sich nach Angaben von IDC die Datenmenge glatt verfünffacht, 90 Prozent davon kämen aus den letzten beiden Jahren. Laut IBM werden es täglich 2,5 Trillionen Byte mehr. Ein Wikipedia-Beitrag geht inzwischen von einer Verzehnfachung der Datenmenge innerhalb von fünf Jahren aus. Twitter verarbeitet täglich mehr als 400 Millionen der bis zu 140 Zeichen langen Tweets, im Durchschnitt 4500 pro Sekunde. Das schafft das Unternehmen übrigens mit einer selbstoptimierten Variante der Datenbank MySQL und einer ganzen Reihe weiterer Open-Source-Produkte.

Anzeige

Mit solchen Dimensionen haben es natürlich nur ganz wenige Unternehmen auf der Welt zu tun. Aber alle IT-Abteilungen registrieren, dass ihnen neue Datenerfassungssysteme und das Internet riesige Informationsmengen ins Haus schaufeln. Der in diesem Kontext schnell fallende Begriff „Big Data“ greift zu kurz, solange er sich nur auf die schiere Menge der Daten bezieht. Auch die ist bereits ein Problem, denn ohne große Cluster von Datenbankservern geht nichts. Für deren Aufbau und Betrieb ist schon erhebliches Wissen erforderlich.

Das ist aber nur eine Seite des Problems. Viele Daten heißt nicht viel Wissen, sondern sie verschleiern eher die in ihnen steckenden Aussagen. Die Analyse der Daten, beispielsweise zu Erkennung tatsächlicher (und nicht vermeintlicher) neuer Markttrends, ist ein ebenso großes Problem. Das wird noch einmal dadurch verschärft, dass immer mehr Audio- und Video-Daten anfallen, deren multidimensionaler Charakter ihre Auswertung durch die zweidimensional angelegten relationalen Datenbanken erschwert. Um dem Abhilfe zu schaffen, integrieren diese Datenbanksysteme unter anderem Techniken wie MapReduce.

Es liegt auf der Hand, dass Unternehmen früher oder später an ihre finanziellen und personellen Grenzen stoßen, hausintern solche Datenmengen zu speichern und zu verarbeiten. Nicht von ungefähr sind Storage und Business Intelligence zwei Hauptthemen in der Cloud-Computing-Diskussion. Es liegt quasi nahe, die Lösung auch genau dort zu suchen, wo das Problem zu einem erheblichen Teil herkommt, nämlich im Internet. In der Cloud lässt sich zu einem akzeptablen Preis gewaltige Rechenleistung mit gewaltigen Datenbeständen verbinden.

Sobald es um Datenbanken in der Cloud geht, fällt auf, dass diese nicht für zeitkritische Aufgaben genutzt werden. Mehrere Neunen Hochverfügbarkeit gibt es nicht in der Cloud. Riesige Cloud-Server-Farmen waren schon tagelang vom Netz, massenhaft verschwanden Daten im digitalen Orkus oder waren nicht mehr sinnvoll zu rekonstruieren. Es ist eine noch recht überschaubare Aufgabe, beispielsweise eine einfache Linux-basierende Datenbank samt Replikationsserver in der Cloud einzurichten, sie mit Daten und Programmen zu beladen. Ob diese Umgebung noch in einer Stunde oder einem Tag verfügbar ist, bleibt eine Frage. Ganz zu schweigen von der, ob sie tatsächlich nach allen Seiten gegen Zugriffe gesichert ist.

Cloud Computing ist ein Kind der Virtualisierung, und schon die verlangte mehr als die in der IT weit verbreitete Spezialisierung auf relativ eng umrissene Themen. Längst sind in der IT wieder Leute gefragt, die über den Tellerrand hinausschauen können, sich beispielsweise jenseits ihres Spezialgebiets Datenbanken auch noch auskennen mit I/O-Feinheiten im Netz oder mit Sicherheitsproblemen. Doch solche Fachkräfte sind sehr rar, daran wird sich auf absehbare Zeit nichts ändern, und alle IT-Verantwortlichen sind damit beschäftigt, wie sie dem Problem beikommen können.

Früher gab es in den IT-Abteilungen eine nicht gerade feine Differenzierung: Wer auf sich hielt, arbeitete auf der Kommandozeile, der Rest – die Windows-Flanke – galt durchaus abwertend als „Mausschubser“. Heute sind in der Administration grafische Benutzeroberflächen normal. Nicht Zahlenkolonnen lösen Alarmzustände aus, sondern gelbe oder rote Zeichen. Ohne grafisch unterstützte Softwarewerkzeuge ließe sich der Arbeitsaufwand in der modernen IT gar nicht mehr schaffen.

Genau diese Grundüberlegungen sollten auch die Herangehensweise an Cloud Computing prägen. Eine Datenbank für große Informationsmengen in der Cloud so einzurichten, dass sie durchsatzstark und zuverlässig arbeitet, Cluster-Nodes nach Bedarf zu- oder abzuschalten, gelingt nicht „mit links“. Sie auch noch über mehrere Standorte so regional verteilt zu replizieren, dass ihre Verfügbarkeit gegeben ist, dann das Ganze nach außen sicher abzuschotten etc., würde schon eine IT-Mannschaft verlangen, deren Personalkosten den Preisvorteil der Cloud-Angebote zumindest deutlich relativieren.

Es bleibt also nichts anderes, als gerade für anspruchsvolle Aufgaben wie die Auslagerung des Datenbankbetriebs in die Cloud auf unterstützende Software zu setzen. Diese muss die notwendigen Arbeiten weitgehend automatisieren, die Aufgaben der IT-Kräfte auf den Feinschliff reduzieren. Heutige Datenbanken, egal ob Open Source oder proprietär, sind auf einem sehr hohen technischen Niveau, das durch Cloud Computing noch steigen wird.

Das Problem besteht nunmehr darin, dass viele Administratoren die Fülle der Eigenschaften von Datenbanken schon im hausinternen Betrieb kaum mehr auszuschöpfen vermögen. In der Cloud multipliziert sich das Problem um die dort gebotenen Dimensionen und Gefahren. Eine gewichtige Rolle dürfte künftig der Qualität von Software zukommen, die es erst ermöglichen, das Leistungsvermögen von Datenbanken auszuschöpfen – vor Ort wie in der Cloud. Das ist der Grund, warum SkySQL nicht mehr nur Consulting und Support für MySQL und den Fork MariaDB anbietet, sondern auch Softwarewerkzeuge zur Einrichtung und Optimierung von Datenbanken im Anwenderunternehmen wie in der Cloud.

www.skysql.com

Anzeige

Weitere Artikel

Newsletter
Newsletter Box

Mit Klick auf den Button "Jetzt Anmelden" stimme ich der Datenschutzerklärung zu.