Steigende Cloud-Komplexität im Blick behalten

Dynamische, flexible und individuelle Cloud-Umgebungen sind längst klarer Wettbewerbsfaktor für Unternehmen und ihre Services. IT-Verantwortliche haben damit die Chance, Neuerungen voranzutreiben, die sich direkt auf die Unternehmensprozesse und damit auf das Unternehmen, Geschäftsmodelle und die Umsatzgenerierung auswirken. 

Mit wachsender Komplexität der Cloud-Infrastruktur steigt aber auch die Anforderung, diese im Blick zu behalten.

Anzeige

Moderne Cloud-Infrastrukturen und -Plattformen beschleunigen den Service, den Unternehmen intern wie extern anbieten können. Modulare, individuell zugeschnittene Best-of-Breed- Kombinationen aus gehosteten Cloud Services und Open Source-Komponenten entlasten Operations und Entwickler. Neue Technologien, wie Container, Microservices oder Serverless, steigern die Flexibilität und lassen monolithische Strukturen alt aussehen, während automatisierte Build-Test-Deploy-Zyklen im API-zentrierten Cloud-Umfeld für fehlerfreie Prozesse sorgen.

Schöne neue Welt! Doch um das volle Potenzial moderner Cloud-Infrastrukturen abzurufen, müssen auch Management- und Monitoring-Ansätze neu gedacht werden. Die Zahl möglicher Migrationsstrategien ist ebenso vielschichtig wie die Anforderungen, die jedes einzelne Unternehmen an seine IT-Systeme stellt. Die Spanne reicht von radikalen „Lift-and-Shift“ bis hin zu dedizierten Migrationsstrategien. Ob das Infrastructur-as-Code-basierte Management von Cloud Ressourcen und -Services im Einzelfall jedoch wirklich hält, was sich Unternehmen versprechen, kann lediglich ein übergreifendes Monitoring beantworten. Nur wer Performance und Auslastung unmittelbar und umfassend messen und beurteilen kann, stellt sicher, dass jede Komponente eines heterogenen Cloud-Stacks richtig performt und die Kosten im Rahmen bleiben.

In der Cloud sind alle gleich

Jedes Unternehmen hat in der Cloud dieselben Startbedingungen. Damit wächst der Druck, sich stetig weiterzuentwickeln und die Performance der eigenen Infrastruktur hochzuhalten, um am Markt bestehen zu können. Neue Technologien ergeben neue Komplexitäten. Gerade große, etablierte Unternehmen verlassen damit nicht selten ihre vertrauten „All-Inclusive-Umgebungen“ und betreten eine heterogene Welt aus verschiedensten Cloud-Anbietern, Open Source- Ökosystemen und verschiedensten Dienstleistern.

Die Verwaltung dieser komplexen neuen Welt ist mit den Tools der alten Welt kaum möglich. IT-Verantwortliche, die fehlerhafte Workflows sowie akute Lastprobleme nicht erkennen, laufen Gefahr, statt Kosteneinsparungen zusätzliche Ressourcen-Aufwände zu generieren. Ein Risiko, das nicht unterschätzt werden darf; ist die Performance heterogener Cloud-Stacks erst einmal im Keller, geht es nicht mehr um die Erreichung von Geschäftszielen, sondern um akute Brandlöschung.

Und auch wenn die großen Cloud-Anbieter natürlich leistungsstarke Konsolen und Management-Tools für ihre Services anbieten, so scheitern diese doch allzu häufig bei der Integration beliebter Open Source- und Cloud-Anwendungen in heterogenen und hybriden Umgebungen. Deshalb funktioniert das Monitoring in diesem Umfeld nur dann wirklich gut, wenn die eingesetzte Lösung breit aufgestellt ist und zahlreiche Cloud-Module integriert oder die erforderlichen APIs bei Bedarf selbst bauen kann. Die spezifischen Eigenschaften des eigenes Ökosystems müssen unbedingt berücksichtigt werden. Apps und Anwendungen, unterschiedliche Cloud-Provider, Internet-of-Things- Umgebungen, wechselnde Container-Technologien, mannigfaltige Endgeräte und Hardware – die Auslastung all dieser Elemente muss die IT-Abteilung zu jeder Zeit erfassen und interpretieren können. Geschieht dies nicht, können sie Prozessfehler, Schnittstellenprobleme oder die Einbindung falscher Komponenten nicht schnell genug erkennen. Das Ergebnis sind Performance-Einbrüche, Bereitstellungsprobleme oder – im schlimmsten Fall – komplette Downtimes.

Systemgesundheit im Blick behalten

Cloud Monitoring, das heißt heute vor allem große Datenmengen zu sammeln und bewertbar zu machen. Für den Anwender müssen sie dabei vor allem verständlich, hinreichend granular – sprich nicht zu kleinteilig, nicht zu breit – und langlebig sein. Die langlebige Aufbewahrung aller Messwerte in ihrer ursprünglichen Qualität hilft, aktuelle Daten auch immer im Verhältnis zur Vergangenheit betrachten zu können. Denn grundsätzlich erfassen diese Daten immer einen Ist-Zustand. Sie geben also Auskunft über den Systemzustand zu einem bestimmten Zeitpunkt. Oft braucht es für eine zielführende Bewertung aber einen Vergleichswert. Grob lassen sich Monitoring-Metriken in Arbeitskennzahlen (Work Metrics) und Ressourcenkennzahlen (Ressource Metrics) unterscheiden.

Die Arbeitskennzahlen liefern den Gesamtüberblick. Funktioniert das System? Stimmen Geschwindigkeit und Qualität? Wie sieht es mit der Auslastung aus? Und wo werden Fehler gemeldet? Performancekennzahlen quantifizieren außerdem die Effizienz der einzelnen Komponenten.

Ressourcenkennzahlen auf der anderen Seite helfen, die unterschiedlichen Systeminfrastrukturbestandteile und ihre Nutzung detailliert zu betrachten und Probleme zu identifizieren. Probleme können zum Beispiel die Nichtbedienung einer Anfrage durch eine Ressource sein, ihre Verfügbarkeit, ihre Auslastung oder generell Fehlfunktionen. Aber auch singuläre Ereignisse, sogenannte Events, sollten Firmen im Blick behalten. Nur so können sie systemkritische Prozesse und  Veränderungen (etwa Code Releases oder neue Technologien) amSystem erkennen, ebenso wie Fehlermeldungen oder wichtige Alerts auf Drittsystemen.

Newsletter
Newsletter Box

Mit Klick auf den Button "Jetzt Anmelden" stimme ich der Datenschutzerklärung zu.

Gut gerüstet für die Zukunft

Die Daten einer optimal verwalteten, gut überwachten Cloud-Umgebung erlauben auch die Vorhersage möglicher Performance- oder Downtime-Risiken Tage, Wochen oder Monate im Voraus. Dabei bewerten Machine Learning-Algorithmen kontinuierlich die Kennzahlenentwicklung und verfeinern mit jedem zusätzlichen Datensatz (gerne auch von extern) ihre Diagnose beziehungsweise Prognose.

Eine gut geführte Cloud-Anwendung bietet Unternehmen unterschiedlichste Chancen, Innovationen voranzutreiben, stetig auf Marktveränderungen zu reagieren und der Konkurrenz eine Nasenlänge voraus zu sein. Zugleich ist sie allerdings auch ein komplexes Umfeld, das ohne durchdachte Strategie und die passenden Tools unüberschaubar werden kann. Bei der Entwicklung von Cloud-Management-Strategien müssen Unternehmen ein anpassungsfähiges Monitoring  deshalb vomersten Moment an mitdenken.

Stefan

Marx

Datadog -

Director Product Management EMEA

Marx ist seit über 20 Jahren in der IT-Entwicklung und -Beratung tätig. In den vergangenen Jahren arbeitete er mit verschiedenen Architekturen und Techniken wie Java Enterprise Systemen und spezialisierten Webanwendungen. Seine Tätigkeitsschwerpunkte liegen in der Planung, dem Aufbau und dem Betrieb der Anwendungen mit Blick auf die Anforderungen und Problemstellungen hinter den konkreten
Anzeige

Weitere Artikel

Newsletter
Newsletter Box

Mit Klick auf den Button "Jetzt Anmelden" stimme ich der Datenschutzerklärung zu.