Amazon Web Services hat eine neue Funktion zur automatisierten Erstellung von Störungsberichten vorgestellt. Das bemerkenswerte Timing: Die Ankündigung erfolgte in derselben Woche, in der der massive Ausfall der eigenen Cloud-Infrastruktur zahlreiche Kunden beeinträchtigte.
Der Cloud-Anbieter hat seinen CloudWatch-Dienst um ein Feature erweitert, das Unternehmen bei der Analyse und Dokumentation von Incidents unterstützen soll. CloudWatch wird von AWS als Werkzeug zur Echtzeitüberwachung von Anwendungsperformance, Betriebszustand und Ressourcenauslastung positioniert.
Incident-Reports in Minuten statt Stunden
Die am Mittwoch angekündigte Neuerung ermöglicht die interaktive Generierung umfassender Post-Incident-Analyseberichte innerhalb weniger Minuten. Das System erfasst und korreliert automatisch Telemetriedaten, Benutzereingaben und während der Untersuchung durchgeführte Maßnahmen.
Laut AWS können Anwender mit der Funktion automatisch wichtige Betriebstelemetrie, Service-Konfigurationen und Untersuchungsergebnisse zusammenführen. Die generierten Berichte umfassen Executive Summaries, Ereignis-Zeitstrahlen, Impact-Analysen und Handlungsempfehlungen. AWS zufolge sollen diese Reports dabei helfen, Muster zu identifizieren, Präventivmaßnahmen umzusetzen und die operative Aufstellung durch strukturierte Nachbetrachtungen kontinuierlich zu verbessern.
Fragwürdiger Zeitpunkt der Veröffentlichung
Bemerkenswert ist der Zeitpunkt der Ankündigung: Nur Tage zuvor hatte ein schwerwiegender DNS-Fehler diverse Online-Services beeinträchtigt. Vermutlich hätten zahlreiche AWS-Kunden das neue Tool während dieser Krise nutzen können.
Die neue CloudWatch-Funktion steht AWS-Nutzern ab sofort zur Verfügung.