Valider Blick in die Zukunft| Predictive Maintenance und Operations

KristallkugelStillstände und Wartungsausfälle sind Gift für die Effizienz und den Betrieb von Rechenzentren. Mit vorausschauender Wartung optimieren Betreiber Ihre IT. Die Kristallkugel auf den historischen Jahrmärkten ist den IT-Domänen „Analytics“ und „Business Intelligence“ gewichen.

Klassisch genutzt werden sie zur Auswertung meist historischer Datenreihen, um Lehren aus der Vergangenheit zu ziehen und zu erklären, warum die Dinge sind wie sie sind. Heute treten ihre Nachfolger aus dem Bereich „Data Science“ an, dem sagenumwobenen Orakel von Delphi Konkurrenz zu machen und einen validen Blick in die Zukunft zu werfen. Die hierfür genutzten mathematischen und analytischen Funktionen gibt es glücklicherweise nicht nur am siebten Tag eines Monats, und sie legen im Winter auch keine Pause ein, wie das große Vorbild aus der griechischen Antike.

Anzeige

Die einfachste Form einer Analyse ist die reine Statistik – gängige Kennzahlen werden erfasst und gemäß ihrer Häufigkeit grafisch dargestellt. Ein deutlich höherer Informationsgehalt lässt sich durch das Einführen zusätzlicher Dimensionen erreichen.

Hierbei handelt es sich um klassische Data-Warehouse-Techniken (OLAP = Online Analytical Processing). Den höchsten Erkenntniswert liefert jedoch die vorausschauende Analyse, die das künftige Verhalten von Systemen anhand von Mustern und Modellen prognostiziert, die sich meist aus der Kombination mehrerer, teils historischer Einflussfaktoren speisen. Dabei ist die Wirksamkeit der Vorhersage abhängig von der Qualität der Datengrundlage und des verwendeten Modells. Der Drei-Tage-Wetterbericht ist deshalb verlässlicher, weil das Datenmodell hierfür ausreichend komplex und zuverlässig ist, während die langfristige Wetterprognose an vielen „Unberechenbarkeiten“ leidet.

Vorausschauende Wartung

Auch in Rechenzentren und in der IT halten diese Verfahren zunehmend Einzug. Im Zentrum stehen beispielsweise Vorhersagemodelle für die vorausschauende Wartung („Predictive Maintenance“), um Störungen sowohl im Bereich Gebäudemanagement als auch der IT zu vermeiden, während gleichzeitig die Wartungsintervalle anhand des tatsächlichen Bedarfs optimiert werden.

Oliver LindnerEs ist wichtig Falschmeldungen durch intelligente Mustererkennung zu identifizieren und von echten potenziellen Ausfällen zu unterscheiden.

Oliver Lindner, Business Line Manager Data Center Infrastructure Management, FNT GmbH

Ein Beispiel: Filter von Klimageräten verschmutzen nicht gleichmäßig, sondern abhängig vom Staubgehalt der Luft. Hier sind Rechenzentren mit freier Kühlung in städtischen Bereichen (oder in der Nähe zu aktiven Vulkanen, Wüstengebieten etc.) im Nachteil gegenüber klassischen, isolierten Innenräumen. Deshalb ist es nicht sinnvoll, für beide Szenarien das gleiche zeitliche Raster für den Tausch oder die Reinigung der Filter in einem Wartungsvertrag festzuschreiben, sondern die Arbeiten abhängig vom Bedarf durchzuführen. Analog zu den Filtern sind natürlich auch Wartungsintervalle von Batterien der USV-Anlage, Pumpen, Generatoren und andere RZKomponenten automatisiert anpassbar. Da es andererseits nicht hilfreich ist, so lange darauf zu warten, bis der Filter vollkommen verstopft ist und das Gerät seinen Betrieb einstellt, muss der richtige Zeitpunkt unter Berücksichtigung des Vorlaufs für die Wartungsplanung vorherberechnet werden.

Neben einfachen Ansätzen wie „Laufzeit“ (Betriebsstunden) gibt es auch fortschrittlichere und zuverlässigere Verfahren, die aus aktuellen Messdaten und Vergleichen Rückschlüsse auf den aktuellen Zustand ziehen: Ein verstopfter Filter bedeutet in seiner Konsequenz ja einen zu geringen Luftdurchsatz, was sich leicht erkennen lässt, wenn ein angepasster Algorithmus die Drehzahl der Lüfter und die tatsächlich erzeugte Luftmenge über deren Geschwindigkeit vergleicht. Für die Vorhersage von Veränderungen stellen Veränderungen selbst wieder die Basis dar, da die Systeme teilweise selbstlernend sind (Stichwort: Machine Learning) und immer mehr Einflussfaktoren in die Modelle aufgenommen werden können.

Valide Aussagen treffen

Da die geplanten Einsatzzeiten für RZ-Geräte, wie Lüfter, Klimaanlagen, Stromaggregate und USV etc., gerade im Gebäudemanagement über einen längerfristigen Zeitraum ausgelegt sind, rechnet sich dort die Wartungsvorhersage. Jedoch auch bei klassischen IT-Assets, wie Server, Switches, Router und Storage, die in der Regel für einen kurzfristigeren Einsatz ausgelegt sind, macht eine Überwachung und die intelligente, auf Mustererkennung basierte Vorhersage, potenzieller Ausfälle Sinn. Gerade hier ist es wichtig Falschmeldungen durch intelligente Mustererkennung zu identifizieren und von echten potenziellen Ausfällen zu unterscheiden. Diese können dann im Rahmen einer Ursache- Wirkungsanalyse bis zum betroffenen Service nachverfolgt werden. So können Anomalien durch Mustererkennung erkannt und bedarfsorientiert betroffene Geräte ausgetauscht werden, bevor der IT-Service betroffen ist.

Um eine valide Vorhersage machen zu können, müssen die entsprechenden Geräte und IT-Assets hinsichtlich der messbaren Einflussfaktoren überwacht werden. Die gesammelten Daten können dann in entsprechenden Softwarelösungen korreliert und analysiert werden. Wird eine Anomalie erkannt und eine Vorhersage getroffen, dann müssen natürlich die zu überwachenden Geräte und deren Zusammenwirken bekannt sein, um im Rahmen der Ursache-Wirkungsanalyse auch zu erkennen, welche IT-Services letztendlich betroffen sein werden.

Werkzeuge für die Überwachung und die Verwaltung aller Facility- und IT-Assets liefert beispielsweise FNT Software mit seiner DCIM-Lösung, die mit FNT Command und FNT Monitoring den gesamten Managementprozess abdeckt – angefangen bei der Planung und Verwaltung bis hin zur Überwachung der gesamten RZ-Infrastruktur In der Software werden alle Geräte- und Messdaten zentral verwaltet, welche dann beispielsweise mit der Vorhersagesoftware Predictive Intelligence von IS Predict zu einer ganzheitlichen Vorhersagelösung im Rechenzentrum kombiniert werden können.

FNT Monitoring Dashboard

Bild: Dashboard von FNT Monitoring mit priorisierten Alarmen.

Fazit

Der große Nutzen von „Predictive Maintenance“ ist das Erkennen von heraufziehenden technischen Problemen, bevor es zu einem Stillstand kommt. Gegenüber periodischen Wartungen ergeben sich sowohl eine Reduktion der Ausfallzeiten als auch kürzere Zeitspannen, in denen die Anlagenteile im Wartungsmodus inaktiv sind. Gleichzeitig sinken die Wartungskosten deutlich, wenn man sich auf die erforderlichen Maßnahmen beschränkt und weniger Ersatzteile beschaffen muss. Auch die Ausfälle der IT-Geräte und die Einhaltung der Service Level Agreements werden deutlich optimiert.

Durch die zunehmende intelligente Vernetzung aller Geräte im RZ ist davon auszugehen ist, dass solche Verfahren in nicht allzu ferner Zukunft zunehmend zum Stand der Technik werden. Das ist in jedem Fall eine gute Nachricht, denn derart effizient gewartete Rechenzentren könnten sich zunehmend den wirklich wichtigen Aufgaben widmen: Etwa der vorausschauenden Berechnung einer zuverlässigen 14-Tage-Wetterprognose.

Oliver Lindner, Business Line Manager Data Center Infrastructure Management, FNT GmbH

www.fntsoftware.com

Den Artikel finden Sie auch in it management März 2016 auf S. 32 und 33.

Das könnte Sie ebenfalls interessieren:
Whitepaper: Die Cores erwachen (kostenlos)
 

Anzeige

Weitere Artikel

Newsletter
Newsletter Box

Mit Klick auf den Button "Jetzt Anmelden" stimme ich der Datenschutzerklärung zu.