Valider Blick in die Zukunft| Predictive Maintenance und Operations

5. Juli, 2016
17:05

Stillstände und Wartungsausfälle sind Gift für die Effizienz und den Betrieb von Rechenzentren. Mit vorausschauender Wartung optimieren Betreiber Ihre IT. Die Kristallkugel auf den historischen Jahrmärkten ist den IT-Domänen „Analytics“ und „Business Intelligence“ gewichen.

Klassisch genutzt werden sie zur Auswertung meist historischer Datenreihen, um Lehren aus der Vergangenheit zu ziehen und zu erklären, warum die Dinge sind wie sie sind. Heute treten ihre Nachfolger aus dem Bereich „Data Science“ an, dem sagenumwobenen Orakel von Delphi Konkurrenz zu machen und einen validen Blick in die Zukunft zu werfen. Die hierfür genutzten mathematischen und analytischen Funktionen gibt es glücklicherweise nicht nur am siebten Tag eines Monats, und sie legen im Winter auch keine Pause ein, wie das große Vorbild aus der griechischen Antike.

Die einfachste Form einer Analyse ist die reine Statistik – gängige Kennzahlen werden erfasst und gemäß ihrer Häufigkeit grafisch dargestellt. Ein deutlich höherer Informationsgehalt lässt sich durch das Einführen zusätzlicher Dimensionen erreichen.

Hierbei handelt es sich um klassische Data-Warehouse-Techniken (OLAP = Online Analytical Processing). Den höchsten Erkenntniswert liefert jedoch die vorausschauende Analyse, die das künftige Verhalten von Systemen anhand von Mustern und Modellen prognostiziert, die sich meist aus der Kombination mehrerer, teils historischer Einflussfaktoren speisen. Dabei ist die Wirksamkeit der Vorhersage abhängig von der Qualität der Datengrundlage und des verwendeten Modells. Der Drei-Tage-Wetterbericht ist deshalb verlässlicher, weil das Datenmodell hierfür ausreichend komplex und zuverlässig ist, während die langfristige Wetterprognose an vielen „Unberechenbarkeiten“ leidet.

Vorausschauende Wartung

Auch in Rechenzentren und in der IT halten diese Verfahren zunehmend Einzug. Im Zentrum stehen beispielsweise Vorhersagemodelle für die vorausschauende Wartung („Predictive Maintenance“), um Störungen sowohl im Bereich Gebäudemanagement als auch der IT zu vermeiden, während gleichzeitig die Wartungsintervalle anhand des tatsächlichen Bedarfs optimiert werden.

„Es ist wichtig Falschmeldungen durch intelligente Mustererkennung zu identifizieren und von echten potenziellen Ausfällen zu unterscheiden.“

Oliver Lindner, Business Line Manager Data Center Infrastructure Management, FNT GmbH

Ein Beispiel: Filter von Klimageräten verschmutzen nicht gleichmäßig, sondern abhängig vom Staubgehalt der Luft. Hier sind Rechenzentren mit freier Kühlung in städtischen Bereichen (oder in der Nähe zu aktiven Vulkanen, Wüstengebieten etc.) im Nachteil gegenüber klassischen, isolierten Innenräumen. Deshalb ist es nicht sinnvoll, für beide Szenarien das gleiche zeitliche Raster für den Tausch oder die Reinigung der Filter in einem Wartungsvertrag festzuschreiben, sondern die Arbeiten abhängig vom Bedarf durchzuführen. Analog zu den Filtern sind natürlich auch Wartungsintervalle von Batterien der USV-Anlage, Pumpen, Generatoren und andere RZKomponenten automatisiert anpassbar. Da es andererseits nicht hilfreich ist, so lange darauf zu warten, bis der Filter vollkommen verstopft ist und das Gerät seinen Betrieb einstellt, muss der richtige Zeitpunkt unter Berücksichtigung des Vorlaufs für die Wartungsplanung vorherberechnet werden.

Neben einfachen Ansätzen wie „Laufzeit“ (Betriebsstunden) gibt es auch fortschrittlichere und zuverlässigere Verfahren, die aus aktuellen Messdaten und Vergleichen Rückschlüsse auf den aktuellen Zustand ziehen: Ein verstopfter Filter bedeutet in seiner Konsequenz ja einen zu geringen Luftdurchsatz, was sich leicht erkennen lässt, wenn ein angepasster Algorithmus die Drehzahl der Lüfter und die tatsächlich erzeugte Luftmenge über deren Geschwindigkeit vergleicht. Für die Vorhersage von Veränderungen stellen Veränderungen selbst wieder die Basis dar, da die Systeme teilweise selbstlernend sind (Stichwort: Machine Learning) und immer mehr Einflussfaktoren in die Modelle aufgenommen werden können.

Valide Aussagen treffen

Da die geplanten Einsatzzeiten für RZ-Geräte, wie Lüfter, Klimaanlagen, Stromaggregate und USV etc., gerade im Gebäudemanagement über einen längerfristigen Zeitraum ausgelegt sind, rechnet sich dort die Wartungsvorhersage. Jedoch auch bei klassischen IT-Assets, wie Server, Switches, Router und Storage, die in der Regel für einen kurzfristigeren Einsatz ausgelegt sind, macht eine Überwachung und die intelligente, auf Mustererkennung basierte Vorhersage, potenzieller Ausfälle Sinn. Gerade hier ist es wichtig Falschmeldungen durch intelligente Mustererkennung zu identifizieren und von echten potenziellen Ausfällen zu unterscheiden. Diese können dann im Rahmen einer Ursache- Wirkungsanalyse bis zum betroffenen Service nachverfolgt werden. So können Anomalien durch Mustererkennung erkannt und bedarfsorientiert betroffene Geräte ausgetauscht werden, bevor der IT-Service betroffen ist.

Um eine valide Vorhersage machen zu können, müssen die entsprechenden Geräte und IT-Assets hinsichtlich der messbaren Einflussfaktoren überwacht werden. Die gesammelten Daten können dann in entsprechenden Softwarelösungen korreliert und analysiert werden. Wird eine Anomalie erkannt und eine Vorhersage getroffen, dann müssen natürlich die zu überwachenden Geräte und deren Zusammenwirken bekannt sein, um im Rahmen der Ursache-Wirkungsanalyse auch zu erkennen, welche IT-Services letztendlich betroffen sein werden.

Werkzeuge für die Überwachung und die Verwaltung aller Facility- und IT-Assets liefert beispielsweise FNT Software mit seiner DCIM-Lösung, die mit FNT Command und FNT Monitoring den gesamten Managementprozess abdeckt – angefangen bei der Planung und Verwaltung bis hin zur Überwachung der gesamten RZ-Infrastruktur In der Software werden alle Geräte- und Messdaten zentral verwaltet, welche dann beispielsweise mit der Vorhersagesoftware Predictive Intelligence von IS Predict zu einer ganzheitlichen Vorhersagelösung im Rechenzentrum kombiniert werden können.

Bild: Dashboard von FNT Monitoring mit priorisierten Alarmen.

Fazit

Der große Nutzen von „Predictive Maintenance“ ist das Erkennen von heraufziehenden technischen Problemen, bevor es zu einem Stillstand kommt. Gegenüber periodischen Wartungen ergeben sich sowohl eine Reduktion der Ausfallzeiten als auch kürzere Zeitspannen, in denen die Anlagenteile im Wartungsmodus inaktiv sind. Gleichzeitig sinken die Wartungskosten deutlich, wenn man sich auf die erforderlichen Maßnahmen beschränkt und weniger Ersatzteile beschaffen muss. Auch die Ausfälle der IT-Geräte und die Einhaltung der Service Level Agreements werden deutlich optimiert.

Durch die zunehmende intelligente Vernetzung aller Geräte im RZ ist davon auszugehen ist, dass solche Verfahren in nicht allzu ferner Zukunft zunehmend zum Stand der Technik werden. Das ist in jedem Fall eine gute Nachricht, denn derart effizient gewartete Rechenzentren könnten sich zunehmend den wirklich wichtigen Aufgaben widmen: Etwa der vorausschauenden Berechnung einer zuverlässigen 14-Tage-Wetterprognose.

Oliver Lindner, Business Line Manager Data Center Infrastructure Management, FNT GmbH

www.fntsoftware.com

Den Artikel finden Sie auch in it management März 2016 auf S. 32 und 33.

Das könnte Sie ebenfalls interessieren:
Whitepaper: Die Cores erwachen (kostenlos)

Valider Blick in die Zukunft| Predictive Maintenance und Operations

Vorausschauende Wartung

Valide Aussagen treffen

Fazit

Weitere Artikel

Meistgelesene Artikel

Hacker-Angriff: IT-Totalausfall bei Medizintechnik-Riesen Stryker

ChatGPT-Deinstallationen steigen um 295 % nach Pentagon-Deal

Claude down: Störungs-Meldungen schnellen hoch

Amazon-Störung: Checkout in Europa stundenlang nicht erreichbar

OpenClaw-Gründer rechnet nach OpenAI-Wechsel mit Europa ab

IT Verlag

Wichtige Links

Kontakt