Deeskalationsmanagement ist essentiell für eine gesunde IT Infrastruktur

LabyrinthFriss oder stirb. So ergeht es Systemadministratoren, während sie die von allen Seiten auf sie einprasselnden Informationen und Anfragen bearbeiten. Helfen sollte ihnen dabei das IT Monitoring.

Doch falsch aufgesetzt kann es im schlimmsten Fall sogar zu noch mehr Stress führen. Entscheidend in dieser Situation: Ein durchdachtes Deeskalationsmanagement auf Basis smarter Alerts.

Anzeige

Beim Monitoring geht es um das Sammeln von Daten, mit deren Hilfe die zentralen IT-Systeme am Laufen gehalten werden sollen. Es steckt aber mehr dahinter, als man auf den ersten Blick meinen könnte. Monitoring lässt einen schnell mit Unmengen von Daten zurück, die so gut wie nichts aussagen – wenn man sie nicht richtig strukturiert.

Wichtiges Handwerkszeug für Admins sind dabei „Reports“ und „Alerts“. Beide helfen ihnen dabei, ein System funktionsfähig zu halten. Reports werden vor allem dazu genutzt, den Gesamtzustand eines Systems zu dokumentieren. Möchte ein Web Hosting Provider beispielsweise die Qualität seiner Services demonstrieren, kann er dafür einen Report seiner Monitoring-Lösung nutzen. Vorausgesetzt natürlich, dass das System so läuft, wie es sollte.

Reports erscheinen allerdings nicht automatisch in dem Moment, indem sie benötigt werden. Hinzu kommt: Zu viele IT-Probleme senken die Service-Qualität eines Unternehmens auf einen nicht mehr akzeptablen Level. Gefordert ist also ein Mechanismus, der dafür Sorge trägt, dass Systemadministratoren nach den ersten Indikatoren für Probleme so schnell wie möglich aktiv werden können. Ein Frühwarn-System ist gefragt – und hier kommen die Alerts ins Spiel. Sie erlauben es einem Systemadministrator, sich mit einem Thema zu befassen, bevor es zu einem Problem wird. Will ein Systemadministrator, dass die Reports auch wirklich ein gesundes System zeigen, kommt er um Alerts nicht herum.

Notwendig: Incident Management mit Eskalationspfaden

Zeitgemäße Monitoring Technologien geben Administratoren die Möglichkeit, automatische Alerts zu erhalten, wann immer ein Monitor ein Problem entdeckt. Das ist nichts Neues. Und auch die Tatsache, dass Systemadministratoren entscheiden können, ob sie den Alert per E-Mail, SMS oder Telefon erhalten möchten, ist nicht wirklich neu.

Interessant wird es, wenn es um das Thema Incident Management geht. Freilich, jede registrierte Störung muss angemessen gehandhabt werden. Deshalb ist ein durchdachter Eskalationspfad der erste Schritt, um zu gewährleisten, dass ein Alert zur richtigen Zeit die richtige Person erreicht. Wer möchte schon mitten in der Nacht einen Alert als Text-Nachricht erhalten, ohne die Möglichkeit zu haben, entsprechend zu reagieren? Das wäre eine Sackgasse im Eskalationspfad. Problematisch wird es vor allem, wenn der Vorfall einen Kernbestandteil des IT Systems betrifft. Systemadministratoren müssen sicherstellen, dass die richtige Person auf die richtige Weise alarmiert wird. Incident Management ist also essentiell – aber es muss noch mehr berücksichtigt werden.

Um den richtigen Eskalationspfad auswählen zu können, gilt es, Schwellenwerte zu definieren. Mit diesen kann das Monitoring System von sich aus jedem Problem einen Schweregrad zuweisen. Dieser hilft dabei zu bestimmen, ob ein Alert kritisch ist – oder ob er als einfache Warnung behandelt werden kann. Für manche Nutzer ist es dabei von höchster Bedeutung zu erfahren, dass ein Server nicht innerhalb eines bestimmten Zeitraums antwortet. Für andere Nutzer hingegen ist es geschäftskritisch, wenn bestimmte Seitenelemente nicht zuverlässig laden. Wieder andere möchten wissen, ob die Auslastung des Arbeitsspeichers eines Systems einen festgelegten Schwellenwert überschreitet. Schwellenwerte müssen individuell festgelegt werden.

Widersprüchliche Alerts vermeiden

Jeder Systemadministrator wird bestätigen: Inkonsistente oder widersprüchliche Alerts frustrieren genauso wie fehlende Ergebnisse. Die Lösung besteht darin, mehrere Monitoring Orte zu definieren, um so umfassendere Informationen zu erhalten. Dank mehrerer Mess-Stellen lassen sich die Informationen besser einordnen und evaluieren. Und natürlich ist es wichtig sicherzustellen, dass das gleiche Problem nicht von mehreren Mitarbeitern parallel bearbeitet wird. Wenn ein Alert an mehrere Empfänger gesendet wird, kommt es darauf an, alle involvierten Personen zu informieren, sobald sich jemand diesem Problem annimmt. Jeder muss über den aktuellen Status informiert werden, so dass unnötige Aufgabenwiederholungen vermieden werden können.

Monitoring bleibt also eine der Schlüsselaufgaben für Systemadministratoren und IT Manager. Das Set-up und die richtige Priorisierung sind dabei genauso Erfolgskriterien wie ein effizientes Störungsmanagement, die Nutzung von Schwellenwerten und smarte Alerts. Richtig angewendet, macht das Monitoring einen gewaltigen Unterschied für das Unternehmen – und auch den einzelnen Administrator.

Ralph Eck, General Manager bei Monitis

www.monitis.com

Anzeige

Weitere Artikel

Newsletter
Newsletter Box

Mit Klick auf den Button "Jetzt Anmelden" stimme ich der Datenschutzerklärung zu.