Halbes Internet lahmgelegt

Cloudflare-Ausfall: Das war der Grund für die Riesen-Störung

Cloudflare
Bildquelle: Poetra.RH/Shutterstock.com

Cloudflare hatte mit einer massiven Störung zu kämpfen. Viele Internetdienste wie X, ChatGPT und Co. waren über Stunden nicht mehr zu erreichen. Das Unternehmen gab nun eine Stellungnahme ab und erklärt, worin letztlich das Problem lag. Ein Cyberangriff war es jedenfalls nicht.

Auf der Störungsplattform Downdetector überschlugen sich die Ereignisse. Erst war die Seite selbst nicht zu erreichen, später war sie wieder online. In der Zwischenzeit sind tausende Störungsmeldung gemeldet worden. Betroffen waren zahlreiche Dienste wie X, ChatGPT oder auch Claude. Die betroffenen Seiten waren zwischendurch immer mal wieder erreichbar. Die Probleme waren über Stunden nicht behoben. Später verkündete Cloudflare: “Eine Korrektur wurde vorgenommen, und wir gehen davon aus, dass das Problem nun behoben ist. Wir überwachen weiterhin, ob Fehler auftreten, um sicherzustellen, dass alle Dienste wieder normal funktionieren.”

Anzeige

Betroffene Nutzer erhielten eine Meldung, dass ein „interner Serverfehler im Netzwerk von Cloudflare“ aufgetreten sei. Darin wurden die Nutzer gebeten, „es in wenigen Minuten erneut zu versuchen“.

“Cloudflare ist sich eines Problems bewusst, das möglicherweise mehrere Kunden betrifft, und untersucht dieses derzeit. Weitere Details werden bekannt gegeben, sobald mehr Informationen verfügbar sind”, hieß es unmittelbar nach Auftauchen der Störung auf der Status-Website von Cloudflare.

Screenshot 2025 11 18 at 12 55 33 Cloudflare down Current problems and outages Downdetector


Zeitlicher Verlauf der Störung

  • 12:00 Uhr UTC: Beginn der Störung
  • 12:03 Uhr: Cloudflare bestätigt „interne Service-Beeinträchtigung”
  • 12:21 Uhr: Erste Erholungen der Dienste sichtbar, aber weiterhin hohe Fehlerraten
  • 12:37 Uhr: Untersuchungen dauern an
  • 12:53 Uhr: Weitere Untersuchungen
  • 13:04 Uhr: WARP-Zugang in London vorübergehend deaktiviert
  • 13:09 Uhr: Ursache identifiziert, Lösung wird implementiert
  • 13:13 Uhr: Cloudflare Access und WARP wiederhergestellt, WARP in London wieder aktiviert
  • 13:35 Uhr: Weiterhin Arbeiten an der Wiederherstellung für Anwendungsdienste
  • 13:58 Uhr: Fortsetzung der Wiederherstellungsarbeiten
  • 14:22 Uhr: Arbeit an der Lösung wird fortgesetzt
  • 14:34 Uhr: Dashboard-Dienste wiederhergestellt, Arbeiten an breiteren Anwendungsdiensten
  • 14:42 Uhr: Lösung implementiert, Vorfall als behoben erklärt, weitere Überwachung läuft

Cloudflare erklärt die Ursache

Cloudflare hat sich in einem ausführlichen Statement zu dem Vorfall geäußert und die genaue Ursache der Störung erläutert. „Wir entschuldigen uns zutiefst für diese Störung”, beteuert das Unternehmen.

Anzeige

Die Störung begann gegen 11:20 Uhr UTC. Cloudflare stellte klar: „Es gibt keine Hinweise auf einen Angriff oder böswillige Aktivitäten, die das Problem verursacht haben.” Stattdessen war „ein latenter Bug im Zusammenhang mit einer Konfigurationsdatei für unseren Bot-Management-Dienst” die Ursache.

Das Bot-Management-System ist ein kritischer Bestandteil des Datenverkehrs im Cloudflare-Netzwerk. „Die Bot-Management-Erkennung befindet sich im kritischen Pfad des Verkehrsflusses”, erklärte das Unternehmen. Aufgrund des Bugs „wuchs die Konfigurationsdatei über eine erwartete Anzahl von Einträgen hinaus. Dies löste einen Absturz im Softwaresystem aus, das den Datenverkehr für eine Reihe von Cloudflare-Diensten verarbeitet.”

Die Folge: „Kunden erhielten HTTP 500-Statuscode-Fehler, da viele Cloudflare-Dienste ausfielen.”

Das Cloudflare-Team reagierte nach eigenen Angaben schnell und „stellte eine frühere Version der Bot-Detection-Modul-Konfiguration wieder her, die unterhalb der Grenzwerte lag.” Zusätzlich wurde der Kern-Proxy-Dienst so modifiziert, dass er „nicht mehr auf diese Weise ausfallen wird, wenn Grenzwerte erneut erreicht werden.”

Newsletter
Newsletter Box

Mit Klick auf den Button "Jetzt Anmelden" stimme ich der Datenschutzerklärung zu.

Reaktionen aus der Branche

Ein einzelner Ausfall, Millionen Betroffene: „Der Cloudflare-Ausfall zeigt, wie stark das Internet von nur wenigen zentralen Infrastruktur-Anbietern abhängt. Wenn ein zentraler Netzdienst wie Cloudflare – der vor Millionen von Websites und Apps geschaltet ist – eine Störung hat, sind Kommunikation, Transaktionen und ganze digitale Dienste innerhalb von Minuten betroffen”, sagt etwa Benjamin Schilz, CEO der Kommunikationsplattform Wire, gegenüber it-daily.net. Das mache eines besonders deutlich: “Für jede Organisation ist es keine tragfähige Strategie mehr, sich für kritische Funktionen allein auf einen einzelnen Anbieter zu verlassen. Da in den vergangenen Wochen nicht nur Cloudflare, sondern auch große Anbieter wie AWS massive Ausfälle hatten, bedeutet echte Resilienz, wirkliche architektonische Alternativen zu haben und digitale Souveränität über die eigenen Kernprozesse zu gewinnen.”

Die Frage, die sich Führungskräfte seiner Meinung nach stellen sollten, laute daher nicht, ob der nächste große Ausfall kommt, sondern wie ihr Unternehmen funktionieren wird, wenn er eintritt. “Sich von dieser Hyperscaler-Monokultur zu lösen, ist die einzig logische Antwort.”

Was macht Cloudflare?

Cloudflare ist ein Internetinfrastruktur-Provider, der viele der Kerntechnologien bereitstellt, die die heutige Online-Welt ermöglichen. Dazu gehören beispielsweise Tools, die Websites vor Cyberangriffen schützen und sicherstellen, dass sie auch bei hohem Datenverkehr online bleiben.

Lars

Becker

Redakteur

IT Verlag GmbH

Anzeige

Weitere Artikel

Newsletter
Newsletter Box

Mit Klick auf den Button "Jetzt Anmelden" stimme ich der Datenschutzerklärung zu.