Die PaaS-Plattform Railway erlitt einen schweren Ausfall, nachdem Google Cloud das Konto des Millionen-Kunden ohne Vorwarnung temporär gesperrt hatte.
Der US-amerikanische Cloud-Anbieter Google Cloud steht in der Kritik, nachdem er das Benutzerkonto seines Großkunden Railway.com ohne ersichtlichen Grund und ohne vorherige Warnung temporär gesperrt hat. Die Sperrung löste eine großflächige Störung bei der Platform-as-a-Service-Plattform aus. Railway automatisiert die Bereitstellung von Softwarecode, indem Repositories der Plattform GitHub direkt in eine lauffähige Cloud-Infrastruktur überführt werden. Durch die Kontosperrung seitens Google war dieser automatisierte Prozess über mehrere Stunden hinweg blockiert, was zu erheblichen Ausfällen bei den Kunden von Railway führte.
Infrastrukturen von Railway scheinbar gelöscht
Die Störung begann am späten Abend des 19. Mai 2026 gegen 22:00 Uhr koordinierter Weltzeit. In den internen Überwachungssystemen von Railway zeichnete sich ab, dass die Infrastrukturressourcen scheinbar gelöscht worden waren und im System nicht mehr existierten. Wie sich später herausstellte, hatte Google das gesamte Konto gesperrt, wodurch alle hinterlegten Ressourcen unsichtbar wurden. Auf der offiziellen Statusseite des Unternehmens wurde die großflächige Dienstunterbrechung dokumentiert. Kunden, die versuchten, auf ihre Anwendungen oder das Dashboard zuzugreifen, erhielten Fehlermeldungen wie no healthy upstream oder unconditional drop overload. Zudem traten weitreichende Anmeldefehler auf, und der Zugriff auf das zentrale Verwaltungs-Dashboard was vollständig blockiert.
Infrastrukturelle Abhängigkeit trotz teilweiser Abkehr von Google
Der Vorfall trifft Railway nicht zum ersten Mal in der Unternehmensgeschichte. Bereits im Jahr 2024 traf das Management die strategische Entscheidung, einen Großteil der physischen Infrastruktur aus der Google Cloud abzuziehen und in eigene Colocation-Rechenzentren zu verlagern. Grund dafür waren wiederholte technische Probleme seitens Google, die von Railway als existentielles Risiko für das eigene Geschäftsmodell eingestuft wurden. Weitere Ausfälle bei Google Cloud im Jahr 2025 beeinträchtigten die Dienste von Railway erneut. Trotz dieser Migrationsschritte verblieben die zentrale Steuerungsebene, das sogenannte Control Plane, sowie geschäftskritische Datenbanken in der Cloud-Infrastruktur von Google. Für diese verbliebenen Ressourcen zahlt Railway nach eigenen Angaben eine jährliche Summe im achtstelligen Dollarbereich an Google Cloud.
Verzögerungen im Support von Google
Laut Angelo Saraceno, einem Solutions Engineer bei Railway, herrschte auch bei den direkten Ansprechpartnern innerhalb von Google zunächst Unklarheit über die Ursache der Sperrung. Obwohl das Unternehmen einen Millionenbetrag für die Infrastruktur aufwendet, dauerte es nach dem Beginn der Störung rund eine Stunde, bis das Support-Team von Google aktiv in den Klärungsprozess eingriff. Das Management von Railway eskalierte den Vorfall direkt bei den Verantwortlichen von Google. Intern wird vermutet, dass ein automatisierter Prüfalgorithmus von Google fälschlicherweise eine Sicherheits- oder Durchsetzungsregel getriggert hat, was die automatische Sperrung des gesamten Kontos zur Folge hatte. Cloud-Anbieter behalten sich das Recht vor, Konten bei unbezahlten Rechnungen oder missbräuchlicher Nutzung zu blockieren, tun dies in der Regel jedoch erst nach einer schriftlichen Vorwarnung.
Erste Fortschritte bei Wiederherstellung
Der unangekündigte Vorfall reiht sich in eine Serie von unbegründeten Kontolöschungen durch Google Cloud ein. Ein prominenter Präzedenzfall ereignete sich im Jahr 2024, als Google versehentlich die gesamte gemietete Cloud-Infrastruktur des australischen Pensionsfonds UniSuper unwiderruflich löschte, was ebenfalls zu einem tagelangen Totalausfall führte. Der aktuelle Fall bei Railway unterstreicht die Risiken, die durch die Konzentration digitaler Steuerungsebenen bei einzelnen Hyperscalern entstehen. Trotz der Tatsache, dass die Ursache der Störung vollständig im Verantwortungsbereich von Google lag, veröffentlichte Railway umfassende Entschuldigungen an seine Kunden. Das Unternehmen betonte, dass Endkunden primär die Verfügbarkeit der gebuchten PaaS-Dienste bewerten und die interne Infrastrukturkette für den operativen Ausfall unerheblich ist.
In den frühen Morgenstunden des 20. Mai 2026 meldete das System erste Fortschritte bei der Wiederherstellung der blockierten Dienste. Gegen 03:05 Uhr Weltzeit liefen die ersten Workloads wieder stabil im Netz. Das Unternehmen teilte mit, dass die Bereitstellung für Enterprise-Kunden von dem Ausfall weitgehend unbeeinflusst blieb oder vorrangig wiederhergestellt wurde. Bei normalen Konten ohne Enterprise-Status blieb die Bereitstellung von neuem Softwarecode hingegen vorerst pausiert, während die Systeme schrittweise hochgefahren wurden. Eine offizielle Stellungnahme von Google Cloud zu den genauen technischen oder administrativen Beweggründen der Sperrung steht derzeit noch aus.