Wenn der autonome Assistent zu viel darf

AWS-Ausfälle durch KI-Coding-Tool Kiro?

AWS
Bildquelle: Michael Vi /Shutterstock.com

Amazons eigene KI-Werkzeuge haben angeblich mindestens zweimal für Störungen in der Cloud-Infrastruktur gesorgt, ein 13-stündiger Ausfall inklusive.

Amazon Web Services (AWS) hat in den vergangenen Monaten mindestens zwei Ausfälle erlitten, die auf den Einsatz eigener KI-gestützter Entwicklungswerkzeuge zurückzuführen sind. Das berichtet die Financial Times unter Berufung auf mehrere mit der Sache vertraute Personen bei Amazon. AWS widerspricht dem vehement und nennt die Berichterstattung ungenau.

Anzeige

Im Mittelpunkt steht Kiro, ein autonomer Entwicklungsagent, den AWS im Juli vorgestellt hatte. Das Tool soll laut Amazon „kontinuierlich über Entwicklungs- und Betriebsprozesse hinweg denken, ausführen und verfeinern” können, und zwar mit minimalem menschlichem Eingriff. Wie sich zeigt, kann genau das zum Problem werden.

13 Stunden Ausfall nach KI-Eingriff

Mitte Dezember kam es zu einer 13-stündigen Unterbrechung des AWS Cost Explorer, einem Dienst zur Verwaltung und Visualisierung von Cloud-Kosten. Der Auslöser war simpel: Ein Ingenieur hatte Kiro beauftragt, bestimmte Änderungen vorzunehmen. Das Tool entschied daraufhin eigenständig, die betreffende Umgebung zu löschen und neu aufzusetzen.

AWS betont, der Vorfall sei auf „User Error” zurückzuführen, nicht auf einen Fehler der KI selbst. Der betroffene Ingenieur habe „weiterreichende Berechtigungen als vorgesehen” gehabt. Betroffen war lediglich eine von zwei AWS-Regionen in Festlandchina. Compute-, Storage- oder Datenbankdienste seien nicht beeinträchtigt gewesen, so ein AWS-Sprecher gegenüber Cybernews.

Anzeige

Nach dem Vorfall hat AWS verschiedene Schutzmaßnahmen eingeführt, darunter verpflichtende Peer-Reviews für Produktionszugriffe sowie erweiterte Schulungen zum Einsatz KI-gestützter Werkzeuge.

Nicht der erste Vorfall dieser Art

Laut mehreren Amazon-Mitarbeitern war dies bereits das zweite Mal innerhalb weniger Monate, dass ein KI-Tool zu einem Serviceausfall bei AWS beigetragen hat. Details zum ersten Vorfall nannte die FT nicht.

Intern soll Amazon ein Ziel ausgegeben haben, wonach 80 Prozent der Entwickler KI-Werkzeuge mindestens einmal pro Woche für Coding-Aufgaben nutzen sollen, mit enger Erfolgskontrolle. Viele Mitarbeiter stehen dem laut FT dennoch skeptisch gegenüber. Angesichts des Fehlerrisikos zweifeln sie am praktischen Nutzen der Tools für ihre tägliche Arbeit.

Newsletter
Newsletter Box

Mit Klick auf den Button "Jetzt Anmelden" stimme ich der Datenschutzerklärung zu.

AWS widerspricht der FT direkt

In einem offiziellen Statement wandte sich AWS nach Erscheinen des FT-Artikels direkt gegen dessen Kernaussagen. Der Konzern bezeichnete die Berichterstattung als ungenau und stellte klar, dass der Ausfall durch eine fehlkonfigurierte Rolle verursacht wurde, also durch einen Fehler, der grundsätzlich mit jedem Entwicklerwerkzeug passieren könne, ob KI-gestützt oder nicht. Die Behauptung der FT, ein zweites Ereignis habe AWS beeinträchtigt, sei „völlig falsch”.

AWS verwies zudem auf seinen internen „Correction of Error”-Prozess (COE), den das Unternehmen seit mehr als zwei Jahrzehnten einsetzt. Dabei würden operative Vorfälle systematisch ausgewertet, unabhängig davon, wie groß der tatsächliche Schaden gewesen sei, um Probleme zu beheben, bevor ihr Ausmaß wachsen kann. Die ergriffenen Schutzmaßnahmen seien demnach kein Eingeständnis eines schwerwiegenden Vorfalls, sondern Ausdruck dieser Lernkultur.

Lars

Becker

Stellvertretender Chefredakteur

IT Verlag GmbH

Anzeige

Weitere Artikel

Newsletter
Newsletter Box

Mit Klick auf den Button "Jetzt Anmelden" stimme ich der Datenschutzerklärung zu.