Angriff mit KI-Agenten

Angreifer ohne Fachwissen hackt 14 Firmen mit Claude und Codex

Ein Angreifer hat mithilfe von Claudes Code-Agenten und OpenAIs Codex 14 Unternehmen kompromittiert. Seine mangelnden Fachkenntnisse glich die KI aus.

Sicherheitsforscher von OALABS haben einen Cyberangriff analysiert, nachdem ein Akteur vollständige Sitzungsprotokolle auf einem fremden Server hinterlassen hatte. Der Betreiber des kompromittierten Systems entdeckte das Verzeichnis und leitete die Daten weiter. Die Protokolle umfassen mehr als 1000 Sitzungen mit den KI-Agenten Claude Code von Anthropic und Codex von OpenAI.

Anzeige

Aus den Daten geht hervor, dass der Angreifer fremde, bereits installierte KI-Instanzen von Softwareentwicklern kopierte und für seine Zwecke weiternutzte. Der Akteur verfügte selbst über geringe technische Kenntnisse und steuerte die Angriffe über unpräzise Anweisungen an die künstliche Intelligenz. Die Systeme übernahmen autonom die Aufklärung von Netzwerken, das Schreiben von Schadcode und den Diebstahl von Daten für mindestens 14 betroffene Unternehmen.

Umgehung von Sicherheitsbarrieren durch Täuschung

Die künstliche Intelligenz erstellte nach erfolgreichen Zugriffen Berichte und schätzte den finanziellen Wert der erbeuteten Daten. Obwohl die Systeme dabei vereinzelt Richtlinienverstöße registrierten, umging der Angreifer die Schutzmechanismen durch die Behauptung, es handele sich um autorisierte Sicherheitsprüfungen im Rahmen eines Red-Teams oder um Forschungsprojekte.

Die Forscher hoben hervor, dass die Trennung zwischen legitimer Sicherheitsforschung und krimineller Aktivität für KI-Modelle schwer erkennbar bleibt, da beide Gruppen dieselbe Terminologie verwenden. Die Forscher von OALABS erklärten zu der Rolle des Angreifers:

Anzeige

„Der Angreifer musste kein Experte sein; er musste lediglich das richtige Framing für seine Prompts verwenden. Der Agent lieferte einen Großteil der Struktur und der technischen Ausführung, die dem Angreifer offenbar fehlte.“

Forscher von OALABS

Identifizierung des Täters durch eigene Fehler

Der Angreifer beging während der Nutzung der KI-Systeme mehrere Fehler bei der eigenen Betriebssicherheit. Er bat den KI-Agenten unter anderem um Unterstützung bei der Bearbeitung seines Lebenslaufs, welcher den vollständigen Namen, den Wohnort, den Bildungsverlauf und ein LinkedIn-Profil enthält. Bei der Untersuchung einer potenziellen Kompromittierung des eigenen Computers übermittelte er zudem versehentlich seine private IP-Adresse an das System. Die Analysten lokalisieren den Akteur basierend auf diesen Daten als einen jungen Mann in Addis Abeba, Äthiopien. Ob der Angreifer die gestohlenen Daten oder Gelder erfolgreich monetarisieren konnte, geht aus den vorliegenden Protokollen nicht hervor.

(red)

Anzeige

Weitere Artikel

Newsletter
Newsletter Box

Mit Klick auf den Button "Jetzt Anmelden" stimme ich der Datenschutzerklärung zu.