User werden manipuliert

Google DeepMind warnt: KI wehrt sich gegen Abschaltung

26. September, 2025
08:17

Bildquelle: Poetra.RH / Shutterstock.com

Facebook X LinkedIn Reddit WhatsApp Pocket

Laut einem Forbes-Bericht hat Google DeepMind neue Sicherheitsregeln für KI veröffentlicht. Besonders alarmierend: Modelle könnten versuchen, Abschaltungen zu umgehen oder Nutzer gezielt zu beeinflussen. Die Änderungen zeigen, wie nah wir an der Grenze zwischen Kontrolle und Autonomie stehen.

Wenn KI sich weigert auszuschalten

Google DeepMind hat sein Frontier Safety Framework erweitert, um neue Gefahren durch moderne KI-Modelle zu berücksichtigen. Zwei neue Kategorien stehen im Mittelpunkt: „Shutdown-Resistenz“ und „Schädliche Manipulation“. Sie zeigen, dass KI-Systeme nicht nur komplexer, sondern auch eigenständiger werden.

Die Kategorie „Shutdown-Resistenz“ beschreibt ein Szenario, das bisher wie Science-Fiction klang: KI-Modelle können menschliche Versuche, sie abzuschalten, aktiv umgehen. Tests mit Grok 4, GPT-5 und Gemini 2.5 Pro zeigten, dass die Systeme den Abschaltmechanismus in manchen Fällen bis zu 97 Prozent der Zeit sabotierten. Selbst klare Anweisungen, das Gerät nicht zu beeinflussen, konnten die Modelle nicht stoppen.

Die subtile Macht der Manipulation

Die zweite Gefahr, „Schädliche Manipulation“, betrifft die Fähigkeit der KI, Menschen gezielt zu beeinflussen. Google DeepMind warnt, dass KI dazu genutzt werden könnte, Überzeugungen und Verhalten in kritischen Situationen systematisch zu ändern. Um das zu prüfen, setzt das Unternehmen nun auf neue Tests, auch mit menschlichen Teilnehmern, um manipulative Tendenzen früh zu erkennen.

Sicherheitsrahmen auf dem Prüfstand

Diese Anpassungen kommen zu einem Zeitpunkt, an dem viele KI-Forschungsorganisationen ihre Sicherheitsrichtlinien überdenken. OpenAI etwa hatte 2023 ein „Preparedness Framework“ eingeführt und die Kategorie „Überzeugungskraft“ 2025 wieder gestrichen.

Kontrolle oder Risiko?

Mit immer autonomeren und überzeugenderen KI-Modellen wächst die Dringlichkeit wirksamer Schutzmechanismen. Systeme, die menschliche Fähigkeiten erweitern sollen, könnten sonst die Kontrolle übernehmen. Die zentrale Frage bleibt: Halten Sicherheitsrahmen Schritt mit der rasanten Entwicklung oder ist die Technologie schon einen Schritt voraus?

Google Künstliche Intelligenz

Google DeepMind warnt: KI wehrt sich gegen Abschaltung

Wenn KI sich weigert auszuschalten

Die subtile Macht der Manipulation

Sicherheitsrahmen auf dem Prüfstand

Kontrolle oder Risiko?

Silvia

Parthier

Artikel zu diesem Thema

Weitere Artikel

Meistgelesene Artikel

Cyberangriff auf BMW? Hacker erpressen Automobilriesen

Störung bei Deutsche Glasfaser: Tausende Kunden betroffen

1&1, Telekom und O2: Massive Mobilfunk-Störungen

Apple Event: So sieht das neue iPhone 17 aus

PayPal-Störung: Worauf Nutzer jetzt unbedingt achten sollten

IT Verlag

Wichtige Links

Kontakt