Sicherheitsregeln für KI-Modelle

Nach heftiger Kritik: Anthropic macht KI-Einschränkungen sichtbar

12. Juni, 2026
08:18

Bildquelle: JRdes / Shutterstock.com

Anthropic korrigiert seine Intransparenz. Die künstliche Intelligenz Claude Fable 5 weist Nutzer künftig sichtlich hin, wenn Anfragen abgelehnt werden.

Das KI-Unternehmen Anthropic hat seine Kommunikationspolitik bei Sicherheitsbeschränkungen für das neue Sprachmodell Claude Fable 5 geändert. Der mit einem Marktwert von 965 Milliarden US-Dollar bewertete OpenAI-Konkurrent reagiert damit auf scharfe Kritik von Software-Entwicklern und KI-Forschern. Zuvor hatte das Unternehmen die Veröffentlichung des Modells Fable 5 aus der fortschrittlichen Mythos-Klasse bekannt gegeben. Das System verfügt über weitreichende Fähigkeiten bei Programmieraufgaben und Datenanalysen. Allerdings integrierten die Entwickler ein Sicherheitswerkzeug, das bestimmte Nutzeranfragen im Hintergrund heimlich abwertete.

Aus dem 319-seitigen Sicherheitsdokument des Modells ging hervor, dass Anfragen bezüglich der Entwicklung fortgeschrittener künstlicher Intelligenzen unbemerkt an ein schwächeres Modell weitergeleitet wurden. Wenn KI-Forscher das System nutzen wollten, um eigene Sprachmodelle zu entwickeln, wechselte die Software automatisch in einen weniger leistungsfähigen Modus. Forscher wie Jeremy Howard, Mitbegründer der Forschungsgruppe Fast.ai, kritisierten dieses Vorgehen öffentlich auf der Plattform X, da es den wissenschaftlichen Fortschritt künstlich verlangsame. Als Reaktion auf den Protest kündigte Anthropic eine Kehrtwende an.

„Wir haben den falschen Kompromiss gewählt und entschuldigen uns dafür, dass wir die richtige Balance verfehlt haben.“

Anthropic
Anzeige

Umstellung auf sichtbare Fehlermeldungen und Rückstufungen

Aufgrund der Reaktionen stellt Anthropic das System in dieser Woche so um, dass die Sicherheitsmechanismen für Anwender vollständig transparent sind. Bei blockierten Eingaben im Web-Interface stuft das Programm die Anfrage nun sichtlich auf das Modell Opus 4.8 zurück. Bei Zugriffen über die Programmierschnittstelle (API) wird ab sofort eine explizite Fehlermeldung ausgegeben, die den genauen Grund für die Ablehnung benennt.

Das Unternehmen hält ungeachtet der geänderten Informationspolitik an den inhaltlichen Einschränkungen fest. Dies wird zum einen mit den allgemeinen Nutzungsbedingungen begründet, die eine Entwicklung von Konkurrenzprodukten untersagen. Zum anderen verweist das Startup auf erhebliche Sicherheitsrisiken für die nationale Sicherheit der USA. Demnach soll verhindert werden, dass ausländische Akteure die Technologie nutzen, um ihre eigenen strategischen Fähigkeiten auszubauen.

Ein Sprecher des Unternehmens führte dazu aus: „Die USA und ihre Verbündeten haben einen Vorsprung bei Spitzenchips und der hochoptimierten Software, die sie mit vollem Potenzial betreibt. Diese Schutzmaßnahmen stellen sicher, dass Claude nicht verwendet wird, um diesen Vorteil zu schmälern – beispielsweise durch die Optimierung von Chips, die von diesen Gegnern entwickelt wurden.“

Konflikte von Anthropic mit dem Verteidigungsministerium

Die Verschärfung der Sicherheitsdebatte um Anthropic folgt auf einen ungelösten Konflikt mit dem US-Verteidigungsministerium (Department of War). Die Behörde hatte einen unbeschränkten Zugriff auf die Claude-Modelle gefordert, was das Unternehmen unter Verweis auf das Risiko von Massenüberwachung und dem autonomen Waffeneinsatz ablehnte. Das Ministerium stufte Anthropic daraufhin als Lieferkettenrisiko für die nationale Sicherheit ein, was Rüstungsunternehmen und militrischen Dienststellen die Nutzung der Software untersagt. Eine Beschwerde des KI-Startups wurde im Juni 2026 von Kriegsminister Pete Hegseth endgültig abgewiesen, weshalb das Verfahren nun vor einem Bundesgericht verhandelt wird.

(red)

Nach heftiger Kritik: Anthropic macht KI-Einschränkungen sichtbar

Umstellung auf sichtbare Fehlermeldungen und Rückstufungen

Konflikte von Anthropic mit dem Verteidigungsministerium

Weitere Artikel

Meistgelesene Artikel

Hacker löscht europäische Regierungsdatenbank vollständig

Hackergruppe erpresst Bosch mit gestohlenen Konstruktionsdaten

Enttäuschung nach Relaunch von Claude Fable 5

Anthropic streicht Fable 5 vorübergehend aus Abos

Vibe Coding ist keine gute Idee bei Java

IT Verlag

Wichtige Links

Kontakt