OpenAI veröffentlicht eine Vorschau von GPT-5.6. Das Flaggschiff-Modell Sol ist auf komplexe Logikaufgaben und die Analyse von Software-Schwachstellen optimiert.
OpenAI hat eine begrenzte Vorschau seiner neuen Modellgeneration GPT-5.6 angekündigt, die in die drei Leistungsstufen Sol, Terra und Luna unterteilt ist. Die Versionsnummer beschreibt künftig die Modellgeneration, während die Namen für dauerhafte Fähigkeitsstufen stehen. Das leistungsstärkste Modell Sol ist für komplexe logische Aufgaben ausgelegt. Terra deckt alltägliche Aufgaben zu geringeren Kosten ab, und Luna dient als schnelle, kostengünstige Option. Die Veröffentlichung erfolgt nach Konsultationen mit der Regierung der Vereinigten Staaten zunächst eingeschränkt für ausgewählte Partner. Dieser Schritt dient als temporäre Maßnahme, um die nationalen Sicherheitsrisiken fortgeschrittener KI-Systeme gemäß aktuellen Verordnungen zu prüfen.
GPT-5.6 Sol fokussiert sich auf Defensivaufgaben
In Cybersicherheitstests auf der Plattform ExploitBench erreichte das Modell Sol die Ergebnisse von Konkurrenzsystemen wie Mythos Preview, benötigte dafür jedoch nur ein Drittel der Ausgabe-Tokens. Bei Überprüfungen der Quelltexte von Chromium und Firefox isolierte das System Softwarefehler und grundlegende Mechanismen, erstellte jedoch keine funktionierenden vollständigen Angriffsketten. OpenAI betont, dass das Modell eine höhere Eignung für defensive Aufgaben wie die Identifizierung von Schwachstellen und die Entwicklung von Software-Patches aufweist.
Um Missbrauchsrisiken zu minimieren, verfügt die Infrastruktur über eine mehrschichtige Sicherheitsarchitektur. Automatisierte Echtzeit-Klassifikatoren prüfen Eingaben aus den Bereichen Biologie und Cybersicherheit. Bei Auffälligkeiten wird die Generierung pausiert und der Kontext durch ein sekundäres Modell überprüft. Zur Absicherung gegen universelle Systemumgehungen wurden im Vorfeld über 700.000 GPU-Stunden für automatisierte Sicherheitsprüfungen aufgewendet. Eine breitere Bereitstellung für ChatGPT und die allgemeine Programmierschnittstelle ist für die kommenden Wochen geplant.
(red)