Neues Frontier-Modell

GPT-5.4 ist da und soll Fachexperten übertreffen

ChatGPT
Bildquelle: Bangla press/Shutterstock.com

OpenAI rollt heute GPT-5.4 aus, das Reasoning, Coding und Agenten-Workflows unter einer Haube vereint und laut Entwickler besonders für anspruchsvolle professionelle Aufgaben ausgelegt ist.

OpenAI hat GPT-5.4 vorgestellt. Das Modell ist ab sofort in ChatGPT als „GPT-5.4 Thinking”, über die API sowie in der Entwicklungsumgebung Codex verfügbar. Für Nutzer mit besonders anspruchsvollen Aufgaben bietet OpenAI zusätzlich eine Pro-Variante an, die laut Hersteller „maximale Leistung bei schwierigen Aufgaben” liefern soll.

Anzeige

Professionelle Aufgaben im Fokus

Ein Verkaufsargument ist die Leistung bei berufspraktischen Aufgaben. Im hauseigenen Benchmark GDPval, der reale Tätigkeiten aus 44 Berufsfeldern bewertet, soll GPT-5.4 in 83 Prozent der Fälle mit Branchenexperten gleichziehen oder diese übertreffen. Das Modell liefere dabei „qualitativ hochwertigere Ergebnisse mit weniger Iterationen und geringerem Abstimmungsaufwand”, so OpenAI. Deutliche Fortschritte verzeichnet das Unternehmen demnach bei der Erstellung von Tabellenkalkulationen, Präsentationen und Dokumenten.

Computernutzung direkt ins Modell integriert

GPT-5.4 ist laut OpenAI das „erste Allzweckmodell mit integrierter Computernutzung”. Über die API und Codex kann das Modell eigenständig mit Software, Browsern und Werkzeugen interagieren, um „mehrstufige Workflows über verschiedene Anwendungen hinweg abzuschließen”, ohne dass dafür separate Plug-ins oder Erweiterungen nötig wären.

Für Agenten-Szenarien unterstützt das Modell ein Kontextfenster von bis zu einer Million Tokens, wobei diese Funktion in Codex derzeit als experimentelles Feature gilt. Neu ist außerdem die sogenannte Tool-Suche, die es Agenten ermöglichen soll, große Ökosysteme von Tools und Konnektoren effizient zu navigieren.

Anzeige
Newsletter
Newsletter Box

Mit Klick auf den Button "Jetzt Anmelden" stimme ich der Datenschutzerklärung zu.

Weniger Tokens, schnellere Antworten

Im Vergleich zu GPT-5.2 löse GPT-5.4 Probleme „mit deutlich weniger Tokens”, was sich laut OpenAI in schnelleren Antworten und geringeren Kosten für viele Workloads niederschlage. OpenAI spricht von einem spürbar effizienteren Reasoning-Prozess.

In der ChatGPT-Oberfläche zeigt GPT-5.4 Thinking nun einen vorausschauenden Plan für komplexe Aufgaben an, bevor die Antwort vollständig generiert ist, sodass Nutzer die Antwort mitten in der Generierung steuern können. Darüber hinaus soll die Websuche bei hochspezifischen Anfragen verbessert worden sein.

Faktentreue verbessert

OpenAI hebt hervor, dass GPT-5.4 das „bisher faktentreueste Modell” des Unternehmens sei. Die Antworten enthielten 18 Prozent seltener Fehler; einzelne Aussagen seien im Vergleich zu GPT-5.2 sogar um 33 Prozent seltener falsch, so das Unternehmen auf Basis von Prompts, bei denen Nutzer zuvor sachliche Fehler gemeldet hatten.

Ob GPT-5.4 die vollmundigen Versprechen in der Praxis einlöst, dürfte sich in den kommenden Wochen durch unabhängige Benchmarks und Nutzererfahrungen zeigen. OpenAI hat zuletzt häufiger eigene Evaluierungen zur Grundlage seiner Ankündigungen gemacht. Gerade erst hatte OpenAI GPT 5.3 Instant präsentiert.

Lars

Becker

Stellvertretender Chefredakteur

IT Verlag GmbH

Anzeige

Weitere Artikel

Newsletter
Newsletter Box

Mit Klick auf den Button "Jetzt Anmelden" stimme ich der Datenschutzerklärung zu.