Mit ChatGPT Images 2.0 und dem Modell gpt-image-2 aktualisiert OpenAI seine KI-Bildgenerierung, mit mehr Präzision, neuen Ausgabeformaten und API-Zugang für Entwickler.
OpenAI hat ChatGPT Images 2.0 veröffentlicht, ein aktualisiertes Bildgenerierungsmodell, das in ChatGPT und Codex integriert ist. Erstmals steht das zugrundeliegende Modell gpt-image-2 auch über eine API bereit. Laut OpenAI können Entwickler damit „Bildgenerierung und -bearbeitung direkt in ihre Produkte und Workflows integrieren.“
Images 2.0 soll komplexe Anweisungen deutlich zuverlässiger als die Vorgängerversion bearbeiten. Verbessert wurden die Darstellung kleiner Textelemente und UI-Komponenten, die Objektpositionierung sowie die Unterstützung von Seitenverhältnissen zwischen 3:1 und 1:3.
Thinking-Funktion und Mehrfachausgabe
Pro Anfrage kann das Modell bis zu acht inhaltlich zusammenhängende Bilder ausgeben, laut OpenAI „ideal für Poster-Sets, Storyboards, Comics oder Multi-Format-Kampagnen.“
Für Nutzer mit Plus-, Pro-, Business- oder Enterprise-Tarif steht zusätzlich eine Thinking-Funktion bereit. Das Modell kann dabei „Aufgaben durchdenken, bei Bedarf das Web nutzen und aus einem einzigen Prompt mehrere unterschiedliche Bilder generieren.“ Alle anderen ChatGPT-Nutzer haben weiterhin Zugang zu den Basisfunktionen.
Verfügbarkeit im Überblick
- Basisfunktionen: alle ChatGPT- und Codex-Nutzer
- Thinking-Funktionen: Plus-, Pro-, Business- und Enterprise-Tarif
- API-Zugang: über gpt-image-2 für Entwickler verfügbar
Technische Details und Preismodell hat OpenAI im zugehörigen Blogpost veröffentlicht.