Per API nutzbar

KI-Bildgenerierung: OpenAI stellt ChatGPT Images 2.0 vor

Chatgpt
Bildquelle: jackpress / Shutterstock.com

Mit ChatGPT Images 2.0 und dem Modell gpt-image-2 aktualisiert OpenAI seine KI-Bildgenerierung, mit mehr Präzision, neuen Ausgabeformaten und API-Zugang für Entwickler.

OpenAI hat ChatGPT Images 2.0 veröffentlicht, ein aktualisiertes Bildgenerierungsmodell, das in ChatGPT und Codex integriert ist. Erstmals steht das zugrundeliegende Modell gpt-image-2 auch über eine API bereit. Laut OpenAI können Entwickler damit „Bildgenerierung und -bearbeitung direkt in ihre Produkte und Workflows integrieren.“

Anzeige

Images 2.0 soll komplexe Anweisungen deutlich zuverlässiger als die Vorgängerversion bearbeiten. Verbessert wurden die Darstellung kleiner Textelemente und UI-Komponenten, die Objektpositionierung sowie die Unterstützung von Seitenverhältnissen zwischen 3:1 und 1:3.

Thinking-Funktion und Mehrfachausgabe

Pro Anfrage kann das Modell bis zu acht inhaltlich zusammenhängende Bilder ausgeben, laut OpenAI „ideal für Poster-Sets, Storyboards, Comics oder Multi-Format-Kampagnen.“

Für Nutzer mit Plus-, Pro-, Business- oder Enterprise-Tarif steht zusätzlich eine Thinking-Funktion bereit. Das Modell kann dabei „Aufgaben durchdenken, bei Bedarf das Web nutzen und aus einem einzigen Prompt mehrere unterschiedliche Bilder generieren.“ Alle anderen ChatGPT-Nutzer haben weiterhin Zugang zu den Basisfunktionen.

Anzeige

Verfügbarkeit im Überblick

  • Basisfunktionen: alle ChatGPT- und Codex-Nutzer
  • Thinking-Funktionen: Plus-, Pro-, Business- und Enterprise-Tarif
  • API-Zugang: über gpt-image-2 für Entwickler verfügbar

Technische Details und Preismodell hat OpenAI im zugehörigen Blogpost veröffentlicht.

Lars

Becker

Stellvertretender Chefredakteur

IT Verlag GmbH

Anzeige

Weitere Artikel

Newsletter
Newsletter Box

Mit Klick auf den Button "Jetzt Anmelden" stimme ich der Datenschutzerklärung zu.