OpenAI hat einen neuen KI-Agenten für ChatGPT vorgestellt, der verschiedene Aufgaben selbstständig ausführen soll. Das als “ChatGPT Agent” bezeichnete Tool kann laut Hersteller automatisch Kalendereinträge verwalten, Präsentationen erstellen und Programmcode ausführen.
Das System kombiniert Funktionen bereits verfügbarer OpenAI-Tools: Die Web-Navigation von “Operator” sowie die Recherche-Fähigkeiten von “Deep Research”, das Informationen aus zahlreichen Websites zu kompakten Berichten zusammenfasst. Nutzer sollen den Agenten über normale ChatGPT-Eingaben in natürlicher Sprache steuern können.
Wann ist ChatGPT Agent verfügbar?
Der ChatGPT Agent ist schon jetzt verfügbar und wird zunächst Nutzern der kostenpflichtigen Pro-, Plus- und Team-Abonnements zur Verfügung gestellt. Die Aktivierung erfolgt über einen “Agent-Modus” im Tool-Auswahlmenü von ChatGPT. Die Aktivierung erfolgt über das Menü „Tools” > „Agent-Modus” in ChatGPT.
Mit diesem Schritt unternimmt OpenAI den bisher weitreichendsten Versuch, ChatGPT von einem reinen Frage-Antwort-System zu einem aktionsorientierten Assistenten zu entwickeln. Während Tech-Konzerne wie OpenAI, Google und Perplexity in den vergangenen Jahren zahlreiche KI-Agenten angekündigt haben, blieben diese oft hinter den Erwartungen zurück und erwiesen sich bei komplexeren Aufgaben als unzuverlässig.
Erweiterte Funktionen
Der neue Agent kann auf ChatGPT-Konnektoren zugreifen und dadurch Apps wie Gmail oder GitHub einbinden. Zusätzlich steht ihm ein Terminal zur Verfügung, über das er APIs verschiedener Anwendungen nutzen kann: “Dank dieser Funktionen kann ChatGPT wahrhaftig mit dir zusammenarbeiten und proaktiv Maßnahmen auswählen, wenn es innerhalb der Aufgabe auf unterschiedliche Informationen und Schritte stößt”, heißt es in der Ankündigung..
Als Anwendungsbeispiele nennt OpenAI die Planung und den Einkauf von Zutaten für ein Frühstück für vier Personen oder die Analyse von Konkurrenten mit anschließender Erstellung einer Präsentation. Solche Aufgaben erfordern die Analyse von Websites, die Entwicklung von Handlungsplänen und den Einsatz verschiedener Tools – deutlich komplexere Prozesse als bei bisherigen Agent-Systemen. “Erläutere einfach die gewünschte Aufgabe – z. B. die Durchführung einer tiefgehenden Recherche, die Erstellung einer Präsentation oder das Einreichen von Spesen. Während ChatGPT an deiner Aufgabe arbeitet, kannst du über die Kommentarfunktion auf dem Bildschirm genau sehen, was ChatGPT tut”, schreiben die Entwickler.
Leistungsdaten
In Tests erreichte das ChatGPT Agent-Modell 41,6 Prozent bei “Humanity’s Last Exam”, einem anspruchsvollen Test mit tausenden Fragen aus über hundert Fachbereichen. Das entspricht etwa dem doppelten Wert der OpenAI-Modelle o3 und o4-mini.
Bei FrontierMath, einem der schwierigsten Mathematik-Benchmarks, erzielte der Agent mit Tool-Zugang 27,4 Prozent. Zum Vergleich: Das bisher beste Ergebnis stammte von o4-mini mit 6,3 Prozent.