Zum Hauptinhalt Zur Navigation

OpenAI: ChatGPT bekommt Agenten

OpenAI hat einen KI-Agenten vorgestellt, der Termine verwaltet, Präsentationen erstellt und Webseiten auswertet - vorerst jedoch nicht für EU-Bürger.
/ Michael Linden
3 Kommentare News folgen (öffnet im neuen Fenster)
Der Agent von ChatGPT (Bild: OpenAI)
Der Agent von ChatGPT Bild: OpenAI

OpenAI hat einen neuen KI-Agenten für ChatGPT vorgestellt(öffnet im neuen Fenster) , der verschiedene Aufgaben ohne direkte Nutzereingriffe bewältigen soll. Der ChatGPT-Agent kann Kalendertermine verwalten, Präsentationsmaterialien erstellen und Code-Funktionen ausführen. Nutzer können die Funktion über ein Dropdown-Menü mit der Bezeichnung Agent-Modus aktivieren, sofern sie nicht aus der EU kommen. Dort hat OpenAI die Funktion ausdrücklich nicht eingeführt.

Das neue Tool kombiniert Fähigkeiten aus OpenAIs bisherigen Agent-Angeboten, darunter Website-Navigation und Deep Research. Nach Unternehmensangaben können Nutzer mit dem Agenten in gewöhnlicher Umgangssprache kommunizieren, ohne spezielle Befehle zu verwenden. Die Funktion steht zunächst Abonnenten der Pro-, Plus- und Team-Tarife zur Verfügung, die nicht in der EU sitzen.

OpenAI bezeichnet diese Veröffentlichung als umfassendsten Versuch, ChatGPT von einem Frage-Antwort-Service in eine handlungsorientierte Plattform zu verwandeln.

Erweiterte Funktionen und Leistungsdaten

Der ChatGPT-Agent kann sich mit externen Anwendungen wie Gmail und GitHub verbinden und relevante Informationen für Nutzeranfragen sammeln. OpenAI teilte mit, dass das System Terminal-Zugang hat und Programmierschnittstellen zur Interaktion mit verschiedenen Software-Plattformen nutzen kann. Dabei können auch Websites bedient werden. Das Unternehmen hat zudem Ideen präsentiert, wie Nutzer den Agenten beispielsweise für Aufgaben wie Essensplanung oder Konkurrenzanalysen mit nachfolgender Präsentationserstellung einsetzen könnten.

Leistungstests von OpenAI zeigen, dass der ChatGPT-Agent 41,6 Prozent bei Humanity's Last Exam erreichte, einer umfassenden Prüfung über mehrere akademische Fächer. Dieses Ergebnis entspricht etwa der doppelten Leistung von OpenAIs o3- und o4-mini-Modellen. Bei FrontierMath, einem der anspruchsvollsten mathematischen Benchmarks, erzielte der Agent 27,4 Prozent mit Tool-Zugang, verglichen mit dem bisherigen Bestwert von 6,3 Prozent von o4-mini.

Die verbesserte Leistung resultiert aus der Fähigkeit des Agenten, Websites zu verarbeiten, Aktionspläne zu entwickeln und mehrere Tools gleichzeitig zu nutzen.

Sicherheitsmaßnahmen und Risikomanagement

OpenAI hat Sicherheitsprotokolle für den neuen Agenten implementiert, um potenzielle Risiken zu minimieren. Das Unternehmen stufte das Modell als " hochfähig(öffnet im neuen Fenster) " in biologischen und chemischen Waffenbereichen ein, entsprechend seiner Preparedness-Framework-Richtlinien.

Daher bewertet ein Klassifizierungssystem jede Nutzereingabe zur Identifizierung schädlicher Anfragen und löst zusätzliche Überprüfungen der Agenten-Antworten aus.


Relevante Themen