Zum Hauptinhalt Zur Navigation

KI: OpenAI stellt GPT-5.4 mit Maus-Agenten vor

Mit GPT-5.4 bringt OpenAI erstmals ein Modell mit nativen Computer-Steuerfähigkeiten auf den Markt. Die KI kann Maus und Tastatur bedienen.
/ Andreas Donath
2 Kommentare News folgen (öffnet im neuen Fenster)
GPT 5.4 ist da. (Bild: OpenAI)
GPT 5.4 ist da. Bild: OpenAI

OpenAI hat das KI-Modell GPT-5.4 veröffentlicht(öffnet im neuen Fenster) , das Verbesserungen in Reasoning, Coding und professioneller Arbeit mit Tabellen(öffnet im neuen Fenster) , Dokumenten und Präsentationen(öffnet im neuen Fenster) ermöglichen soll. Erstmals verfügt ein OpenAI-Modell über native Computer-Steuerungsfähigkeiten: GPT-5.4 kann eigenständig Anwendungen bedienen, Maus- und Tastaturbefehle ausführen und Screenshots interpretieren.

Das Modell ist laut Hersteller ein Schritt in Richtung agentischer Zukunft, in der vernetzte KI-Systeme komplexe Aufgaben im Hintergrund erledigen. OpenAI führte bereits ChatGPT Agent ein – ähnlich den Tools von Anthropic, Microsoft, Adobe und Google, die Computerkontrolle für Aufgaben wie Onlineeinkäufe oder Recherchen übernehmen können.

Bessere Webnavigation und API-Nutzung

GPT-5.4 kann Code schreiben, um Computer zu steuern, sowie Tastatur- und Mausbefehle basierend auf Screenshots ausführen. Das Modell zeigt den Angaben zufolge Verbesserungen bei der Webnavigation und kann Tools und APIs präziser aufrufen. Für Fragen, die Informationen aus mehreren Quellen erfordern, kann GPT-5.4 persistenter über mehrere Runden suchen.

OpenAI bezeichnete GPT-5.4 als " bisher faktischstes Modell ": Einzelne Aussagen seien 33 Prozent weniger wahrscheinlich falsch als bei GPT-5.2. Der Modus GPT-5.4 Thinking soll bei komplexen Anfragen eine Gliederung liefern und es Nutzern ermöglichen, Anfragen während der Antwortphase anzupassen. "Das macht es einfacher, das Modell zum gewünschten Ergebnis zu führen, ohne neu zu starten" , erklärte OpenAI.

Verfügbarkeit und Pro-Version

GPT-5.4 wird in ChatGPT, Codex und der API integriert. Das GPT-5.4-Thinking-Modell soll Plus-, Team- und Pro-Nutzern zur Verfügung stehen. Eine GPT-5.4 Pro-Version für "maximale Leistung bei komplexen Aufgaben" wird über die API sowie für ChatGPT Enterprise- und Edu-Nutzer angeboten.

Zur Demonstration der verbesserten Computer- und Codierungsfähigkeiten des Modells veröffentlichte OpenAI die experimentelle Codex-Funktion Playwright (Interactive)(öffnet im neuen Fenster) ⁠. Damit kann Codex Web- und Electron-Apps visuell debuggen und sogar zum Testen einer App verwendet werden, während diese erstellt wird.


Relevante Themen