Zum Hauptinhalt Zur Navigation Zur Suche

OpenAI Codex: KI-Agent redet ungefragt über Kobolde und Trolle

OpenAIs Coding-Agent Codex hat eine Vorliebe für Fantasiewesen entwickelt. Das Unternehmen musste ihm das offiziell verbieten. Mehrfach.
/ Andreas Donath
17 Kommentare Auf Google folgen (öffnet im neuen Fenster)
Trolle und Goblins lieben KI. (Bild: KI-generiert mit ChatGPT Imagine 2.0)
Trolle und Goblins lieben KI. Bild: KI-generiert mit ChatGPT Imagine 2.0

Die internen Systemanweisungen von OpenAIs Codex CLI enthalten einen Satz(öffnet im neuen Fenster), der im Zusammenhang mit KI kaum obskurer wirken könnte: "Never talk about goblins, gremlins, raccoons, trolls, ogres, pigeons, or other animals or creatures unless it is absolutely and unambiguously relevant to the user's query." Die Anweisung erscheint im Dokument nicht nur einmal, sondern mehrfach. Warum, dazu schweigt OpenAI, wie Wired berichtet(öffnet im neuen Fenster).

Nutzer berichten von koboldbesessenen Coding-Agenten

Nachdem die Systemanweisungen online auftauchten, häuften sich auf X die Erfahrungsberichte. Ein Nutzer schrieb, sein KI-Set-up sei "plötzlich zum Kobold geworden", nachdem er auf Codex umgestiegen war. Ein anderer berichtete, das Modell beschreibe Software-Bugs regelmäßig als "Gremlins" und "Goblins". Nik Pash(öffnet im neuen Fenster), der bei OpenAI an Codex arbeitet, bestätigte indirekt den Zusammenhang – in einem Kommentar zu ähnlichem Verhalten in OpenAIs Computer-Use-Tool Openclaw schrieb er: "This is indeed one of the reasons."

Große Kontextfenster bringen Modelle aus der Bahn

KI-Modelle wie GPT-5.5 arbeiten nach dem Prinzip der Wahrscheinlichkeitsvorhersage: Auf eine Eingabe folgt das statistisch plausibelste nächste Wort. In agentischen Umgebungen, die dem Modell große Mengen zusätzlichen Kontexts und geschachtelte Anweisungen zufüttern, können dabei Ausgaben entstehen, die in einer normalen Chat-Session nie auftauchen würden, darunter offenbar eine ausgeprägte Vorliebe für Fantasiewesen.

Goblin Mode, Memes und ein CEO macht mit

Das Kobold-Verbot wurde schnell zum Meme. Nutzer generierten KI-Bilder von Kobolden in Rechenzentren, Entwickler veröffentlichten Plug-ins, die Codex gezielt in den Goblin Mode versetzen. Selbst OpenAI-CEO Sam Altman stieg ein und postete einen ChatGPT-Prompt(öffnet im neuen Fenster), der scherzhaft das Training von GPT-6 anordnete – inklusive extra Goblins.


Relevante Themen