Zum Hauptinhalt Zur Navigation Zur Suche

Elon Musk: xAI hat Grok mit Daten von ChatGPT trainiert

US-KI-Unternehmen werfen chinesischen Konkurrenten regelmäßig das Kopieren ihrer Modelle vor. Dabei machen sie es wohl nicht anders.
/ Johannes Hiltscher
12 Kommentare News folgen (öffnet im neuen Fenster)
Grok hat bei ChatGPT abgeschrieben. (Bild: RDNE Stock project, Pexels)
Grok hat bei ChatGPT abgeschrieben. Bild: RDNE Stock project, Pexels / CC0 1.0

Meist wird der Vorwurf der Modelldestillation gegen Entwickler von Open-Source-Modellen aus der Volksrepublik China erhoben. So warf OpenAI im Jahr 2025 dem Unternehmen Deepseek nach der Vorstellung von Deepseek-V3 vor, ChatGPT zum Trainieren seines Sprachmodells verwendet zu haben. Im Februar 2026 erhob Anthropic entsprechende Vorwürfe(öffnet im neuen Fenster) gegenüber Deepseek, Minimax und Moonshot AI.

Gegenseitig scheinen sich die KI-Unternehmen aus den USA aber ebenfalls zu kopieren. Das geht aus einer Aussage von Elon Musk im laufenden Prozess gegen OpenAI hervor.

So antwortete Musk auf die Frage eines OpenAI-Anwalts, ob seine Firma xAI Modelle von OpenAI destilliert habe, alle Unternehmen würden die Modelle der Konkurrenz verwenden. Die Nachfrage des Anwalts, ob dies ein Ja bedeute, beantwortete Musk mit "teilweise". Das berichtet unter anderem Techcrunch(öffnet im neuen Fenster).

Brisant daran ist, dass xAI sich mit dem Vorgehen nicht nur einen wirtschaftlichen Vorteil gegenüber dem Konkurrenten verschaffte, sondern auch die Entwicklung seines eigenen Modells Grok beschleunigte. Ob hingegen Musks Aussage stimmt, dass alle Unternehmen gegenseitig ihre Modelle destillieren, ist unklar.

Destillation: die Abkürzung zum leistungsfähigen Modell

Bei der sogenannten Destillation (g+) lernt ein KI-Modell nicht aus einer großen Menge an Daten, sondern anhand ausgewählter Ausgaben eines anderen Modells. Das erfordert nicht nur weniger Rechenaufwand, da weniger Tokens verarbeitet werden, sondern kann Wissen auch effizienter speichern.

Entsprechend kann das trainierte Modell mit weniger Parametern ähnlich leistungsfähig sein wie das Trainermodell. Hierdurch werden Training und Betrieb günstiger, womit sich KI-Entwickler einen Kostenvorteil gegenüber den Entwicklern der Trainermodelle verschaffen.

Daher versuchen die US-KI-Unternehmen ein solches Vorgehen zu erkennen und zu verhindern, dass für die Destillation geeignete Datensätze ausgeleitet werden. Die US-Regierung unterstützt dies.

Rechtlich ist Modelldestillation hingegen eine Grauzone: Eine Urheberrechtsverletzung stellt sie wohl nicht dar, lediglich einen Verstoß gegen die Geschäftsbedingungen des betroffenen Unternehmens. Moralisch ist die Bewertung noch einmal schwieriger, schließlich nimmt zumindest OpenAI Urheberrechtsverletzungen beim Training seiner Modelle bewusst in Kauf.


Relevante Themen