Elon Musk: xAI hat Grok mit Daten von ChatGPT trainiert
Meist wird der Vorwurf der Modelldestillation gegen Entwickler von Open-Source-Modellen aus der Volksrepublik China erhoben. So warf OpenAI im Jahr 2025 dem Unternehmen Deepseek nach der Vorstellung von Deepseek-V3 vor, ChatGPT zum Trainieren seines Sprachmodells verwendet zu haben. Im Februar 2026 erhob Anthropic entsprechende Vorwürfe(öffnet im neuen Fenster) gegenüber Deepseek, Minimax und Moonshot AI.
Gegenseitig scheinen sich die KI-Unternehmen aus den USA aber ebenfalls zu kopieren. Das geht aus einer Aussage von Elon Musk im laufenden Prozess gegen OpenAI hervor.
So antwortete Musk auf die Frage eines OpenAI-Anwalts, ob seine Firma xAI Modelle von OpenAI destilliert habe, alle Unternehmen würden die Modelle der Konkurrenz verwenden. Die Nachfrage des Anwalts, ob dies ein Ja bedeute, beantwortete Musk mit "teilweise". Das berichtet unter anderem Techcrunch(öffnet im neuen Fenster).
Brisant daran ist, dass xAI sich mit dem Vorgehen nicht nur einen wirtschaftlichen Vorteil gegenüber dem Konkurrenten verschaffte, sondern auch die Entwicklung seines eigenen Modells Grok beschleunigte. Ob hingegen Musks Aussage stimmt, dass alle Unternehmen gegenseitig ihre Modelle destillieren, ist unklar.
Destillation: die Abkürzung zum leistungsfähigen Modell
Bei der sogenannten Destillation (g+) lernt ein KI-Modell nicht aus einer großen Menge an Daten, sondern anhand ausgewählter Ausgaben eines anderen Modells. Das erfordert nicht nur weniger Rechenaufwand, da weniger Tokens verarbeitet werden, sondern kann Wissen auch effizienter speichern.
Entsprechend kann das trainierte Modell mit weniger Parametern ähnlich leistungsfähig sein wie das Trainermodell. Hierdurch werden Training und Betrieb günstiger, womit sich KI-Entwickler einen Kostenvorteil gegenüber den Entwicklern der Trainermodelle verschaffen.
Daher versuchen die US-KI-Unternehmen ein solches Vorgehen zu erkennen und zu verhindern, dass für die Destillation geeignete Datensätze ausgeleitet werden. Die US-Regierung unterstützt dies.
Rechtlich ist Modelldestillation hingegen eine Grauzone: Eine Urheberrechtsverletzung stellt sie wohl nicht dar, lediglich einen Verstoß gegen die Geschäftsbedingungen des betroffenen Unternehmens. Moralisch ist die Bewertung noch einmal schwieriger, schließlich nimmt zumindest OpenAI Urheberrechtsverletzungen beim Training seiner Modelle bewusst in Kauf.
- Anzeige Hier geht es zu Künstliche Intelligenz: Wissensverarbeitung bei Amazon Wenn Sie auf diesen Link klicken und darüber einkaufen, erhält Golem eine kleine Provision. Dies ändert nichts am Preis der Artikel.