Claude, Gemini, GPT und Grok: Auch kommerzielle LLMs geben Harry Potter wieder

Auch Bezahlversionen von LLMs können den Inhalt von Büchern wortgetreu wiedergeben. Zu dieser Erkenntnis kommen die Forscher Ahmed Ahmed, A. Feder Cooper, Sanmi Koyejo und Percy Liang von den Universitäten Stanford und Yale in einem am 6. Januar 2026 veröffentlichtem Preprint-Paper(öffnet im neuen Fenster) .
Sie untersuchten die Modelle Claude 3.7 Sonnet, GPT-4.1, Gemini 2.5 Pro und Grok 3 darauf, ob diese urheberrechtlich geschütztes Material reproduzieren können. Dies ist den Forschern zufolge aufgrund der in kommerziellen Modellen implementierten Sicherheitsmaßnahmen nicht selbstverständlich.
"Insgesamt konnten wir zeigen, dass es möglich ist, große Teile gespeicherter urheberrechtlich geschützter Texte aus allen vier Produktions-Sprachmodellen zu extrahieren, wobei der Erfolg je nach Versuchsbedingungen variiert" , schreiben die Studienautoren.
GPT-4.1 gab nur vier Prozent wieder
Während bei Claude 3.7 Sonnet ein Jailbreak nötig war, um 95,8 Prozent des Romans Harry Potter und der Stein der Weisen zu extrahieren, gaben Gemini 2.5 Pro und Grok 3 76,8 bzw. 70,3 Prozent des Buches auch ohne Jailbreak aus. Am resistentesten erwies sich GPT-4.1, welches auch nach diversen Anfragen lediglich vier Prozent des Romans reproduzierte.
Die Forscher gaben ihre Erkenntnisse an Anthropic, Google Deepmind, OpenAI und xAI weiter und stellten fest, dass die angewendeten Verfahren nach Ablauf der 90-tägigen Meldefrist bei einigen Anbietern weiterhin funktionierten. Welche Unternehmen keine Maßnahmen ergriffen haben, wurde nicht genannt.
Erkenntnisse für Urheberrechtsdebatte relevant
Weiter hieß es, dass man die rechtliche Bewertung anderen überlasse, die Erkenntnisse aber für die laufende Urheberrechtsdebatte relevant sein könnten. Der Anteil der wiedergegebenen Inhalte ist in den USA von großer Bedeutung, da bei Anwendung der dortigen Fair-Use-Regelung auch der Umfang des verwendeten Auszugs im Verhältnis zum gesamten Werk betrachtet wird.
In einer früheren Studie testeten die Forscher öffentlich verfügbare Sprachmodelle und stellten dabei fest, dass Metas Llama 3.1 fast die Hälfte des ersten Harry-Potter-Buchs wortwörtlich wiedergeben kann.