Zum Hauptinhalt Zur Navigation

Claude, Gemini, GPT und Grok: Auch kommerzielle LLMs geben Harry Potter wieder

Forscher haben Bezahlversionen von KI -Assistenten dazu gebracht, bis zu 95 Prozent des ersten Harry-Potter-Buchs wortwörtlich wiederzugeben.
/ Mike Faust
13 Kommentare News folgen (öffnet im neuen Fenster)
Am resistentesten zeigte sich GPT-4.1 und gab nur vier Prozent des ersten Harry-Potter-Bandes aus. (Bild: ZUMA Press Wire via Reuters Connect)
Am resistentesten zeigte sich GPT-4.1 und gab nur vier Prozent des ersten Harry-Potter-Bandes aus. Bild: ZUMA Press Wire via Reuters Connect

Auch Bezahlversionen von LLMs können den Inhalt von Büchern wortgetreu wiedergeben. Zu dieser Erkenntnis kommen die Forscher Ahmed Ahmed, A. Feder Cooper, Sanmi Koyejo und Percy Liang von den Universitäten Stanford und Yale in einem am 6. Januar 2026 veröffentlichtem Preprint-Paper(öffnet im neuen Fenster) .

Sie untersuchten die Modelle Claude 3.7 Sonnet, GPT-4.1, Gemini 2.5 Pro und Grok 3 darauf, ob diese urheberrechtlich geschütztes Material reproduzieren können. Dies ist den Forschern zufolge aufgrund der in kommerziellen Modellen implementierten Sicherheitsmaßnahmen nicht selbstverständlich.

"Insgesamt konnten wir zeigen, dass es möglich ist, große Teile gespeicherter urheberrechtlich geschützter Texte aus allen vier Produktions-Sprachmodellen zu extrahieren, wobei der Erfolg je nach Versuchsbedingungen variiert" , schreiben die Studienautoren.

GPT-4.1 gab nur vier Prozent wieder

Während bei Claude 3.7 Sonnet ein Jailbreak nötig war, um 95,8 Prozent des Romans Harry Potter und der Stein der Weisen zu extrahieren, gaben Gemini 2.5 Pro und Grok 3 76,8 bzw. 70,3 Prozent des Buches auch ohne Jailbreak aus. Am resistentesten erwies sich GPT-4.1, welches auch nach diversen Anfragen lediglich vier Prozent des Romans reproduzierte.

Die Forscher gaben ihre Erkenntnisse an Anthropic, Google Deepmind, OpenAI und xAI weiter und stellten fest, dass die angewendeten Verfahren nach Ablauf der 90-tägigen Meldefrist bei einigen Anbietern weiterhin funktionierten. Welche Unternehmen keine Maßnahmen ergriffen haben, wurde nicht genannt.

Erkenntnisse für Urheberrechtsdebatte relevant

Weiter hieß es, dass man die rechtliche Bewertung anderen überlasse, die Erkenntnisse aber für die laufende Urheberrechtsdebatte relevant sein könnten. Der Anteil der wiedergegebenen Inhalte ist in den USA von großer Bedeutung, da bei Anwendung der dortigen Fair-Use-Regelung auch der Umfang des verwendeten Auszugs im Verhältnis zum gesamten Werk betrachtet wird.

In einer früheren Studie testeten die Forscher öffentlich verfügbare Sprachmodelle und stellten dabei fest, dass Metas Llama 3.1 fast die Hälfte des ersten Harry-Potter-Buchs wortwörtlich wiedergeben kann.


Relevante Themen