ChatGPT, Stable Diffusion, Dall-E: Die Crux mit dem Opt-out aus Text- und Data-Mining
Wer nicht will, dass seine Werke im Netz für das Training von Text- und Bildgeneratoren genutzt werden, muss dem in maschinenlesbarer Form widersprechen. Das kann bisher nur recht pauschal erfolgen.

Künstler und Organisationen, die mit kreativen Schöpfungen Geld verdienen, empfinden die Konkurrenz durch KI zunehmend als Affront. Denn die Betreiber von Text- und Bildgeneratoren wie ChatGPT und Dall-E trainieren ihre KIs auch mit ihren Werken – die Künstler und Autoren werden nicht gefragt. Zwar gibt es eine Möglichkeit, dem zu widersprechen, allerdings laufen dann etwa Verlage Gefahr, nicht mehr in den großen Suchmaschinen aufzutauchen.
- ChatGPT, Stable Diffusion, Dall-E: Die Crux mit dem Opt-out aus Text- und Data-Mining
- Wie kann der Nutzungsvorbehalt konkret aussehen?
Spätestens seit dem Hype um den Textroboter ChatGPT von OpenAI reiht sich bei der generativen künstlichen Intelligenz (KI), mit deren Hilfe aus alten Inhalten neue zusammengesetzt werden, ein Durchbruch an den nächsten. Nach Microsofts Bing will auch Google mit dem noch unveröffentlichten Wettbewerber Bard dabei sein, Facebook hat sein Projekt Llama (Large Language Model Meta AI) angekündigt. Diejenigen, die von ihren Bildern, Texten, Videos und Audios leben, bringt das auf.
Grund für den Unmut: ChatGPT sowie Bildgeneratoren wie Dall-E, Stable Diffusion und Midjourney beruhen auf großen Sprach- beziehungsweise Bildmodellen wie GPT-3, Google Lamda und Chinchilla. Die Betreiber trainieren sie mit Millionen von Fotos, Audiodateien und Texten, die sie im Internet finden. Dabei fragen sie die Urheber und Verwerter nicht, ob sie mit dieser Nutzung einverstanden sind. Der Einsatz der teils geschützten Werke ist im Bereich der KI-Modellierung nötig, um die Algorithmen für maschinelles Lernen in die Lage zu versetzen, aus dem vorhandenen Material Muster zu erkennen und darauf basierend adaptive Inhalte zu erstellen.
Hiesige Verlegerverbände appellierten jüngst an die Politik, sicherzustellen, dass KI "nicht die Leistung der Verlage und ihrer Redaktionen ausbeuten kann". Wenn das geltende Urheber- und Leistungsschutzrecht "dafür keine hinreichende Handhabe enthalten sollte", müsse es angepasst werden.
Abgeordnete und das Bundesjustizministerium halten ein Eingreifen zwar derzeit nicht für erforderlich. Doch es drohen Klagen: Gegen das britische Unternehmen Stability AI, das hinter Stable Diffusion und darauf basierenden Apps wie Lensa steht, und weitere Hersteller laufen schon Gerichtsverfahren in den USA und Großbritannien.
Text- und Data-Mining in der EU offiziell erlaubt
In der EU haben die Gesetzgebungsgremien mit der jüngsten Urheberrechtsnovelle Ausnahmen vom exklusiven Verwertungsrecht für das Text- und Data-Mining festgelegt.
Der Bundestag hat diese Vorgabe in den Paragrafen 60d und 44b Urheberrechtsgesetz umgesetzt. Zulässig sind demnach Vervielfältigungen von rechtmäßig zugänglichen digitalen Werken etwa für das Algorithmentraining, "um daraus Informationen insbesondere über Muster, Trends und Korrelationen zu gewinnen".
Dazu berechtigt sind Forschungseinrichtungen, sofern sie keine kommerziellen Zwecke verfolgen, sämtliche Gewinne in die Wissenschaft reinvestieren oder "im Rahmen eines staatlich anerkannten Auftrags im öffentlichen Interesse tätig sind". Das soll zumindest ein großflächiges Datenschürfen durch Forschungsstätten im Dienste von Unternehmen verhindern.
Urheber und Verwerter, die trotz solcher Vorkehrungen ein Text- und Data-Mining bei ihren online verfügbaren Werken verhindern wollen, können sich Nutzungen selbst vorbehalten. Eine solche Ansage ist nur dann wirksam, wenn sie "in maschinenlesbarer Form erfolgt". Bei nicht online zugänglichen Inhalten kann der Nutzungsvorbehalt laut der Gesetzesbegründung "auch in anderer Weise erklärt werden".
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
- ohne Werbung
- mit ausgeschaltetem Javascript
- mit RSS-Volltext-Feed
Wie kann der Nutzungsvorbehalt konkret aussehen? |
- 1
- 2
Das Feld in den EXIF Daten bietet sich doch dafür an. Es ist für Urheberrechts...
Den Cache bemängelt doch keiner, abgesehen von der Industrie. Wenn du nun aber Teile des...
Ich finde es ja auch immer amüsant, dass man neuen Dingen ganz plötzlich explizit...
Kommentieren