ChatGPT, Stable Diffusion, Dall-E: Die Crux mit dem Opt-out aus Text- und Data-Mining

Wer nicht will, dass seine Werke im Netz für das Training von Text- und Bildgeneratoren genutzt werden, muss dem in maschinenlesbarer Form widersprechen. Das kann bisher nur recht pauschal erfolgen.

Ein Bericht von Stefan Krempl veröffentlicht am
Wer nicht möchte, dass seine Texte, Bilder oder Videos zum Training von Text- oder Bild-KIs verwendet werden, steht vor einem nicht kleinen Problem.
Wer nicht möchte, dass seine Texte, Bilder oder Videos zum Training von Text- oder Bild-KIs verwendet werden, steht vor einem nicht kleinen Problem. (Bild: Stefani Reynolds/AFP via Getty Images)

Künstler und Organisationen, die mit kreativen Schöpfungen Geld verdienen, empfinden die Konkurrenz durch KI zunehmend als Affront. Denn die Betreiber von Text- und Bildgeneratoren wie ChatGPT und Dall-E trainieren ihre KIs auch mit ihren Werken – die Künstler und Autoren werden nicht gefragt. Zwar gibt es eine Möglichkeit, dem zu widersprechen, allerdings laufen dann etwa Verlage Gefahr, nicht mehr in den großen Suchmaschinen aufzutauchen.

Inhalt:
  1. ChatGPT, Stable Diffusion, Dall-E: Die Crux mit dem Opt-out aus Text- und Data-Mining
  2. Wie kann der Nutzungsvorbehalt konkret aussehen?

Spätestens seit dem Hype um den Textroboter ChatGPT von OpenAI reiht sich bei der generativen künstlichen Intelligenz (KI), mit deren Hilfe aus alten Inhalten neue zusammengesetzt werden, ein Durchbruch an den nächsten. Nach Microsofts Bing will auch Google mit dem noch unveröffentlichten Wettbewerber Bard dabei sein, Facebook hat sein Projekt Llama (Large Language Model Meta AI) angekündigt. Diejenigen, die von ihren Bildern, Texten, Videos und Audios leben, bringt das auf.

Grund für den Unmut: ChatGPT sowie Bildgeneratoren wie Dall-E, Stable Diffusion und Midjourney beruhen auf großen Sprach- beziehungsweise Bildmodellen wie GPT-3, Google Lamda und Chinchilla. Die Betreiber trainieren sie mit Millionen von Fotos, Audiodateien und Texten, die sie im Internet finden. Dabei fragen sie die Urheber und Verwerter nicht, ob sie mit dieser Nutzung einverstanden sind. Der Einsatz der teils geschützten Werke ist im Bereich der KI-Modellierung nötig, um die Algorithmen für maschinelles Lernen in die Lage zu versetzen, aus dem vorhandenen Material Muster zu erkennen und darauf basierend adaptive Inhalte zu erstellen.

Hiesige Verlegerverbände appellierten jüngst an die Politik, sicherzustellen, dass KI "nicht die Leistung der Verlage und ihrer Redaktionen ausbeuten kann". Wenn das geltende Urheber- und Leistungsschutzrecht "dafür keine hinreichende Handhabe enthalten sollte", müsse es angepasst werden.

Abgeordnete und das Bundesjustizministerium halten ein Eingreifen zwar derzeit nicht für erforderlich. Doch es drohen Klagen: Gegen das britische Unternehmen Stability AI, das hinter Stable Diffusion und darauf basierenden Apps wie Lensa steht, und weitere Hersteller laufen schon Gerichtsverfahren in den USA und Großbritannien.

Text- und Data-Mining in der EU offiziell erlaubt

In der EU haben die Gesetzgebungsgremien mit der jüngsten Urheberrechtsnovelle Ausnahmen vom exklusiven Verwertungsrecht für das Text- und Data-Mining festgelegt.

Der Bundestag hat diese Vorgabe in den Paragrafen 60d und 44b Urheberrechtsgesetz umgesetzt. Zulässig sind demnach Vervielfältigungen von rechtmäßig zugänglichen digitalen Werken etwa für das Algorithmentraining, "um daraus Informationen insbesondere über Muster, Trends und Korrelationen zu gewinnen".

Dazu berechtigt sind Forschungseinrichtungen, sofern sie keine kommerziellen Zwecke verfolgen, sämtliche Gewinne in die Wissenschaft reinvestieren oder "im Rahmen eines staatlich anerkannten Auftrags im öffentlichen Interesse tätig sind". Das soll zumindest ein großflächiges Datenschürfen durch Forschungsstätten im Dienste von Unternehmen verhindern.

Urheber und Verwerter, die trotz solcher Vorkehrungen ein Text- und Data-Mining bei ihren online verfügbaren Werken verhindern wollen, können sich Nutzungen selbst vorbehalten. Eine solche Ansage ist nur dann wirksam, wenn sie "in maschinenlesbarer Form erfolgt". Bei nicht online zugänglichen Inhalten kann der Nutzungsvorbehalt laut der Gesetzesbegründung "auch in anderer Weise erklärt werden".

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
Wie kann der Nutzungsvorbehalt konkret aussehen? 
  1. 1
  2. 2
  3.  


Lorphos 10. Mär 2023 / Themenstart

Das Feld in den EXIF Daten bietet sich doch dafür an. Es ist für Urheberrechts...

VirusBlackBox 09. Mär 2023 / Themenstart

Den Cache bemängelt doch keiner, abgesehen von der Industrie. Wenn du nun aber Teile des...

Salzbretzel 09. Mär 2023 / Themenstart

Ich finde es ja auch immer amüsant, dass man neuen Dingen ganz plötzlich explizit...

Kommentieren



Aktuell auf der Startseite von Golem.de
Schneller als SSDs
Eine RAM-Festplatte bricht Geschwindigkeitsrekorde

Schneller als SSDs und unendlich oft beschreibbar: Das verspricht ein Speichermedium, das RAM-Chips nutzt, aber über NVMe angesprochen wird.

Schneller als SSDs: Eine RAM-Festplatte bricht Geschwindigkeitsrekorde
Artikel
  1. Elektrovan: Renault präsentiert Kangoo E-Tech Electric
    Elektrovan
    Renault präsentiert Kangoo E-Tech Electric

    Der neue Kangoo E-Tech Electric von Renault bietet Platz für bis zu fünf Personen, 1.730 Liter Ladevolumen und bis zu 285 km Reichweite.

  2. Altersdiskriminierung in der IT: Schluss mit Projekten, Sie kochen hier nur noch Kaffee
    Altersdiskriminierung in der IT
    Schluss mit Projekten, Sie kochen hier nur noch Kaffee

    Altersdiskriminierung betrifft in der IT nicht nur ältere, sondern auch junge Mitarbeiter. Ob bei Stellenausschreibung oder im Job - wann es lohnt, dafür vor Gericht zu ziehen.
    Von Harald Büring

  3. Solarstrom: Greenakku bietet Balkonkraftwerk mit Speicherakku an
    Solarstrom
    Greenakku bietet Balkonkraftwerk mit Speicherakku an

    Die Balkonkraftwerke von Greenakku sind ab sofort auch in Sets mit einem Akku verfügbar. So wird überschüssige Energie gespeichert.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    • Daily Deals • LG OLED TV -57% • MindStar: Ryzen 9 7900X3D 625€, Palit RTX 4070 Ti 879€ • Amazon Coupon-Party • Samsung ext. SSD 2TB 159,90€ • Neue RAM-Tiefstpreise • Sandisk MicroSDXC 256GB -69% • Bosch Professional-Rabatte • Otto Oster-Angebote • 38-GB-Allnet-Flat 12,99€/Monat [Werbung]
    •  /