KI-Klage der New York Times: OpenAI löscht versehentlich Beweise

Im Rechtsstreit zwischen OpenAI und der New York Times sowie anderen großen Zeitungen sei es zur Löschung von wichtigen Beweisen gekommen, wie unter anderem Wired mit Verweis auf ein Gerichtsdokument berichtet(öffnet im neuen Fenster) . Demnach haben Ingenieure von OpenAI versehentlich Daten gelöscht, die erklären sollten, wie die Zeitungsartikel der Medienunternehmen zum Training der KI verwendet wurden.
Von den OpenAI-Anwälten wurde das als Panne bezeichnet und auch die rechtlichen Vertreter der New York Times äußerten, dass es keinen Anlass gebe, von einer Absicht auszugehen. Wie genau es zu dem Fehler kam, wurde nicht erläutert. OpenAI habe zwar versucht, die gelöschten KI-Trainingsdaten wiederherzustellen, das Ergebnis sei aber unvollständig und nicht mehr zuverlässig.
Zuvor hätten Rechtsteams der Zeitungen mehr als 150 Stunden damit verbracht, diese Daten nach Fällen zu durchsuchen, in denen Nachrichtenartikel enthalten waren, heißt es in dem Bericht weiter. Die wiederhergestellten Informationen ließen sich nun aber nicht mehr dazu nutzen, entsprechende Stellen in den Trainingsdaten zu finden.
Keine Dateinamen und Ordnerstruktur mehr vorhanden
Um das Durchsuchen der Trainingsdaten zu ermöglichen, wurde von OpenAI zwei virtuelle Maschinen erstellt, die von den Anwälten und deren Teams durchsucht werden durften. Auf einer dieser Maschinen seien bereits durchsuchte und gesammelte Daten allerdings gelöscht wurden, erläuterten die Anwälte der New York Times.
In der von OpenAI wiederhergestellten Version der Daten fehlten allerdings alle Dateinamen und jede Ordnerstruktur, wodurch das Rechtsteam seine Arbeit wieder neu beginnen musste.
OpenAI wird in mehreren Fällen die Verletzung von Urheberrechten vorgeworfen. So bekräftige erst im Oktober 2024 ein ehemaliger OpenAI-Forscher das rücksichtslose Vorgehen beim Sammeln von Trainingsdaten , und auch die deutsche Verwertungsgesellschaft Gema verklagt OpenAI wegen der Nutzung unlizenzierter Liedtexte .