Webseiten: Reddit sperrt das Internet Archive aus

Die Onlinecommunity Reddit werde es dem Internet Archive künftig nicht mehr erlauben, Snapshots von der Domain abzuspeichern und für alle zur Verfügung zu stellen. Das hat Reddit dem Magazin The Verge mitgeteilt(öffnet im neuen Fenster) . Dies sei ein Schritt, um KI-Unternehmen daran zu hindern, mittels des Internet Archives Daten von Reddit für ihre Modelltrainings zu verwenden.
"Wir wurden auf Fälle aufmerksam gemacht, in denen KI-Unternehmen gegen Plattformrichtlinien, einschließlich unserer, verstoßen und Daten von der Wayback-Machine abgreifen" , sagte Reddit-Sprecher Timt Rathschmidt The Verge. Erste Maßnahmen für den Block werden demnach bereits durchgeführt.
Der Preis muss stimmen, dann gibt es auch Daten
Rathschmit ergänzt: "Bis sie in der Lage sind, ihre Webseite zu schützen und die Plattformrichtlinien einzuhalten (z. B. Respektierung der Privatsphäre der Benutzer, Löschung entfernter Inhalte), beschränken wir ihren Zugriff auf einige Reddit-Daten, um Reddit-Nutzer zu schützen." Das Internet Archive solle zudem User darüber informieren, dass Reddit für sie eingeschränkt einsehbar sein werde. Die letzten Snapshots auf der Wayback-Machine des Internet Archives stammen vom 12. August um 2 Uhr morgens. Allerdings ist es aktuell nicht möglich, die Snapshots aufzurufen.
Reddit ergriff in der Vergangenheit bereits Maßnahmen, damit KI-Unternehmen ihre Modelle nicht an den Daten der Foren und Diskussionen trainieren können. Unter anderem wurde Anthropic vom Unternehmen verklagt . Allerdings ist Reddit dazu bereit, diesen Zugriff gegen Geld zu erlauben. So hat Reddit einen Vertrag mit Google geschlossen . Die Suchmaschine darf weiterhin Daten crawlen, während Konkurrenzprodukte wie Bing gesperrt wurden.