Zum Hauptinhalt Zur Navigation

KI-Antworten schwächen die Wikipedia

So nutzen die Modelle für Trainingszwecke bevorzugt Quellen wie die Wikipedia. Das Lexikon bietet schließlich überprüftes Wissen in Hunderten von Sprachen. Die Anbieter sollten daher Wert darauf legen, dass diese Quelle weiterhin fließt. Wikimedia Enterprise, das kommerzielle Angebot der Wikimedia-Stiftung, stellt dazu über das Google-Projekt Kaggle inzwischen vorbereitete Datensätze bereit .

Weiterhin können die KI-Firmen auf die Lexikonartikel über eine kostenpflichtige API zugreifen . Dadurch werden die Server nicht so stark belastet wie durch das übliche Scrapen des Internets.

Von diesem Angebot machen inzwischen etliche große Anbieter Gebrauch. Zum 25. Jubiläum teilte die Stiftung mit(öffnet im neuen Fenster) : "Im Laufe des vergangenen Jahres sind mehrere Unternehmen – darunter Ecosia, Microsoft, Mistral AI, Perplexity, Pleias und Prorata – neue Partner von Wikimedia Enterprise geworden und haben sich damit bestehenden Partnern wie Amazon, Google und Meta angeschlossen."

Nutzerzahlen gehen zurück

Nicht im Interesse des Lexikons sind hingegen die KI-Zusammenfassungen bei Suchanfragen. Denn nicht nur Medien leider darunter , wenn der Traffic auf ihr werbefinanziertes Angebot ausbleibt. Für ein werbefreies Angebot wie die Wikipedia bleibt das ebenfalls nicht ohne Folgen.

Einer Analyse vom Oktober 2025 zufolge gingen in der Wikipedia die Zugriffe durch menschliche Nutzer um acht Prozent im Vergleich zum Vorjahreszeitraum zurück. Laut Daten von Similarweb(öffnet im neuen Fenster) sank die Zahl der täglichen Besucher zwischen März 2022 und März 2025 um 22,4 Prozent.

Der leitende Produktdirektor der Wikimedia-Stiftung, Marshall Miller, glaubt, dass dies den Einfluss von generativer KI und sozialen Medien auf die Suche nach Informationen widerspiegelt. Mit weniger Besuchern werde es auch weniger Freiwillige geben, die Wikipedia mit ihren Inhalten bereicherten und weiter vergrößerten.

Zudem dürfte die Wertschätzung für das Lexikon sinken, wenn Nutzer zwar dessen Inhalte indirekt über die KI-Systeme lesen, aber die eigentliche Quelle nicht kennen, da sie nicht auf die Webseite gelangen. Dadurch könnte die Bereitschaft sinken, für die Aufrechterhaltung der Infrastruktur und der Verwaltung zu spenden. Zudem werden die Spenden in lokalen Vereinen wie Wikimedia Deutschland genutzt, um die Verbreitung von freiem Wissen zu fördern.

Wie kommen KI-generierte Inhalte in die Wikipedia?

Eine weitere Herausforderung für das Lexikon entsteht durch die Möglichkeit, dass Artikel mithilfe von generativer KI bearbeitet oder ganz erstellt werden. Die Gefahr besteht dabei nicht in offensichtlichem KI-Müll, der in die Artikel hineingetragen wird. So gibt es in der englischsprachigen Wikipedia die Möglichkeit , neue Artikel für eine sofortige Löschung vorzuschlagen, wenn sie von einem großen Sprachmodell ohne menschliche Überprüfung erstellt wurden.

Massenedits durch einzelne Autoren, die in kurzer Zeit sehr viele Texte schreiben oder umschreiben, dürften ebenfalls schnell auffallen. Deutlich schwieriger wird es wahrscheinlich, plausibel erscheinende Beiträge von KI-Tools zu erkennen und auf mögliche Fehler hin zu überprüfen.

Falsche ISBN-Daten als KI-Indiz

Wie das möglich sein kann, erläuterte der langjährige Wikipedianer Mathias Schindler in einem Vortrag auf dem Chaos Communication Congress(öffnet im neuen Fenster) (39C3) Ende Dezember 2025 in Hamburg. Schindler war auf das Problem aufmerksam geworden, als er mithilfe eines Tools(öffnet im neuen Fenster) die ISBN-Daten in Wikipedia-Artikeln überprüfen wollte.

Dabei stellte sich heraus, dass bei etlichen zitierten Quellen nicht nur die ISBN falsch war, sondern die angegebenen Bücher gar nicht existierten.


Relevante Themen