• IT-Karriere:
  • Services:

Neuronale Netzwerke: KI findet in Wikipedia zitierbedürftige Artikel

Artikel mit Zitaten zu belegen, ist eine wichtige Regel auf Wikipedia. Ein selbst entwickeltes KI-System soll helfen, Beiträge ohne Zitate oder mit schlechter Quellenlage zu finden. Dafür hat das Team mit Autoren und Lesern zusammengearbeitet.

Artikel veröffentlicht am ,
Wikipedia hat viele Artikel ohne Zitat - das soll sich ändern.
Wikipedia hat viele Artikel ohne Zitat - das soll sich ändern. (Bild: Pixabay.com/CC0 1.0)

Die Wikimedia Foundation hat ein neuronales Netzwerk entwickelt, das die vielen Artikel auf der Enzyklopädie Wikipedia durchsucht. Es soll analysieren, welche Artikel mit Zitaten belegt werden sollten, berichtet das US-Magazin Venturebeat. Das sei aufgrund der eigenen Regeln bei vielen Beiträgen notwendig. "Alle Zitate und sämtliches Material, dessen Nachweisbarkeit angefochten wurde oder wahrscheinlich wird, müssen ein Inline-Zitat im Text oder als Fußnote enthalten, die das Material direkt belegen", sagte der Forscher und Co-Author der Zitatstudie, Jonathan Morgan.

Stellenmarkt
  1. Dataport, Hamburg, Altenholz/Kiel, Magdeburg, Halle
  2. finanzen.de, Berlin

Die Herausforderung ist es dabei, einen automatisierten Algorithmus zu entwickeln, der die Stellen erkennt, an denen Zitate nach den Regeln von Wikipedia benötigt werden. Die Software muss die Bedeutung von Worten und Sätzen verstehen. Zu diesem Zweck bat das Team 36 Wikipedia-Autoren für englische, französische und italienische Texte um Hilfe. Sie stellten eine Liste zusammen, warum und wann Zitate benötigt werden. Diese Liste stellen die Entwickler auf Wikipedia zur Verfügung.

Recht hohe Genauigkeit erreicht

Anhand dieser Regeln konnten die Forscher ein Recurrent Neural Network erstellen, das durch Featured-Artikel trainiert wurde. Diese gelten als die Beiträge mit den höchsten Qualitätsansprüchen und daher als sinnvolle Grundlage. Das neuronale Netzwerk bewertete zunächst Textzeilen nur als positiv oder negativ, je nachdem, ob ein Zitat vorhanden ist oder nicht. Das System konnte damit schon einmal mit 90 Prozent Genauigkeit Artikel filtern, die Zitate benötigen.

Ein zweites neuronales Netzwerk erkennt zudem in Artikel Meinungen und Fakten und filtert daher noch etwas genauer nach Zitierbedarf. Dazu ließ das Team menschliche Leser 4.000 Sätze ohne Zitatsnachweis lesen. Diese kategorisierten die Sätze - etwa nach Meinung oder historischem Fakt. Das Ergebnis war ein noch genaueres System.

Momentan kann die Wikimedia Foundation ihre Software nur für englischsprachige Artikel anwenden. Das soll sich in Zukunft ändern. Allerdings dürfte dieser Prozess weiterhin aufwendig bleiben, da andere Sprachen auch andere Grammatik, Wortbedeutungen und Regeln mit sich bringen. Nach Englisch ist die deutsche Sprache die am meisten verwendete auf der Plattform. Eventuell gehört sie zu den ersten, für die das neuronale Netzwerk genutzt wird.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Anzeige
Top-Angebote
  1. (u. a. Nintendo Switch 270,00€, Gigabyte GeForce RTX 2070 Super Gaming OC für 479,00€, Zotac...
  2. 59,99€ (PC)/ 69,99€ (PS4, Xbox) - Release am 20. März
  3. 68,90€
  4. (aktuell u. a. Emtec X150 Power Plus SSD 480 GB für 52,90€, Apacer AS340 120 GB SSD für 18...

AllDayPiano 14. Apr 2019

Geh mir bitte nicht auf die nerven. Wenn du keinen Link öffnen kannst, dann kann ich dir...

Hotohori 14. Apr 2019

War auch mein Gedanke, einfach bei allem das Internet Archive als Zitat nutzen, die...

mnementh 14. Apr 2019

Das ist kein Blut, sondern irgend eine rote Pflanze. Aber die wurde schon gewählt, um...

HitEmUp 12. Apr 2019

Die Wikipedia sollte mal anfangen Geheimdienst Agenten die als Admins in Wikipedia...

TrollNo1 12. Apr 2019

Ich habe das auch nie verstanden, warum man so viel zitieren muss. Fand ich immer nervig...


Folgen Sie uns
       


Rahmenloser TV von Samsung (CES 2020)

Der fast unsichtbare Rand des Q950TS hat anscheinend nicht nur Vorteile.

Rahmenloser TV von Samsung (CES 2020) Video aufrufen
Ryzen Mobile 4000 (Renoir): Lasst die Ära der schrottigen AMD-Notebooks enden!
Ryzen Mobile 4000 (Renoir)
Lasst die Ära der schrottigen AMD-Notebooks enden!

Seit vielen Jahren gibt es kaum Premium-Geräte mit AMD-Chips und selbst bei vermeintlich identischer Ausstattung fehlen Eigenschaften wie eine beleuchtete Tastatur oder Thunderbolt 3. Schluss damit!
Ein IMHO von Marc Sauter

  1. HEDT-Prozessor 64-kerniger Threadripper schlägt 20.000-Dollar-Xeons
  2. Ryzen Mobile 4000 AMDs Renoir hat acht 7-nm-Kerne für Ultrabooks
  3. Zen+ AMD verkauft Ryzen 5 1600 mit flotteren CPU-Kernen

Amazon, Netflix und Sky: Disney bringt 2020 den großen Umbruch beim Videostreaming
Amazon, Netflix und Sky
Disney bringt 2020 den großen Umbruch beim Videostreaming

In diesem Jahr wird sich der Video-Streaming-Markt in Deutschland stark verändern. Der Start von Disney+ setzt Netflix, Amazon und Sky gehörig unter Druck. Die ganz großen Umwälzungen geschehen vorerst aber woanders.
Eine Analyse von Ingo Pakalski

  1. Peacock NBC Universal setzt gegen Netflix auf Gratis-Streaming
  2. Joyn Plus+ Probleme bei der Kündigung
  3. Android TV Magenta-TV-Stick mit USB-Anschluss vergünstigt erhältlich

Elektroautos in Tiefgaragen: Was tun, wenn's brennt?
Elektroautos in Tiefgaragen
Was tun, wenn's brennt?

Was kann passieren, wenn Elektroautos in einer Tiefgarage brennen? Während Brandschutzexperten dringend mehr Forschung fordern und ein Parkverbot nicht ausschließen, wollen die Bundesländer die Garagenverordnung verschärfen.
Eine Analyse von Friedhelm Greis

  1. Mercedes E-Econic Daimler elektrifiziert den Müllwagen
  2. Umweltprämie für Elektroautos Regierung verzögert Prüfung durch EU-Kommission
  3. Intransparente Preise Verbraucherschützer mahnen Ladenetzbetreiber New Motion ab

    •  /