Abo
  • Services:

Neuronale Netzwerke: KI findet in Wikipedia zitierbedürftige Artikel

Artikel mit Zitaten zu belegen, ist eine wichtige Regel auf Wikipedia. Ein selbst entwickeltes KI-System soll helfen, Beiträge ohne Zitate oder mit schlechter Quellenlage zu finden. Dafür hat das Team mit Autoren und Lesern zusammengearbeitet.

Artikel veröffentlicht am ,
Wikipedia hat viele Artikel ohne Zitat - das soll sich ändern.
Wikipedia hat viele Artikel ohne Zitat - das soll sich ändern. (Bild: Pixabay.com/CC0 1.0)

Die Wikimedia Foundation hat ein neuronales Netzwerk entwickelt, das die vielen Artikel auf der Enzyklopädie Wikipedia durchsucht. Es soll analysieren, welche Artikel mit Zitaten belegt werden sollten, berichtet das US-Magazin Venturebeat. Das sei aufgrund der eigenen Regeln bei vielen Beiträgen notwendig. "Alle Zitate und sämtliches Material, dessen Nachweisbarkeit angefochten wurde oder wahrscheinlich wird, müssen ein Inline-Zitat im Text oder als Fußnote enthalten, die das Material direkt belegen", sagte der Forscher und Co-Author der Zitatstudie, Jonathan Morgan.

Stellenmarkt
  1. Fraunhofer-Institut für Optronik, Systemtechnik und Bildauswertung IOSB, Ilmenau
  2. ADAC Ostwestfalen-Lippe e.V., Bielefeld

Die Herausforderung ist es dabei, einen automatisierten Algorithmus zu entwickeln, der die Stellen erkennt, an denen Zitate nach den Regeln von Wikipedia benötigt werden. Die Software muss die Bedeutung von Worten und Sätzen verstehen. Zu diesem Zweck bat das Team 36 Wikipedia-Autoren für englische, französische und italienische Texte um Hilfe. Sie stellten eine Liste zusammen, warum und wann Zitate benötigt werden. Diese Liste stellen die Entwickler auf Wikipedia zur Verfügung.

Recht hohe Genauigkeit erreicht

Anhand dieser Regeln konnten die Forscher ein Recurrent Neural Network erstellen, das durch Featured-Artikel trainiert wurde. Diese gelten als die Beiträge mit den höchsten Qualitätsansprüchen und daher als sinnvolle Grundlage. Das neuronale Netzwerk bewertete zunächst Textzeilen nur als positiv oder negativ, je nachdem, ob ein Zitat vorhanden ist oder nicht. Das System konnte damit schon einmal mit 90 Prozent Genauigkeit Artikel filtern, die Zitate benötigen.

Ein zweites neuronales Netzwerk erkennt zudem in Artikel Meinungen und Fakten und filtert daher noch etwas genauer nach Zitierbedarf. Dazu ließ das Team menschliche Leser 4.000 Sätze ohne Zitatsnachweis lesen. Diese kategorisierten die Sätze - etwa nach Meinung oder historischem Fakt. Das Ergebnis war ein noch genaueres System.

Momentan kann die Wikimedia Foundation ihre Software nur für englischsprachige Artikel anwenden. Das soll sich in Zukunft ändern. Allerdings dürfte dieser Prozess weiterhin aufwendig bleiben, da andere Sprachen auch andere Grammatik, Wortbedeutungen und Regeln mit sich bringen. Nach Englisch ist die deutsche Sprache die am meisten verwendete auf der Plattform. Eventuell gehört sie zu den ersten, für die das neuronale Netzwerk genutzt wird.



Anzeige
Spiele-Angebote
  1. 4,99€
  2. (-30%) 4,61€
  3. 49,99€
  4. 4,99€

AllDayPiano 14. Apr 2019 / Themenstart

Geh mir bitte nicht auf die nerven. Wenn du keinen Link öffnen kannst, dann kann ich dir...

Hotohori 14. Apr 2019 / Themenstart

War auch mein Gedanke, einfach bei allem das Internet Archive als Zitat nutzen, die...

mnementh 14. Apr 2019 / Themenstart

Das ist kein Blut, sondern irgend eine rote Pflanze. Aber die wurde schon gewählt, um...

HitEmUp 12. Apr 2019 / Themenstart

Die Wikipedia sollte mal anfangen Geheimdienst Agenten die als Admins in Wikipedia...

TrollNo1 12. Apr 2019 / Themenstart

Ich habe das auch nie verstanden, warum man so viel zitieren muss. Fand ich immer nervig...

Kommentieren


Folgen Sie uns
       


Sechs Bluetooth-Hörstöpsel im Test

Wir haben sechs neue Bluetooth-Hörstöpsel getestet. Mit dabei sind Modelle von Sennheiser, Audio Technica, Master & Dynamic sowie HMD Global. Aber auch zwei Modelle kleinerer Startups sind vertreten. Und eines davon hat uns bezüglich der Akkulaufzeit sehr überrascht. Kein anderer von uns getesteter Bluetooth-Hörstöpsel hat bisher eine vergleichbar lange Akkulaufzeit zu bieten - wir kamen auf Werte von bis zu 11,5 Stunden statt der sonst üblichen drei bis fünf Stunden.

Sechs Bluetooth-Hörstöpsel im Test Video aufrufen
Energie: Warum Japan auf Wasserstoff setzt
Energie
Warum Japan auf Wasserstoff setzt

Saubere Luft und Unabhängigkeit von Ölimporten: Mit der Umstellung der Wirtschaft auf den Energieträger Wasserstoff will die japanische Regierung gleich zwei große politische Probleme lösen. Das Konzept erscheint attraktiv, hat aber auch entscheidende Nachteile.
Eine Analyse von Werner Pluta


    Leistungsschutzrecht: Das Lügen geht weiter
    Leistungsschutzrecht
    Das Lügen geht weiter

    Selbst nach der Abstimmung über die EU-Urheberrechtsreform gehen die "Lügen für das Leistungsschutzrecht" weiter. Auf dieser Basis darf die Regierung nicht final den Plänen zum Leistungsschutzrecht zustimmen.
    Eine Analyse von Friedhelm Greis

    1. Urheberrechtsreform Was das Internet nicht vergessen sollte
    2. Urheberrecht Uploadfilter und Leistungsschutzrecht endgültig beschlossen
    3. Urheberrecht Merkel bekräftigt Zustimmung zu Uploadfiltern

    ANC-Kopfhörer im Test: Mit Ach und Krach
    ANC-Kopfhörer im Test
    Mit Ach und Krach

    Der neue ANC-Kopfhörer von Audio Technica ist in einem Bereich sogar besser als unsere derzeitigen Favoriten von Sony und Bose - ausgerechnet in der entscheidenden Disziplin schwächelt er aber.
    Ein Test von Ingo Pakalski

    1. Surface Headphones Microsofts erster ANC-Bluetooth-Kopfhörer kostet 380 Euro
    2. Sonys WH-1000XM3 Oberklasse-ANC-Kopfhörer hat Kälteprobleme
    3. Sony-Kopfhörer WH-1000XM3 im Test Eine Oase der Stille oder des puren Musikgenusses

      •  /