Wikidata: Eine Datenquelle für alle Sprachversionen von Wikipedia

Wikidata wird eine gemeinsame offene Datenquelle für alle Sprachversionen der freien Enzyklopädie Wikipedia verwirklichen. Die strukturierten Daten werden für andere Projekte offen zur Verfügung gestellt. Das Geld kommt von Paul Allen und Google.

Artikel veröffentlicht am ,
Paul Allen
Paul Allen (Bild: Paul AllenMark Wilson/Getty Images)

Wikimedia Deutschland startet mit Wikidata ein neues Projekt. Das gab der Betreiber der freien Enzyklopädie auf der Wikimedia Conference in Berlin bekannt. Wikimedia-Deutschland-Chef Pavel Richter sagte: "Wir betreten Neuland. Wikidata ist das größte technische Projekt, das jemals eine der 40 Länderorganisationen der Wikimedia-Bewegung in Angriff genommen hat." Ziel sei, durch Wikidata die Datenverwaltung der größten Wissenssammlung der Menschheit deutlich zu verbessern.

Stellenmarkt
  1. IT Projektmanager (m/w/d)
    Fresenius Medical Care, Bad Homburg
  2. IT-Mitarbeiterin (m/w/d)
    Hochschule für Musik und Tanz Köln, Köln
Detailsuche

Finanziert wird das Projekt Wikidata mit einer Spende des Microsoft-Mitbegründers Paul Allen, von dessen Allen Institute for Artificial Intelligenc 650.000 Euro kommen. Dessen Vizepräsident Mark Greaves sagte: "Wikidata baut auf semantischen Technologien auf, die wir seit langem unterstützen. Das Projekt wird den Takt wissenschaftlicher Entdeckungen beschleunigen und der Welt eine außergewöhnliche neue Datenquelle bereitstellen."

Insgesamt werden 1,3 Millionen Euro gebraucht. Ein Viertel der Entwicklungskosten von Wikidata kommt von der Gordon and Betty Moore Foundation, die sich im Bereich Umwelt und Wissenschaft engagiert. Ein weiteres Viertel der Wikidata-Finanzierung kommt von Google: Chris DiBona, Leiter des Bereichs Open Source, sagte: "Wir hoffen, dass damit erhebliche Mengen strukturierter Daten der Allgemeinheit zur Verfügung gestellt werden können."

Nach Fertigstellung übernimmt US-Zentrale

Der Projektvorschlag für Wikidata wurde mit finanzieller Unterstützung des EU-Projekts Render entwickelt. Das Team von acht Softwareentwicklern wird von Denny Vrandecic geleitet, der vom Karlsruher Institut für Technologie zu Wikimedia Deutschland wechselt. Vrandecic hat mit Markus Krötzsch von der University of Oxford das Semantic-Mediawiki-Projekt gegründet.

Golem Akademie
  1. Einführung in die Programmierung mit Rust
    21.-24. September 2021, online
  2. Elastic Stack Fundamentals - Elasticsearch, Logstash, Kibana, Beats
    26. - 28. Oktober 2021, online
Weitere IT-Trainings

Das erste Ziel Wikidatas ist es, die mehr als 280 Sprachversionen von Wikipedia mit einer einzigen gemeinsamen Datenquelle auszustatten, um weltweit die Daten der Artikel in allen Sprachen ergänzen und zentral pflegen zu können, was auch mehr Informationen in kleineren Sprachversionen von Wikipedia verfügbar macht.

Neben den Wikimedia-Projekten sollen auch externe Anwendungen die Daten nutzen können. "Mit Wikidata können Daten vernetzt und annotiert werden, was beispielsweise für wissenschaftliche und öffentliche Daten von großer Bedeutung ist. Die Wikidata-Inhalte werden unter einer freien Creative-Commons-Lizenz veröffentlicht", hieß es auf der Wikimedia Conference.

In der ersten Phase von Wikidata, die voraussichtlich bis August 2012 läuft, werden Links zwischen den verschiedenen Sprachversionen von Wikipedia zentral gesammelt. Danach können in der zweiten Phase Nutzer die Daten verwenden und neue hinzufügen. In der Abschlussphase wird die automatische Erstellung von Listen und Grafiken ermöglicht.

Wikimedia Deutschland ist für alle drei Phasen verantwortlich und übergibt anschließend den Betrieb und die Wartung von Wikidata an die Wikimedia Foundation in den USA. Geplanter Übergabertermin ist März 2013.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Glasfaser
Berliner Senat blamiert sich mit Gigabitstrategie

Der Berliner Senat ist nach Jahren aus dem Dämmerzustand hochgeschreckt und hat nun eine Gigabitstrategie. Warum haben sie nicht einfach geschwiegen?
Ein IMHO von Achim Sawall

Glasfaser: Berliner Senat blamiert sich mit Gigabitstrategie
Artikel
  1. Razer: Der erste Blade-Laptop mit Ryzen ist da
    Razer
    Der erste Blade-Laptop mit Ryzen ist da

    Wieder 14 Zoll, erstmals mit AMD-Chip: Das neue Razer Blade kombiniert einen 75-Watt-Ryzen mit der flottesten Geforce RTX.
    Ein Hands-on von Marc Sauter

  2. Selbständige: Vodafone mit neuen Tarifen ohne Preissteigerung
    Selbständige
    Vodafone mit neuen Tarifen ohne Preissteigerung

    Vodafone wird seine Preise in neuen Tarifen für Selbständige nach 24 Monaten nicht mehr anheben.

  3. Coronapandemie: Einige Microsoft-Admins schliefen direkt in Rechenzentren
    Coronapandemie
    Einige Microsoft-Admins schliefen direkt in Rechenzentren

    Um weite Arbeitswege und Verspätungen zu vermeiden, hatten es sich einige Microsoft-Mitarbeiter in den eigenen Rechenzentren bequem gemacht.

eiapopeia 03. Apr 2012

Konntest du. Danke!


Folgen Sie uns
       


  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Schnäppchen • Dualsense 59,99€ • Battlefield 2042 PC 53,99€ • XXL Sale bei Alternate • Rainbow Six Extraction Limited PS5 69,99€ • Sony Pulse 3D-Headset PS5 99,99€ • Snakebyte Gaming Seat Evo 149,99€ • Bethesda E3 Promo bei GP [Werbung]
    •  /