• IT-Karriere:
  • Services:

Machine Learning: Yahoo veröffentlicht 13 TByte Daten an Nutzerverhalten

Für Forscher gibt Yahoo einen riesigen Datensatz frei, der den Umgang mit Nachrichten von Nutzern enthält. Gedacht ist dies für maschinelles Lernen und die Erprobung von Vorschlagsystemen.

Artikel veröffentlicht am ,
Yahoo gibt eigene Daten für die Forschung frei.
Yahoo gibt eigene Daten für die Forschung frei. (Bild: Yahoo)

Der Forschergemeinschaft sei es großes Interesse, neue Algorithmen und Methoden an den Daten von produktiven Anwendungen zu testen, heißt es bei Yahoo. Das Unternehmen stellt deshalb nun mit 13,5 TByte einen vergleichsweise sehr großen Datensatz bereit, mit dem vor allem die Forschung im Bereich des maschinellen Lernens vorangetrieben werden soll.

Stellenmarkt
  1. TenneT TSO GmbH, Bayreuth, Lehrte/Ahlten
  2. pd digital Hub GmbH, Augsburg

Die Daten sind zwischen Februar und Mai 2015 gesammelt worden und umfassen Aufzeichnungen des Umgangs von Nutzern mit Nachrichteneinträgen auf verschiedenen Seiten, etwa Yahoo News, Yahoo Sports oder auch Yahoo Finance. Es handele sich dabei um etwa 20 Millionen unterschiedliche Anwender sowie um rund 110 Milliarden selbstständige Ereignisse.

Die Datensätze sind dabei weitgehend anonymisiert, so dass sich keine Rückschlüsse auf konkrete Personen ergeben sollten. Allerdings stehen zu der eigentlichen Aufzeichnung des Verhaltens zu einem Teil der Nutzer auch demografische Informationen zur Verfügung wie etwa das Alter, das Geschlecht oder eine ungefähre geografische Zuordnung.

Der vollständige Datensatz ist von Yahoos Abteilung zur Personalisierung seines Angebots genutzt worden, um Verhalten zu modellieren, ein System für Vorschläge aufzubauen, bestimmte Onlinealgorithmen zu testen sowie für maschinelles Lernen in einem sehr großen verteilten Netzwerk. Yahoo hofft nun auf ähnliche Anwendungsfelder der Daten im akademischen Kontext.

Bereitgestellt wird der Datensatz über das Angebot Webscope, in dem sich weitere anonymisierte Nutzerdaten finden, die für nichtkommerzielle Zwecke genutzt werden können.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Anzeige
Hardware-Angebote
  1. täglich neue Deals bei Alternate.de

grünebanane 16. Jan 2016

Richtig, poste mal die Ergebnisse. MfG

Cok3.Zer0 16. Jan 2016

Business Intelligence ist ein großes und wichtiges Feld.

elgooG 15. Jan 2016

"""Der Datensatz""" würde sich auch sonst für viele andere Testzwecke eignen. 13 TB sind...

elgooG 15. Jan 2016

Verzei mir die Frage, aber dir ist tatsächlich noch nie BBCode untergekommen, oder...

sol 15. Jan 2016

Ich habe Yahoo immer nur genutzt um Google zu suchen.


Folgen Sie uns
       


Neue Funktionen in Android 11 im Überblick

Wir stellen die neuen Features von Android 11 kurz im Video vor.

Neue Funktionen in Android 11 im Überblick Video aufrufen
Apple: iPhone 12 bekommt Magnetrücken und kleinen Bruder
Apple
iPhone 12 bekommt Magnetrücken und kleinen Bruder

Das iPhone 12 ist mit einem 6,1-Zoll- und das iPhone 12 Mini mit einem 5,4-Zoll-Display ausgerüstet. Ladegerät und Kopfhörer fallen aus Gründen des Umweltschutzes weg.

  1. Apple iPhone 12 Pro und iPhone 12 Pro Max werden größer
  2. Apple iPhone 12 verspätet sich
  3. Back Tap iOS 14 erkennt Trommeln auf der iPhone-Rückseite

Corsair K60 RGB Pro im Test: Teuer trotz Viola
Corsair K60 RGB Pro im Test
Teuer trotz Viola

Corsair verwendet in der K60 Pro RGB als erster Hersteller Cherrys neue preiswerte Viola-Switches. Anders als Cherrys günstige MY-Schalter aus den 80ern hinterlassen diese einen weitaus besseren Eindruck bei uns - der Preis der Tastatur hingegen nicht.
Ein Test von Tobias Költzsch

  1. Corsair K100 RGB im Test Das RGB-Monster mit der Lichtschranke
  2. Corsair Externes Touchdisplay ermöglicht schnelle Einstellungen
  3. Corsair One a100 im Test Ryzen-Wasserturm richtig gemacht

Tutorial: Was ein On Screen Display alles kann
Tutorial
Was ein On Screen Display alles kann

Werkzeugkasten Viele PC-Spieler schwören auf ein OSD. Denn damit lassen sich Limits erkennen, die Bildqualität verbessern und Ruckler verringern.
Von Marc Sauter


      •  /