Abo
  • Services:
Anzeige
Yahoo gibt eigene Daten für die Forschung frei.
Yahoo gibt eigene Daten für die Forschung frei. (Bild: Yahoo)

Machine Learning: Yahoo veröffentlicht 13 TByte Daten an Nutzerverhalten

Yahoo gibt eigene Daten für die Forschung frei.
Yahoo gibt eigene Daten für die Forschung frei. (Bild: Yahoo)

Für Forscher gibt Yahoo einen riesigen Datensatz frei, der den Umgang mit Nachrichten von Nutzern enthält. Gedacht ist dies für maschinelles Lernen und die Erprobung von Vorschlagsystemen.

Der Forschergemeinschaft sei es großes Interesse, neue Algorithmen und Methoden an den Daten von produktiven Anwendungen zu testen, heißt es bei Yahoo. Das Unternehmen stellt deshalb nun mit 13,5 TByte einen vergleichsweise sehr großen Datensatz bereit, mit dem vor allem die Forschung im Bereich des maschinellen Lernens vorangetrieben werden soll.

Anzeige

Die Daten sind zwischen Februar und Mai 2015 gesammelt worden und umfassen Aufzeichnungen des Umgangs von Nutzern mit Nachrichteneinträgen auf verschiedenen Seiten, etwa Yahoo News, Yahoo Sports oder auch Yahoo Finance. Es handele sich dabei um etwa 20 Millionen unterschiedliche Anwender sowie um rund 110 Milliarden selbstständige Ereignisse.

Die Datensätze sind dabei weitgehend anonymisiert, so dass sich keine Rückschlüsse auf konkrete Personen ergeben sollten. Allerdings stehen zu der eigentlichen Aufzeichnung des Verhaltens zu einem Teil der Nutzer auch demografische Informationen zur Verfügung wie etwa das Alter, das Geschlecht oder eine ungefähre geografische Zuordnung.

Der vollständige Datensatz ist von Yahoos Abteilung zur Personalisierung seines Angebots genutzt worden, um Verhalten zu modellieren, ein System für Vorschläge aufzubauen, bestimmte Onlinealgorithmen zu testen sowie für maschinelles Lernen in einem sehr großen verteilten Netzwerk. Yahoo hofft nun auf ähnliche Anwendungsfelder der Daten im akademischen Kontext.

Bereitgestellt wird der Datensatz über das Angebot Webscope, in dem sich weitere anonymisierte Nutzerdaten finden, die für nichtkommerzielle Zwecke genutzt werden können.


eye home zur Startseite
grünebanane 16. Jan 2016

Richtig, poste mal die Ergebnisse. MfG

Cok3.Zer0 16. Jan 2016

Business Intelligence ist ein großes und wichtiges Feld.

elgooG 15. Jan 2016

"""Der Datensatz""" würde sich auch sonst für viele andere Testzwecke eignen. 13 TB sind...

elgooG 15. Jan 2016

Verzei mir die Frage, aber dir ist tatsächlich noch nie BBCode untergekommen, oder...

sol 15. Jan 2016

Ich habe Yahoo immer nur genutzt um Google zu suchen.



Anzeige

Stellenmarkt
  1. Neoperl GmbH, Müllheim
  2. T-Systems International GmbH, Darmstadt
  3. INCONY AG, Paderborn
  4. über OPTARES GmbH & Co. KG, Großraum München


Anzeige
Top-Angebote
  1. 99,90€ inkl. Versand (Vergleichspreise ab ca. 129€)
  2. 59,99€/69,95€

Folgen Sie uns
       

Anzeige
Whitepaper
  1. Unternehmensweites Dokumenten- und Wissensmanagement


  1. Teilzeitarbeit

    Amazon probiert 30-Stunden-Woche aus

  2. Archos

    Neues Smartphone mit Fingerabdrucksensor für 150 Euro

  3. Sicherheit

    Operas Server wurden angegriffen

  4. Maru

    Quellcode von Desktop-Android als Open Source verfügbar

  5. Linux

    Kernel-Sicherheitsinitiative wächst "langsam aber stetig"

  6. VR-Handschuh

    Dexta Robotics' Exoskelett für Motion Capturing

  7. Dragonfly 44

    Eine Galaxie fast ganz aus dunkler Materie

  8. Gigabit-Breitband

    Google Fiber soll Alphabet zu teuer sein

  9. Google-Steuer

    EU-Kommission plädiert für europäisches Leistungsschutzrecht

  10. Code-Gründer Thomas Bachem

    "Wir wollen weg vom Frontalunterricht"



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Lernroboter-Test: Besser Technik lernen mit drei Freunden
Lernroboter-Test
Besser Technik lernen mit drei Freunden
  1. Kinderroboter Myon Einauge lernt, Einauge hat Körper
  2. Landwirtschaft 4.0 Swagbot hütet das Vieh
  3. Künstliche Muskeln Skelettroboter klappert mit den Zähnen

Mobilfunk: Eine Woche in Deutschland im Funkloch
Mobilfunk
Eine Woche in Deutschland im Funkloch
  1. Netzwerk Mehrere regionale Mobilfunkausfälle bei Vodafone
  2. Hutchison 3 Google-Mobilfunk Project Fi soll zwanzigmal schneller werden
  3. RWTH Ericsson startet 5G-Machbarkeitsnetz in Aachen

No Man's Sky im Test: Interstellare Emotionen durch schwarze Löcher
No Man's Sky im Test
Interstellare Emotionen durch schwarze Löcher
  1. No Man's Sky für PC Läuft nicht, stottert, nervt
  2. No Man's Sky Onlinedienste wegen Überlastung offline
  3. Hello Games No Man's Sky bekommt Raumstationsbau

  1. Re: Ist doch billiger

    Screeny | 20:22

  2. Re: "Darin fanden sie 47 Galaxien, die bisher...

    Ach | 20:22

  3. Re: "Fingerabdruck verlässt das Gerät nicht"

    Sander Cohen | 20:17

  4. Re: Teure Geräte

    Sander Cohen | 20:15

  5. Re: Und der Rest ist Zuckerwatte

    Ach | 20:03


  1. 15:59

  2. 15:18

  3. 13:51

  4. 12:59

  5. 15:33

  6. 15:17

  7. 14:29

  8. 12:57


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel