Anzeige
Yahoo gibt eigene Daten für die Forschung frei.
Yahoo gibt eigene Daten für die Forschung frei. (Bild: Yahoo)

Machine Learning: Yahoo veröffentlicht 13 TByte Daten an Nutzerverhalten

Yahoo gibt eigene Daten für die Forschung frei.
Yahoo gibt eigene Daten für die Forschung frei. (Bild: Yahoo)

Für Forscher gibt Yahoo einen riesigen Datensatz frei, der den Umgang mit Nachrichten von Nutzern enthält. Gedacht ist dies für maschinelles Lernen und die Erprobung von Vorschlagsystemen.

Der Forschergemeinschaft sei es großes Interesse, neue Algorithmen und Methoden an den Daten von produktiven Anwendungen zu testen, heißt es bei Yahoo. Das Unternehmen stellt deshalb nun mit 13,5 TByte einen vergleichsweise sehr großen Datensatz bereit, mit dem vor allem die Forschung im Bereich des maschinellen Lernens vorangetrieben werden soll.

Anzeige

Die Daten sind zwischen Februar und Mai 2015 gesammelt worden und umfassen Aufzeichnungen des Umgangs von Nutzern mit Nachrichteneinträgen auf verschiedenen Seiten, etwa Yahoo News, Yahoo Sports oder auch Yahoo Finance. Es handele sich dabei um etwa 20 Millionen unterschiedliche Anwender sowie um rund 110 Milliarden selbstständige Ereignisse.

Die Datensätze sind dabei weitgehend anonymisiert, so dass sich keine Rückschlüsse auf konkrete Personen ergeben sollten. Allerdings stehen zu der eigentlichen Aufzeichnung des Verhaltens zu einem Teil der Nutzer auch demografische Informationen zur Verfügung wie etwa das Alter, das Geschlecht oder eine ungefähre geografische Zuordnung.

Der vollständige Datensatz ist von Yahoos Abteilung zur Personalisierung seines Angebots genutzt worden, um Verhalten zu modellieren, ein System für Vorschläge aufzubauen, bestimmte Onlinealgorithmen zu testen sowie für maschinelles Lernen in einem sehr großen verteilten Netzwerk. Yahoo hofft nun auf ähnliche Anwendungsfelder der Daten im akademischen Kontext.

Bereitgestellt wird der Datensatz über das Angebot Webscope, in dem sich weitere anonymisierte Nutzerdaten finden, die für nichtkommerzielle Zwecke genutzt werden können.


eye home zur Startseite
grünebanane 16. Jan 2016

Richtig, poste mal die Ergebnisse. MfG

Cok3.Zer0 16. Jan 2016

Business Intelligence ist ein großes und wichtiges Feld.

elgooG 15. Jan 2016

"""Der Datensatz""" würde sich auch sonst für viele andere Testzwecke eignen. 13 TB sind...

elgooG 15. Jan 2016

Verzei mir die Frage, aber dir ist tatsächlich noch nie BBCode untergekommen, oder...

sol 15. Jan 2016

Ich habe Yahoo immer nur genutzt um Google zu suchen.

Kommentieren



Anzeige

  1. IT-Projektmanager (m/w)
    AFI - P.M. Belz Agentur für Informatik GmbH, Köln
  2. IT-Mitarbeiter / innen fachlich-technische Dienstleistungen
    Landeshauptstadt München, München
  3. Business Analyst (m/w) Data Integration
    Walter de Gruyter GmbH, Berlin
  4. Managementberater (m/w) im Bereich Business Intelligence - Senior Professional
    Horváth & Partners Management Consultants, Berlin, Düsseldorf, Frankfurt, Hamburg, München oder Stuttgart

Detailsuche



Anzeige
Blu-ray-Angebote
  1. NUR BIS SONNTAG: 3 Blu-rays für 20 EUR
    (u. a. Spaceballs, Anastasia, Bullitt, Over the top, Space Jam)
  2. VORBESTELLBAR: Batman v Superman: Dawn of Justice Ultimate Collector's Edition (inkl. 3D-Steelbook & Batman Figur) (exklusiv bei Amazon
    139,99€
  3. NUR BIS SONNTAG: 3 Blu-rays für 18 EUR
    (u. a. Rache für Jesse James, Runaway, The Wanderers)

Weitere Angebote


Folgen Sie uns
       


  1. Ultra Compact Network

    Nokia baut LTE-Station als Rucksacklösung

  2. Juniper EX2300-C-12T/P

    Kompakt, lüfterlos und mit 124 Watt Powerbudget

  3. Vorratsdatenspeicherung

    Alarm im VDS-Tresor

  4. Be Quiet Silent Loop

    Sei leise, Wasserkühlung!

  5. Kryptowährung

    Australische Behörden versteigern beschlagnahmte Bitcoins

  6. ZUK Z2

    Android-Smartphone mit Snapdragon 820 für 245 Euro

  7. Zenbook 3 im Hands on

    Kleiner, leichter und schneller als das Macbook

  8. Autokauf

    Landgericht Köln entdeckt, dass SMS sich löschen lassen

  9. Toughpad FZ-B2 Mk 2

    Panasonic zeigt neues Full-Ruggedized-Tablet mit Android

  10. Charm

    Samsungs Fitness-Tracker mit langer Laufzeit kostet 30 Euro



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Doom im Test: Die beste blöde Ballerorgie
Doom im Test
Die beste blöde Ballerorgie
  1. Doom im Technik-Test Im Nightmare-Mode erzittert die Grafikkarte
  2. id Software Doom wird Vulkan unterstützen
  3. Id Software PC-Spieler müssen 45 GByte von Steam laden

Darknet: Die gefährlichen Anonymitätstipps der Drogenhändler
Darknet
Die gefährlichen Anonymitätstipps der Drogenhändler
  1. Privatsphäre 1 Million Menschen nutzen Facebook über Tor
  2. Security Tor-Nutzer über Mausrad identifizieren

Privacy-Boxen im Test: Trügerische Privatheit
Privacy-Boxen im Test
Trügerische Privatheit
  1. Fehler in Blogsystem 200.000 Zugangsdaten von SZ-Magazin kopiert
  2. Überwachung Aufregung um Intermediate-Zertifikat für Bluecoat
  3. IT-Sicherheit SWIFT-Hack vermutlich größer als bislang angenommen

  1. Re: was nützs, wenn darauf windows läuft?

    derdiedas | 19:45

  2. Re: 280er mit 120er Lüftern?

    most | 19:36

  3. Re: Dynamo?

    schachbrett | 19:33

  4. Re: Definiere "Aufstieg"

    Spiritogre | 19:32

  5. welche innovation?

    miauwww | 19:31


  1. 19:26

  2. 18:41

  3. 18:36

  4. 18:16

  5. 18:11

  6. 17:31

  7. 17:26

  8. 16:48


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel