Abo
  • Services:
Anzeige
Yahoo gibt eigene Daten für die Forschung frei.
Yahoo gibt eigene Daten für die Forschung frei. (Bild: Yahoo)

Machine Learning: Yahoo veröffentlicht 13 TByte Daten an Nutzerverhalten

Yahoo gibt eigene Daten für die Forschung frei.
Yahoo gibt eigene Daten für die Forschung frei. (Bild: Yahoo)

Für Forscher gibt Yahoo einen riesigen Datensatz frei, der den Umgang mit Nachrichten von Nutzern enthält. Gedacht ist dies für maschinelles Lernen und die Erprobung von Vorschlagsystemen.

Der Forschergemeinschaft sei es großes Interesse, neue Algorithmen und Methoden an den Daten von produktiven Anwendungen zu testen, heißt es bei Yahoo. Das Unternehmen stellt deshalb nun mit 13,5 TByte einen vergleichsweise sehr großen Datensatz bereit, mit dem vor allem die Forschung im Bereich des maschinellen Lernens vorangetrieben werden soll.

Anzeige

Die Daten sind zwischen Februar und Mai 2015 gesammelt worden und umfassen Aufzeichnungen des Umgangs von Nutzern mit Nachrichteneinträgen auf verschiedenen Seiten, etwa Yahoo News, Yahoo Sports oder auch Yahoo Finance. Es handele sich dabei um etwa 20 Millionen unterschiedliche Anwender sowie um rund 110 Milliarden selbstständige Ereignisse.

Die Datensätze sind dabei weitgehend anonymisiert, so dass sich keine Rückschlüsse auf konkrete Personen ergeben sollten. Allerdings stehen zu der eigentlichen Aufzeichnung des Verhaltens zu einem Teil der Nutzer auch demografische Informationen zur Verfügung wie etwa das Alter, das Geschlecht oder eine ungefähre geografische Zuordnung.

Der vollständige Datensatz ist von Yahoos Abteilung zur Personalisierung seines Angebots genutzt worden, um Verhalten zu modellieren, ein System für Vorschläge aufzubauen, bestimmte Onlinealgorithmen zu testen sowie für maschinelles Lernen in einem sehr großen verteilten Netzwerk. Yahoo hofft nun auf ähnliche Anwendungsfelder der Daten im akademischen Kontext.

Bereitgestellt wird der Datensatz über das Angebot Webscope, in dem sich weitere anonymisierte Nutzerdaten finden, die für nichtkommerzielle Zwecke genutzt werden können.


eye home zur Startseite
grünebanane 16. Jan 2016

Richtig, poste mal die Ergebnisse. MfG

Cok3.Zer0 16. Jan 2016

Business Intelligence ist ein großes und wichtiges Feld.

elgooG 15. Jan 2016

"""Der Datensatz""" würde sich auch sonst für viele andere Testzwecke eignen. 13 TB sind...

elgooG 15. Jan 2016

Verzei mir die Frage, aber dir ist tatsächlich noch nie BBCode untergekommen, oder...

sol 15. Jan 2016

Ich habe Yahoo immer nur genutzt um Google zu suchen.



Anzeige

Stellenmarkt
  1. GERMANIA Fluggesellschaft mbH, Berlin-Tegel
  2. Signavio GmbH, Berlin
  3. Hermes Germany GmbH, Hamburg
  4. Deichmann SE, Essen


Anzeige
Hardware-Angebote
  1. und 15€ Cashback erhalten
  2. beim Kauf einer GeForce GTX 1070 und GTX 108
  3. (täglich neue Deals)

Folgen Sie uns
       

Anzeige
Whitepaper
  1. Praxiseinsatz, Nutzen und Grenzen von Hadoop und Data Lakes
  2. Unternehmensweites Dokumenten- und Wissensmanagement
  3. Mehr dazu im aktuellen Whitepaper von SAS


  1. UHD-Blu-ray

    PowerDVD spielt 4K-Discs

  2. Raumfahrt

    Europa bleibt im All

  3. Nationale Sicherheit

    Obama verhindert Aixtron-Verkauf nach China

  4. Die Woche im Video

    Telekom fällt aus und HPE erfindet den Computer neu - fast

  5. Hololens

    Microsoft holoportiert Leute aus dem Auto ins Büro

  6. Star Wars

    Todesstern kostet 6,25 Quadrilliarden britische Pfund am Tag

  7. NSA-Ausschuss

    Wikileaks könnte Bundestagsquelle enttarnt haben

  8. Transparenzverordnung

    Angaben-Wirrwarr statt einer ehrlichen Datenratenangabe

  9. Urteil zu Sofortüberweisung

    OLG empfiehlt Verbrauchern Einkauf im Ladengeschäft

  10. Hearthstone

    Blizzard schickt Spieler in die Straßen von Gadgetzan



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Final Fantasy 15 im Test: Weltenrettung mit der Boyband des Wahnsinns
Final Fantasy 15 im Test
Weltenrettung mit der Boyband des Wahnsinns
  1. Square Enix Koop-Modus von Final Fantasy 15 folgt kostenpflichtig

Udacity: Selbstfahrendes Auto selbst programmieren
Udacity
Selbstfahrendes Auto selbst programmieren
  1. Strategiepapier EU fordert europaweite Standards für vernetzte Autos
  2. Autonomes Fahren Comma One veröffentlicht Baupläne für Geohot-Nachrüstsatz
  3. Autonomes Fahren Intel baut Prozessoren für Delphi und Mobileye

Quake (1996): Urknall für Mouselook, Mods und moderne 3D-Grafik
Quake (1996)
Urknall für Mouselook, Mods und moderne 3D-Grafik
  1. Künstliche Intelligenz Doom geht in Deckung

  1. Re: Tengelmann-Strategie

    Seraphim0815 | 14:52

  2. Re: Wegen Galiumnitrid? Sonst nichts?

    Eheran | 14:50

  3. Äußerst fragewürdiger Einfluss

    Seraphim0815 | 14:49

  4. Re: Verstehe ich das Richtig?

    Faksimile | 14:43

  5. Re: Ein Sprung in den Hyperspace macht knapp 90...

    Bouncy | 14:42


  1. 14:43

  2. 13:37

  3. 11:12

  4. 09:02

  5. 18:27

  6. 18:01

  7. 17:46

  8. 17:19


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel