Abo
  • Services:

Maschinelles Lernen: Apache Mahout erhält neue Algorithmen

Das Apache-Projekt Mahout erhält zahlreiche neue Algorithmen. Über den Fortschritt der skalierbaren Implementierung von maschinenlernenden Algorithmen hat Entwickler Grant Ingersoll berichtet.

Artikel veröffentlicht am ,
Mahout erhielt zahlreiche neue Algorithmen.
Mahout erhielt zahlreiche neue Algorithmen. (Bild: Apache Software Foundation)

Seit Mahout im Mai 2010 ein Top-Level-Projekt bei Apache wurde, hat sich viel getan, wie Grant Ingersoll in einem Blog-Eintrag schreibt. Ingersoll ist Mitbegründer der Firma Lucid Imagination und beteiligt sich an der Entwicklung von Mahout. Der Fokus der Machine Learning Library sind die Themen Collaborative Filtering, Clustering und Classification. Mahout ist unter anderem für den Einsatz bei sozialen Netzwerken gedacht und benötigt auch die Apache Hadoop und Mapreduce.

Stellenmarkt
  1. Lidl Dienstleistung GmbH & Co. KG, Neckarsulm
  2. nobilia-Werke J. Stickling GmbH & Co. KG, Verl

Zu den neu hinzugekommenen Algorithmen gehören die Hidden Markov Models (HMM), ein stochastisches Modell, dessen Algorithmus in Mahout für die Spracherkennung eingesetzt wird. Für die Klassifizierung von Texten, wie sie etwa bei der gezielten Empfehlungen von Werbung für einzelne Nutzer genutzt wird, kann auf das Stochastic Gradient Descent (SGD) zugegriffen werden.

Der Einsatz von Singulärwertzerlegung soll als Vorstufe zur Klassifizierung beispielsweise eine automatische Funktionsauswahl ermöglichen. Weitere Algorithmen sollen ebenfalls das Dataminig in großen Datenbanken erleichtern und beschleunigen, etwa Dirichlet Clustering bei sich überlagernden und hierarchischen Daten oder Spectral Clustering bei großen und noch unbekannten Datensätzen.

Grants Blogeintrag bietet auch eine Anleitung zur Installation von Mahout in Amazons EC2. Als Datenbasis des Beispiels können Daten aus den E-Mail-Archiven der Apache Software Foundation verwendet werden.

Die nächste Version 0.6 von Mahout ist für Ende 2011 geplant. Bis zur Veröffentlichung der stabilen Version 1.0 soll die Software noch weiter getestet und ihre Leistung optimiert werden. Insbesondere produziert Hadoop auf verteilten Rechnern beim der Verwendung mit Mahout noch zu viele Festplattenzugriffe. Deshalb werden die Entwickler Mahout für den Einsatz im flüchtigen Speicher weiter optimieren. Ferner soll die API noch verbessert und weitere Algorithmen eingesetzt werden. Ein Erscheinungstermin für Mahout 1.0 ist noch nicht festgelegt.



Anzeige
Blu-ray-Angebote
  1. (2 Monate Sky Ticket für nur 4,99€)
  2. 7,99€ inkl. FSK-18-Versand

stefan.vetter... 22. Nov 2011

Empfehlungen zum Umgang mit Mahout aus der Workshops bei der Hadoop World 2011: http...

Chew 15. Nov 2011

Uff. Die Fehler sind also korrigiert, ja? Gut, ich bin sicherlich kein so großer Fachmann...


Folgen Sie uns
       


Sony E3 2018 Pressekonferenz - Live (techn. Probleme)

Sony hatte während der Übertragung der Pressekonferenz der E3 2018 massive technische Probleme. Abseits davon waren die gezeigten Spiele aber sehr gut. Trotzdem empfehlen wir, den Abschnitt nach The Last of Us bis zu Ghost of Tsushima zu überspringen. (Minute 40-50)

Sony E3 2018 Pressekonferenz - Live (techn. Probleme) Video aufrufen
Youtube Music, Deezer und Amazon Music: Musikstreaming buchen ist auf dem iPhone teurer
Youtube Music, Deezer und Amazon Music
Musikstreaming buchen ist auf dem iPhone teurer

Wer seinen Musikstreamingdienst auf einem iPhone oder iPad bucht, muss oftmals mehr bezahlen als andere Kunden. Der Grund liegt darin, dass Apple - außer bei eigenen Diensten - einen Aufschlag von 30 Prozent behält. Spotify hat Konsequenzen gezogen.
Ein Bericht von Ingo Pakalski

  1. Filme und Serien Nutzung von kostenpflichtigem Streaming steigt stark an
  2. Highend-PC-Streaming Man kann sogar die Grafikkarte deaktivieren
  3. Golem.de-Livestream Halbgott oder Despot?

Battlefield 5 Closed Alpha angespielt: Schneller sterben, länger tot
Battlefield 5 Closed Alpha angespielt
Schneller sterben, länger tot

Das neue Battlefield bekommt ein bisschen was von Fortnite und wird allgemein realistischer und dynamischer. Wir konnten in der Closed Alpha Eindrücke sammeln und erklären die Änderungen.
Von Michael Wieczorek

  1. Battlefield 5 Closed Alpha startet mit neuen Systemanforderungen
  2. Battlefield 5 Schatzkisten und Systemanforderungen
  3. Battlefield 5 Zweiter Weltkrieg mit Sprengkraft

Cruijff Arena: Ed Sheeran singt mit Strom aus Nissan-Leaf-Akkus
Cruijff Arena
Ed Sheeran singt mit Strom aus Nissan-Leaf-Akkus

Die Johann-Cruijff-Arena in Amsterdam ist weltweit das erste Stadion, das seine Energieversorgung mit einem Speichersystem sichert, das aus Akkus von Elektroautos besteht. Der englische Sänger Ed Sheeran hat mit dem darin gespeichertem Solarstrom schon seine Gitarre verstärkt.
Ein Bericht von Dirk Kunde

  1. Energiewende Warum die Bundesregierung ihre Versprechen nicht hält
  2. Max Bögl Wind Das höchste Windrad steht bei Stuttgart

    •  /