Abo
  • Services:

Maschinelles Lernen: Apache Mahout erhält neue Algorithmen

Das Apache-Projekt Mahout erhält zahlreiche neue Algorithmen. Über den Fortschritt der skalierbaren Implementierung von maschinenlernenden Algorithmen hat Entwickler Grant Ingersoll berichtet.

Artikel veröffentlicht am ,
Mahout erhielt zahlreiche neue Algorithmen.
Mahout erhielt zahlreiche neue Algorithmen. (Bild: Apache Software Foundation)

Seit Mahout im Mai 2010 ein Top-Level-Projekt bei Apache wurde, hat sich viel getan, wie Grant Ingersoll in einem Blog-Eintrag schreibt. Ingersoll ist Mitbegründer der Firma Lucid Imagination und beteiligt sich an der Entwicklung von Mahout. Der Fokus der Machine Learning Library sind die Themen Collaborative Filtering, Clustering und Classification. Mahout ist unter anderem für den Einsatz bei sozialen Netzwerken gedacht und benötigt auch die Apache Hadoop und Mapreduce.

Stellenmarkt
  1. MOBIL ELEKTRONIK GMBH, Langenbrettach
  2. KfW Bankengruppe, Frankfurt am Main

Zu den neu hinzugekommenen Algorithmen gehören die Hidden Markov Models (HMM), ein stochastisches Modell, dessen Algorithmus in Mahout für die Spracherkennung eingesetzt wird. Für die Klassifizierung von Texten, wie sie etwa bei der gezielten Empfehlungen von Werbung für einzelne Nutzer genutzt wird, kann auf das Stochastic Gradient Descent (SGD) zugegriffen werden.

Der Einsatz von Singulärwertzerlegung soll als Vorstufe zur Klassifizierung beispielsweise eine automatische Funktionsauswahl ermöglichen. Weitere Algorithmen sollen ebenfalls das Dataminig in großen Datenbanken erleichtern und beschleunigen, etwa Dirichlet Clustering bei sich überlagernden und hierarchischen Daten oder Spectral Clustering bei großen und noch unbekannten Datensätzen.

Grants Blogeintrag bietet auch eine Anleitung zur Installation von Mahout in Amazons EC2. Als Datenbasis des Beispiels können Daten aus den E-Mail-Archiven der Apache Software Foundation verwendet werden.

Die nächste Version 0.6 von Mahout ist für Ende 2011 geplant. Bis zur Veröffentlichung der stabilen Version 1.0 soll die Software noch weiter getestet und ihre Leistung optimiert werden. Insbesondere produziert Hadoop auf verteilten Rechnern beim der Verwendung mit Mahout noch zu viele Festplattenzugriffe. Deshalb werden die Entwickler Mahout für den Einsatz im flüchtigen Speicher weiter optimieren. Ferner soll die API noch verbessert und weitere Algorithmen eingesetzt werden. Ein Erscheinungstermin für Mahout 1.0 ist noch nicht festgelegt.



Anzeige
Hardware-Angebote
  1. bei Alternate bestellen

stefan.vetter... 22. Nov 2011

Empfehlungen zum Umgang mit Mahout aus der Workshops bei der Hadoop World 2011: http...

Chew 15. Nov 2011

Uff. Die Fehler sind also korrigiert, ja? Gut, ich bin sicherlich kein so großer Fachmann...


Folgen Sie uns
       


Pathfinder Kingmaker - Golem.de live (Teil 1)

Im ersten Teil unseres Livestreams zu Pathfinder Kingmaker ergründen wir das Regelsystem, erschaffen Goleria Golerta und verteidigen unsere Burg.

Pathfinder Kingmaker - Golem.de live (Teil 1) Video aufrufen
Pixel 3 XL im Test: Algorithmen können nicht alles
Pixel 3 XL im Test
Algorithmen können nicht alles

Google setzt beim Pixel 3 XL alles auf die Kamera, die dank neuer Algorithmen nicht nur automatisch blinzlerfreie Bilder ermitteln, sondern auch einen besonders scharfen Digitalzoom haben soll. Im Test haben wir allerdings festgestellt, dass auch die beste Software keine Dual- oder Dreifachkamera ersetzen kann.
Ein Test von Tobias Költzsch

  1. Android Google-Apps könnten Hersteller bis zu 40 US-Dollar kosten
  2. Google Pixel-Besitzer beklagen nicht abgespeicherte Fotos
  3. Dragonfly Google schweigt zu China-Plänen

Mate 20 Pro im Hands on: Huawei bringt drei Brennweiten und mehr für 1.000 Euro
Mate 20 Pro im Hands on
Huawei bringt drei Brennweiten und mehr für 1.000 Euro

Huawei hat mit dem Mate 20 Pro seine Dreifachkamera überarbeitet: Der monochrome Sensor ist einer Ultraweitwinkelkamera gewichen. Gleichzeitig bietet das Smartphone zahlreiche technische Extras wie einen Fingerabdrucksensor unter dem Display und einen sehr leistungsfähigen Schnelllader.
Ein Hands on von Tobias Költzsch

  1. Keine Spionagepanik Regierung wird chinesische 5G-Ausrüster nicht ausschließen
  2. Watch GT Huawei bringt Smartwatch ohne Wear OS auf den Markt
  3. Ascend 910/310 Huaweis AI-Chips sollen Google und Nvidia schlagen

Life is Strange 2 im Test: Interaktiver Road-Movie-Mystery-Thriller
Life is Strange 2 im Test
Interaktiver Road-Movie-Mystery-Thriller

Keine heile Teenagerwelt mit Partys und Liebeskummer: Allein in den USA der Trump-Ära müssen zwei Brüder mit mexikanischen Wurzeln in Life is Strange 2 nach einem mysteriösen Unfall überleben. Das Adventure ist bewegend und spannend - trotz eines grundsätzlichen Problems.
Von Peter Steinlechner

  1. Adventure Leisure Suit Larry landet im 21. Jahrhundert

    •  /