Abo
  • Services:
Anzeige
Mahout erhielt zahlreiche neue Algorithmen.
Mahout erhielt zahlreiche neue Algorithmen. (Bild: Apache Software Foundation)

Maschinelles Lernen: Apache Mahout erhält neue Algorithmen

Mahout erhielt zahlreiche neue Algorithmen.
Mahout erhielt zahlreiche neue Algorithmen. (Bild: Apache Software Foundation)

Das Apache-Projekt Mahout erhält zahlreiche neue Algorithmen. Über den Fortschritt der skalierbaren Implementierung von maschinenlernenden Algorithmen hat Entwickler Grant Ingersoll berichtet.

Seit Mahout im Mai 2010 ein Top-Level-Projekt bei Apache wurde, hat sich viel getan, wie Grant Ingersoll in einem Blog-Eintrag schreibt. Ingersoll ist Mitbegründer der Firma Lucid Imagination und beteiligt sich an der Entwicklung von Mahout. Der Fokus der Machine Learning Library sind die Themen Collaborative Filtering, Clustering und Classification. Mahout ist unter anderem für den Einsatz bei sozialen Netzwerken gedacht und benötigt auch die Apache Hadoop und Mapreduce.

Anzeige

Zu den neu hinzugekommenen Algorithmen gehören die Hidden Markov Models (HMM), ein stochastisches Modell, dessen Algorithmus in Mahout für die Spracherkennung eingesetzt wird. Für die Klassifizierung von Texten, wie sie etwa bei der gezielten Empfehlungen von Werbung für einzelne Nutzer genutzt wird, kann auf das Stochastic Gradient Descent (SGD) zugegriffen werden.

Der Einsatz von Singulärwertzerlegung soll als Vorstufe zur Klassifizierung beispielsweise eine automatische Funktionsauswahl ermöglichen. Weitere Algorithmen sollen ebenfalls das Dataminig in großen Datenbanken erleichtern und beschleunigen, etwa Dirichlet Clustering bei sich überlagernden und hierarchischen Daten oder Spectral Clustering bei großen und noch unbekannten Datensätzen.

Grants Blogeintrag bietet auch eine Anleitung zur Installation von Mahout in Amazons EC2. Als Datenbasis des Beispiels können Daten aus den E-Mail-Archiven der Apache Software Foundation verwendet werden.

Die nächste Version 0.6 von Mahout ist für Ende 2011 geplant. Bis zur Veröffentlichung der stabilen Version 1.0 soll die Software noch weiter getestet und ihre Leistung optimiert werden. Insbesondere produziert Hadoop auf verteilten Rechnern beim der Verwendung mit Mahout noch zu viele Festplattenzugriffe. Deshalb werden die Entwickler Mahout für den Einsatz im flüchtigen Speicher weiter optimieren. Ferner soll die API noch verbessert und weitere Algorithmen eingesetzt werden. Ein Erscheinungstermin für Mahout 1.0 ist noch nicht festgelegt.


eye home zur Startseite
stefan.vetter... 22. Nov 2011

Empfehlungen zum Umgang mit Mahout aus der Workshops bei der Hadoop World 2011: http...

Chew 15. Nov 2011

Uff. Die Fehler sind also korrigiert, ja? Gut, ich bin sicherlich kein so großer Fachmann...



Anzeige

Stellenmarkt
  1. Nash direct GmbH, Stuttgart oder Ulm
  2. Murrplastik Systemtechnik GmbH, Oppenweiler bei Stuttgart
  3. ID-ware Deutschland GmbH, Rüsselsheim
  4. MAC Mode GmbH & Co. KGaA, Regensburg


Anzeige
Spiele-Angebote
  1. 17,99€
  2. 25,99€
  3. (-44%) 13,99€

Folgen Sie uns
       


  1. HTTPS

    Fritzbox bekommt Let's Encrypt-Support und verrät Hostnamen

  2. Antec P110 Silent

    Gedämmter Midi-Tower hat austauschbare Staubfilter

  3. Pilotprojekt am Südkreuz

    De Maizière plant breiten Einsatz von Gesichtserkennung

  4. Spielebranche

    WW 2 und Battlefront 2 gewinnen im November-Kaufrausch

  5. Bauern

    Deutlich über 80 Prozent wollen FTTH

  6. Linux

    Bolt bringt Thunderbolt-3-Security für Linux

  7. Streit mit Bundesnetzagentur

    Telekom droht mit Ende von kostenlosem Stream On

  8. FTTH

    Bauern am Glasfaserpflug arbeiten mit Netzbetreibern

  9. BGP-Hijacking

    Traffic von Google, Facebook & Co. über Russland umgeleitet

  10. 360-Grad-Kameras im Vergleich

    Alles so schön rund hier



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
E-Ticket Deutschland bei der BVG: Bewegungspunkt am Straßenstrich
E-Ticket Deutschland bei der BVG
Bewegungspunkt am Straßenstrich
  1. Handy-Ticket in Berlin BVG will Check-in/Be-out-System in Bussen testen
  2. VBB Schwarzfahrer trotz Handy-Ticket

LG 32UD99-W im Test: Monitor mit beeindruckendem Bild - trotz unausgereiftem HDR
LG 32UD99-W im Test
Monitor mit beeindruckendem Bild - trotz unausgereiftem HDR
  1. Android-Updates Krack-Patches für Android, aber nicht für Pixel-Telefone
  2. Check Point LGs smarter Staubsauger lässt sich heimlich fernsteuern

Vorratsdatenspeicherung: Die Groko funktioniert schon wieder
Vorratsdatenspeicherung
Die Groko funktioniert schon wieder
  1. Dieselgipfel Regierung fördert Elektrobusse mit 80 Prozent
  2. Gutachten Quote für E-Autos und Stop der Diesel-Subventionen gefordert
  3. Sackgasse EU-Industriekommissarin sieht Diesel am Ende

  1. Re: Öfters mal Skimaske tragen.

    Benutzer0000 | 06:07

  2. Re: Hass und Angst ausnutzen

    Benutzer0000 | 05:59

  3. Das wird noch (sehr) böse enden...

    Benutzer0000 | 05:57

  4. Re: Asien

    Benutzer0000 | 05:52

  5. Re: Ich glaub es hackt ..

    Benutzer0000 | 05:48


  1. 17:47

  2. 17:38

  3. 16:17

  4. 15:50

  5. 15:25

  6. 15:04

  7. 14:22

  8. 13:00


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel