Zum Hauptinhalt Zur Navigation

Cloudera veröffentlicht Hadoop-Distribution

RPM-basierte Distribution mit webbasiertem Konfigurationsassistenten. Die Installation und Konfiguration von Hadoop ist nicht ganz einfach. Um das zu ändern, bietet Cloudera seine Hadoop-Distribution ab sofort frei zum Download an. Das Apache-Projekt dient zur Verarbeitung großer Datenmengen auf verteilten Systemen und ist an Googles Map/Reduce-Engine angelehnt.
/ Jens Ihlenfeld
Kommentare News folgen (öffnet im neuen Fenster)

Hadoop ist ein Java-Framework, das die Funktionen von Googles MapReduce und dem Google File System nachbildet, um große Mengen von Daten zu bearbeiten. Dafür besteht Hadoop aus dem Hadoop Distributed File System und einer Map/Reduce-Engine, die die Daten auf die einzelnen Knoten eines Clusters verteilt und Rechenaufgaben möglichst nah an den jeweiligen Daten abwickelt. So lassen sich sehr große Datenmengen, wie sie beispielsweise bei Internetsuchmaschinen anfallen, auf einem verteilten Cluster auswerten. Eingesetzt wird Hadoop unter anderem von Yahoo.

Cloudera bietet kostenpflichtige Dienstleistungen rund um Hadoop an. Um die Verbreitung von Hadoop zu fördern, bietet das Unternehmen jetzt seine Hadoop-Distribution ab sofort zum freien Download an. Der Einsatz von Hadoop in Unternehmen soll dadurch vereinfacht werden.

Clouderas Hadoop-Distribution nutzt RPM zur Softwareverwaltung und liefert auch kompatible Versionen von Hive(öffnet im neuen Fenster) , ein Data Warehouse auf Basis von Hadoop, sowie Pig(öffnet im neuen Fenster) , eine von Yahoo-Research entwickelte parallele Programmiersprache, mit.

Ein webbasierter Konfigurationsassistent soll beim Finden der optimalen Hadoop-Parameter für den jeweiligen Einsatzzweck helfen.

Über ein öffentliches YUM-Repository stellt Cloudera zudem Pakete mit der aktuellen stabilen Version von Hadoop bereit. Die aktuelle Version der Distribution basiert auf Hadoop 0.18.3, wobei die mitgelieferten Hadoop-Pakete um zusätzlich stabile Funktionen künftiger Hadoop-Ausgaben sowie noch experimentelle Funktionen ergänzt wurde. Die von Cloudera dazu entwickelten Teile stehen alle unter der Apache License 2.0.

Clouderas Hadoop-Distribution steht unter cloudera.com/hadoop(öffnet im neuen Fenster) zum Download bereit.


Relevante Themen