Original-URL des Artikels: https://www.golem.de/news/hadoop-von-intel-1-tbyte-daten-in-7-minuten-statt-4-stunden-analysieren-1302-97858.html    Veröffentlicht: 27.02.2013 09:11    Kurz-URL: https://glm.io/97858

Hadoop von Intel

1 TByte Daten in 7 Minuten statt 4 Stunden analysieren

Der Chiphersteller Intel hat eine eigene Hadoop-Distribution veröffentlicht, die speziell für die eigenen Prozessoren angepasst ist. Sie soll Daten deutlich schneller analysieren, vor allem, wenn sie aus Gründen der Datensicherheit verschlüsselt gespeichert werden.

Intel bietet ab sofort eine eigene Distribution auf Basis von Apache Hadoop an. Sie ist speziell für neue Funktionen in Intels Prozessoren zugeschnitten, was die Analyse großer Datenmengen deutlich beschleunigen soll. Die von Intel dazu entwickelten Hadoop-Anpassungen will das Unternehmen dem Projekt als Open Source zur Verfügung stellen, so dass sie sich wohl bald auch in anderen Hadoop-Distributionen finden werden.

Konkret unterstützt Intels Hadoop-Distribution die Kryptographie-Funktionen in Intels aktuellen Xeon-Prozessoren - AES New Instructions, kurz AES-NI genannt. So können im Hadoop Distributed File System verschlüsselt gespeicherte Daten deutlich schneller analysiert werden.

Zudem hat Intel Anpassungen am Netzwerk- und IO-Code vorgenommen, um die Möglichkeiten der aktuellen Xeon-Chips auszunutzen. Auch das soll den Datendurchsatz erhöhen. Benötigte die Analyse von 1 TByte Daten bislang 4 Stunden, soll sie nun in 7 Minuten möglich sein, so Intel.

Der Intel Manager for Apache Hadoop soll zudem die Verwaltung eines Hadoop-Clusters vereinfachen und der Intel Active Tuner for Apache Hadoop soll die Systeme zudem automatisch auf maximale Leistung konfigurieren.

An weiteren Hadoop-Werkzeugen wird in den Intel Labs derzeit gearbeitet, darunter der Intel Graph Builder for Apache Hadoop. Die Software soll große Datenmengen in Graphen umwandeln, um so Beziehungen zwischen Daten zu visualisieren.

Details zur Intel Distribution for Apache Hadoop stehen unter hadoop.intel.com zur Verfügung.  (ji)


Verwandte Artikel:
Mapreduce: Apache Hadoop 1.0 veröffentlicht   
(30.12.2011, https://glm.io/88715 )
Testzentren für Cloud-Computing   
(30.07.2008, https://glm.io/61396 )
Big Data: SAP setzt auf Hadoop   
(25.10.2012, https://glm.io/95308 )
Ubisoft: Big-Data-KI entdeckt Bugs beim Programmieren   
(06.03.2018, https://glm.io/133162 )
IBM: Watson wird in CIMON ins All geschossen   
(26.02.2018, https://glm.io/133005 )

© 1997–2019 Golem.de, https://www.golem.de/