Original-URL des Artikels: https://www.golem.de/news/impala-echtzeitabfragen-mit-hadoop-1210-95289.html    Veröffentlicht: 24.10.2012 16:56    Kurz-URL: https://glm.io/95289

Impala

Echtzeitabfragen mit Hadoop

Der Hadoop-Spezialist Cloudera hat mit Impala eine Lösung für Echtzeitabfragen auf Hadoop und HBase vorgestellt. Die Abfragen werden in SQL formuliert und sollen zehnmal schneller sein als mit Hive/Mapreduce.

Schnelle Ergebnisse auf Abfragen in SQL verspricht Cloudera mit Cloudera Enterprise RTQ. Die Software basiert auf Clouderas Open-Source-Projekt Impala, mit dem sich Daten in Echtzeit aus HDFS (Hadoop Distributed File System) und HBase auswerten lassen.

Cloudera will mit der neuen Lösung neue Einsatzgebiete für Hadoop erschließen, das ursprünglich als Offlinesystem für Batch-Verarbeitung ausgelegt war. Dabei soll Impala eine skalierbare, verteilte Query-Engine für Hadoop bereitstellen.

Entwickelt wurde Impala maßgeblich von Marcel Kornacker, der zuvor bereits einer der Architekten von Googles neuer Datenbank F1 war. Letztendlich erzeugt Impala ein flexibles Datenmodell, um effizienter als klassische Data-Warehouses mit komplexeren Daten umgehen zu können. Die Abfragen werden dabei mit SQL gestellt, die Daten liegen entweder in HDFS oder HBase vor. Abfragen mit Impala sollen durchschnittlich zehnmal schneller sein als mit Hive/Mapreduce.

Cloudera stellt Impala unter der Apache-Lizenz als Open Source zur Verfügung. Zudem hat Cloudera drei der Hauptentwickler von Apache HBase eingestellt, damit diese Clouderas Entwicklungen im Bereich Impala und HBase der Community zugänglich machen. Cloudera-Gründer Jeff Hammerbacher erklärte Impala zum aufregendsten Open-Source-Projekt seit Hadoop.  (ji)


Verwandte Artikel:
Unabhängige Labels gegen EU-Genehmigung für Sony-BMG-Fusion   
(04.10.2007, https://glm.io/55165 )
Cloudera Desktop: Webbasierte Verwaltung von Hadoop-Clustern   
(02.10.2009, https://glm.io/70221 )
Apache Drill: Riesige Datenmengen werden schneller verarbeitet   
(22.08.2012, https://glm.io/94003 )
NoSQL: Hypertable schlägt HBase   
(08.02.2012, https://glm.io/89634 )
Social Media: So viel Open-Source-Software setzt Twitter ein   
(14.08.2012, https://glm.io/93834 )

© 1997–2020 Golem.de, https://www.golem.de/