Impala: Echtzeitabfragen mit Hadoop

Der Hadoop-Spezialist Cloudera hat mit Impala eine Lösung für Echtzeitabfragen auf Hadoop und HBase vorgestellt. Die Abfragen werden in SQL formuliert und sollen zehnmal schneller sein als mit Hive/Mapreduce.

Artikel veröffentlicht am ,
Echtzeitlösung auf Basis von Hadoop
Echtzeitlösung auf Basis von Hadoop (Bild: Cloudera)

Schnelle Ergebnisse auf Abfragen in SQL verspricht Cloudera mit Cloudera Enterprise RTQ. Die Software basiert auf Clouderas Open-Source-Projekt Impala, mit dem sich Daten in Echtzeit aus HDFS (Hadoop Distributed File System) und HBase auswerten lassen.

Stellenmarkt
  1. Senior Architekt ServiceNow (m/w/d)
    operational services GmbH & Co. KG, Frankfurt am Main
  2. Anwendungsbetreuer (m/w/d) Logistiksysteme (Mobisys, Kardex, LVS)
    Woodward L'Orange GmbH, Glatten
Detailsuche

Cloudera will mit der neuen Lösung neue Einsatzgebiete für Hadoop erschließen, das ursprünglich als Offlinesystem für Batch-Verarbeitung ausgelegt war. Dabei soll Impala eine skalierbare, verteilte Query-Engine für Hadoop bereitstellen.

Entwickelt wurde Impala maßgeblich von Marcel Kornacker, der zuvor bereits einer der Architekten von Googles neuer Datenbank F1 war. Letztendlich erzeugt Impala ein flexibles Datenmodell, um effizienter als klassische Data-Warehouses mit komplexeren Daten umgehen zu können. Die Abfragen werden dabei mit SQL gestellt, die Daten liegen entweder in HDFS oder HBase vor. Abfragen mit Impala sollen durchschnittlich zehnmal schneller sein als mit Hive/Mapreduce.

Cloudera stellt Impala unter der Apache-Lizenz als Open Source zur Verfügung. Zudem hat Cloudera drei der Hauptentwickler von Apache HBase eingestellt, damit diese Clouderas Entwicklungen im Bereich Impala und HBase der Community zugänglich machen. Cloudera-Gründer Jeff Hammerbacher erklärte Impala zum aufregendsten Open-Source-Projekt seit Hadoop.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Sparmaßnahmen
"Komplettes Chaos" nach Entlassungen bei Oracle

Auch Oracle hat einen massiven Stellenabbau begonnen. Das Unternehmen will eine Milliarde US-Dollar an Kosten einsparen.

Sparmaßnahmen: Komplettes Chaos nach Entlassungen bei Oracle
Artikel
  1. Klimawandel: SSDs sind klimaschädlicher als mechanische Festplatten
    Klimawandel
    SSDs sind klimaschädlicher als mechanische Festplatten

    Während ihrer Lebensdauer verursacht eine SSD fast doppelt so hohe CO2-Emissionen wie eine mechanische HDD.

  2. Momentum 4 Wireless: Sennheisers neuer ANC-Kopfhörer hält lange durch
    Momentum 4 Wireless
    Sennheisers neuer ANC-Kopfhörer hält lange durch

    Guter Klang, hohe ANC-Leistung und eine Akkulaufzeit von 60 Stunden verspricht Sennheiser für den neuen ANC-Kopfhörer Momentum 4 Wireless.

  3. Microsoft Loop: Riesenkonzept mit Riesenchance auf Riesenchaos
    Microsoft Loop
    Riesenkonzept mit Riesenchance auf Riesenchaos

    Sehr unauffällig rollt Microsoft seine neue Technik Loop für die Onlinezusammenarbeit aus. Admins sollten sie jetzt schon auf dem Schirm haben, denn sie ist vielversprechend, erfordert aber viel Eindenken. Wir erklären sie im Detail.
    Von Mathias Küfner

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • MindStar (Gainward RTX 3070 559€, ASRock RX 6800 639€) • WD Black 2TB m. Kühlkörper (PS5) 219,90€ • Gigabyte Deals • Alternate (DeepCool Wakü 114,90€) • Apple Week bei Media Markt • be quiet! Deals • SSV bei Saturn (u. a. WD_BLACK SN850 1TB 119€) • Gamesplant Summer Sale [Werbung]
    •  /