Abo
  • Services:
Anzeige
Hortonworks Data Platform 2.1 ist als Preview verfügbar.
Hortonworks Data Platform 2.1 ist als Preview verfügbar. (Bild: Hortonworks/Screenshot: Golem.de)

HDP 2.1: Hortonworks erweitert Hadoop

Schnellere SQL-Abfragen mit Apache Hive, eine verbesserte Mapreduce-Abfrage mit Tez und eine lange geforderte Suche sind die Komponenten, mit denen Hortonworks Hadoop weiterhin als Vorreiter im Bereich Big Data behaupten will. Die Investition Intels in Cloudera schürt die Angst vor einer Fragmentierung.

Anzeige

Hortonworks hat seine Plattform (HDP) in Version 2.1 vorgestellt. Damit wurden integrale Bestandteile verbessert, etwa Apache Hive, die Schnittstelle zu SQL sowie Apache Tez, ein Framework für Datenverarbeitung mit Mapreduce. Auf mehrfachen Kundenwunsch wurde die Suche Solr in HDP integriert. Hortonworks hat außerdem in seinem auch Enterprise Hadoop genannten HDP das System zur Verarbeitung von Datenströmen namens Storm integriert. Die Konkurrenz der Hadoop-Anbieter wird derweil größer und es gibt Befürchtungen, die Entwicklung Hadoops und seiner Komponenten könnte fragmentieren.

Neben SAP, Facebook, Twitter oder eben Yahoo, dessen Hadoop-Entwickler das Unternehmen Hortonworks gründeten, ist auch Microsoft intensiv mit der Entwicklung von HDP 2.1 und vor allem an Hive in Version 0.13 involviert. Von dem Windows-Hersteller stammen nicht nur Anpassungen, damit Hadoop auch in Windows-Umgebungen läuft, sondern auch Hive-Codeteile, die etwa SQL-Abfragen effizienter durchführen können (Vectorized Query Execution).

Mehr SQL in HiveQL

Hives Abfragesprache HiveQL orientiert sich immer mehr an dem SQL-92-Standard. In der aktuellen Version 0.13 wurde beispielsweise die OVER-Klausel integriert. Ferner erlaubt WHERE jetzt Unterklauseln. Mit Tez enthält HDP auch eine weitere Schnittstelle für Mapreduce-Abfragen in den unter Hadoop gesammelten Rohdaten. Die aktuelle Version verringert Latenzzeiten, indem lediglich ein einziger Job pro Abfrage gestartet werden muss. Dennoch soll sich Tez auch für große Abfragen mit hohem Datendurchsatz eignen.

Um die umfangreichen Datenbestände zu verwalten, wurde das Apache-Projekt Falcon integriert. Damit lässt sich beispielsweise über dessen grafische Oberfläche bestimmen, wie lange Datenbestände vorgehalten werden oder die Replikation verwalten. Das Hadoop-Verwaltungswerkzeug Ambari wurde ebenfalls aktualisiert. Die Module Tez und Flacon lassen sich dort künftig ebenso installieren und konfigurieren wie Apache Strom. Über Ambari lassen sich beispielsweise Storm-Cluster verwalten und entsprechende Dienste starten oder stoppen.

Sicherheit erhöht

Für mehr Sicherheit soll Apache Knox sorgen, das jetzt in HDP 2.1 integriert wurde. Mit Knox sollen sich Authentifizierungen in Hadoop und sämtliche Komponenten vornehmen lassen. Dazu bringt Knox ein entsprechendes API mit. Große Teile des Codes stammen von Microsoft. Darüber hinaus erhält das Hadoop Distributed File System (HDFS) die Unterstützung für Zugriffssteuerungslisten (Access Control Lists) sowie Grant/Revoke-Funktionen für Hive. Hive erhält außerdem Unterstützung für PAM (Pluggable Authentication Modules).

Die Suchmaschine Apache Solr wurde ebenfalls in HDP integriert, samt einer Benutzeroberfläche. Außerdem will Hortonworks künftig mit Lucidworks kooperieren. Das Unternehmen bietet Support und Training für den Einsatz von Solr und Apache Lucene, das den Kern von Solr bildet.

Angst vor Fragmentierung

Die massive Investition von 900 Millionen US-Dollar Intels in Cloudera traf Hortonworks offenbar unvorbereitet. Dafür hat Intel die Eigenentwicklung an Hadoop und seinen Komponenten aufgegeben. Mehrfach war auf dem diesjährigen Hadoop Summit davon die Rede, dass sich die Entwicklung der unter der Schirmherrschaft von Apache stehenden Teile des Hadoop-Projekts oder sogar Hadoop selbst fragmentiert. Cloudera steuert einen großen Teil des Codes für Hadoop bei, bietet aber zahlreiche proprietäre Erweiterungen für das Framework an.

HDP 2.1 steht als Preview-Version zum Download bereit. Auch eine eigenständige virtuelle Maschine mit einem vorkonfigurierten HDP 2.1 samt Anleitungen gibt es. Die finale Version soll am 22. April 2014 veröffentlicht werden. HDP 2.1 bleibt weiterhin kostenlos. Hortonworks finanziert sich mit kostenpflichtigem Support und Training.


eye home zur Startseite
cafun4o 08. Mai 2014

Cloudera Manager is das einigste von Cloudera was nicht open source ist. Die andere tools...



Anzeige

Stellenmarkt
  1. MBtech Group GmbH & Co. KGaA, Sindelfingen
  2. Sparda-Datenverarbeitung eG, Nürnberg
  3. NRW.BANK, Düsseldorf
  4. Schwarz IT Infrastructure & Operations Services GmbH & Co. KG, Neckarsulm


Anzeige
Blu-ray-Angebote
  1. (u. a. Apollo 13, Insidious, Horns, King Kong, E.T. The Untouchables, Der Sternwanderer)
  2. 12,99€
  3. 125,00€

Folgen Sie uns
       

Anzeige
Whitepaper
  1. Mehr dazu im aktuellen Whitepaper von SAS
  2. Praxiseinsatz, Nutzen und Grenzen von Hadoop und Data Lakes
  3. Unternehmensweites Dokumenten- und Wissensmanagement


  1. Apple

    Aktivierungssperre des iPads lässt sich umgehen

  2. Amazon

    Downloader-App aus dem Fire-TV-Store entfernt

  3. Autonomes Fahren

    Apple zeigt Interesse an selbstfahrenden Autos

  4. Sicherheit

    Geheimdienst warnt vor Cyberattacke auf russische Banken

  5. Super Mario Bros. (1985)

    Fahrt ab auf den Bruder!

  6. Canon EOS 5D Mark IV im Test

    Grundsolides Arbeitstier mit einer Portion Extravaganz

  7. PSX 2016

    Sony hat The Last of Us 2 angekündigt

  8. Raspberry Pi

    Schutz gegen Übernahme durch Hacker und Botnetze verbessert

  9. UHD-Blu-ray

    PowerDVD spielt 4K-Discs

  10. Raumfahrt

    Europa bleibt im All



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Udacity: Selbstfahrendes Auto selbst programmieren
Udacity
Selbstfahrendes Auto selbst programmieren
  1. Strategiepapier EU fordert europaweite Standards für vernetzte Autos
  2. Autonomes Fahren Comma One veröffentlicht Baupläne für Geohot-Nachrüstsatz
  3. Autonomes Fahren Intel baut Prozessoren für Delphi und Mobileye

Oneplus 3T im Test: Schneller, ausdauernder und immer noch günstig
Oneplus 3T im Test
Schneller, ausdauernder und immer noch günstig
  1. Smartphone Oneplus 3T mit 128 GByte wird nicht zu Weihnachten geliefert
  2. Android-Smartphone Oneplus Three wird nach fünf Monaten eingestellt
  3. Oneplus 3T Oneplus bringt Three mit besserem Akku und SoC

Seoul-Incheon Ecobee ausprobiert: Eine sanfte Magnetbahnfahrt im Nirgendwo
Seoul-Incheon Ecobee ausprobiert
Eine sanfte Magnetbahnfahrt im Nirgendwo
  1. Transport Hyperloop One plant Trasse in Dubai

  1. hab mal nachgerechnet...

    cherubium | 23:23

  2. Re: Tovarishch, der Bär hat meine Hausaufgaben...

    Moe479 | 23:22

  3. vr

    userlast | 23:10

  4. Re: Lies ein Lexikon

    Moe479 | 23:09

  5. Re: hmm bullig sieht die jetzt nicht aus

    Thunderbird1400 | 23:08


  1. 12:54

  2. 11:56

  3. 10:54

  4. 10:07

  5. 08:59

  6. 08:00

  7. 00:03

  8. 15:33


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel