Hadoop

Big Data: SAP setzt auf Hadoop

SAP will künftig mit Hadoop-Anbietern zusammenarbeiten, um die Integration von Big-Data-Lösungen auf Basis von Hadoop in SAP-Umgebungen zu ermöglichen. Dazu bietet SAP ein neues Big-Data-Bundle an.

2 Kommentare

Echtzeitlösung auf Basis von Hadoop (Bild: Cloudera) (Cloudera)

Impala: Echtzeitabfragen mit Hadoop

Der Hadoop-Spezialist Cloudera hat mit Impala eine Lösung für Echtzeitabfragen auf Hadoop und HBase vorgestellt. Die Abfragen werden in SQL formuliert und sollen zehnmal schneller sein als mit Hive/Mapreduce.

1 Kommentare

Neues aus der Golem Karrierewelt(öffnet im neuen Fenster)

Workshops und Weiterbildungen: Microsoft 365 Copilot sicher administrieren und integrieren

zum Artikel

Karriere Ratgeber: Der Job-Scam-Tsunami: So fluten Betrüger 2025 den Arbeitsmarkt

zum Ratgeber

Seminar: IT-Sicherheit für Webentwickler: virtueller Zwei-Tage-Workshop

zum Kurs

E-Learning: Exclusive: Microsoft 365 Security: Information Protection and Compliance (E-Learning in English)

zum Kurs

Neue Angebote bei Golem Jobs(öffnet im neuen Fenster)

Softwareentwickler*in im Projekt „Aufbau eines Netzwerkes und Services zu Forschungsinformationen (FIS)“ Leuphana Universität Lüneburg, Lüneburg (öffnet im neuen Fenster)

Sachbereichsleitung (w/m/d) für den Sachbereich IT-Service, Infrastruktur und Applikationsbetrieb Kommunale Versorgungskassen Westfalen-Lippe, Münster (öffnet im neuen Fenster)

Consultant Finance MDM & SAP S/4HANA (m/w/d) Schwarz Corporate Solutions, Neckarsulm (öffnet im neuen Fenster)

Applikationsmanager (m/w/d) Robert-Bosch-Krankenhaus GmbH, Stuttgart (öffnet im neuen Fenster)

Mendix-Entwickler SelfEDI Portal (EDI-Onboarding) (m/w/d) Schwarz IT, Weinsberg (öffnet im neuen Fenster)

Sachbearbeiter/-in IT-Support (m/w/d) Landeshauptstadt Stuttgart, Stuttgart (öffnet im neuen Fenster)

Mitarbeiter Datenmanagement & Marketing (m/w/d) Adolf Schuch GmbH, Worms (öffnet im neuen Fenster)

Applikationsmanager (m/w/d) SAP (FI/CO, MM) Robert-Bosch-Krankenhaus GmbH, Stuttgart (öffnet im neuen Fenster)

Google verrät Details zum Bigtable-Nachfolger Spanner. (Bild: Google) (Google)

Spanner: Googles globale Datenbank

Seit rund drei Jahren ist Spanner bei Google im Einsatz, in der vergangenen Woche veröffentlichte Google nun Details zu Spanner, das Google-Systeme wie Bigtable und Megastore ablösen soll. Dabei wird deutlich: Google ist seiner Konkurrenz einen Schritt voraus.

27 Kommentare

Drill soll als Incubator-Projekt entwickelt werden. (Bild: Apache Software Foundation) (Apache Software Foundation)

Apache Drill: Riesige Datenmengen werden schneller verarbeitet

Mit Drill soll die Abfrage und Analyse riesiger Datenmengen beschleunigt werden. Drill soll ein Incubator-Projekt der ASF werden und basiert auf dem Konzept des Google-Werkzeugs Dremel, welches das Unternehmen intern einsetzt.

Kommentare

Twitter setzt viel Open-Source-Software ein. (Bild: Twitter) (Twitter)

Social Media: So viel Open-Source-Software setzt Twitter ein

Dass Twitter Open-Source-Software benutzt und selbst entwickelt, ist kein Geheimnis. Wie viel quelloffene Technik der Nachrichtendienst einsetzt und wo, hat der Leiter der Open-Source-Abteilung Chris Aniszczyk jetzt verraten.

7 Kommentare

Nutch 2.0 veröffentlicht (Bild: Apache) (Apache)

Nutch 2.0: Freie Suchmaschine mit flexiblem Datenbank-Backend

Die freie Suchmaschine Apache Nutch ist in der Version 2.0 erschienen. Mit Nutch lässt sich das Web ebenso crawlen und indexieren wie das eigene Intranet. Die Inhalte lassen sich dann über eine Suche verfügbar machen.

1 Kommentare

Astronomische Uhr am Heilbronner Rathaus (Bild: Joachim Köhler/CC BY-SA 3.0) (Joachim Köhler/CC BY-SA 3.0)

Zeitsprung: Wie die Schaltsekunde Chaos im Internet verursachte

Update Mit teils massiven Ausfällen hat die Schaltsekunde in der Nacht zum 1. Juli 2012 unter anderem dem Linux-Kernel, MySQL und Java-basierten Anwendungen Probleme bereitet. Betroffen waren unter anderem Qantas, Reddit und Mozilla.

85 Kommentare

Alan Gates war an der Portierung von Hadoop auf Azure beteiligt. (Bild: Christian Schmidt-David/Golem.de) (Christian Schmidt-David/Golem.de)

Microsoft: Azure öffnet sich weiter für Open Source

Mit einem Update für Azure hat Microsoft seine Cloud-Plattform für weitere Open-Source-Software angepasst. Hadoop läuft als Beta. Hadoop-Entwickler Alan Gates beschreibt die Integration in einem Interview mit Golem.de.

Kommentare

Seminar: CRA, AI Act, NIS 2, KRITIS, DORA & Co. – Regulatorik, Cyber Resilience & Compliance: virtueller Ein-Tages-Workshop

zum Kurs

Seminar: Microsoft Copilot im Unternehmen implementieren: virtueller Ein-Tages-Workshop

zum Kurs

E-Learning: Microsoft Word - Beginner to Pro (E-learning in English)

zum Kurs

Seminar: ISO 27001 Foundation mit Zertifikat: virtueller Zwei-Tage-Workshop

zum Kurs

Hadoop 2.0 bringt große Neuerungen. (Bild: Apache Hadoop) (Apache Hadoop)

Bigdata: Alpha von Apache Hadoop 2.0 veröffentlicht

Arun Murthy, Release-Manager für Apache Hadoop 2.0, hat eine erste Alphaversion der kommenden Hadoop-Generation veröffentlicht, die unter anderem Hochverfügbarkeit für HDFS bietet und den Mapreduce-Nachfolger Yarn unterstützt.

Kommentare

Tux auf dem Linuxtag (Bild: Christian Jähn/Linuxtag) (Christian Jähn/Linuxtag)

Linuxtag 2012: Open Source trifft Business

In Berlin hat der Linuxtag 2012 begonnen. Die Messe beginnt mit der Verleihung des Univention-Absolventenpreises. Themenschwerpunkte liegen in diesem Jahr in den Bereichen Storage, Android und bei Rechenzentren.

Kommentare

NoSQL-Datenbank mit verbessertem Caching (Bild: Apache) (Apache)

NoSQL: Apache Cassandra 1.1 veröffentlicht

Die Apache Software Foundation hat ihre NoSQL-Datenbank Cassandra in der Version 1.1 veröffentlicht. Das einst von Facebook entwickelte System bringt in der aktuellen Version einige Neuerungen.

Kommentare

Opscode: 19,5 Millionen für Chef

Das US-Startup Opscode erhält in einer dritten Finanzierungsrunde 19,5 Millionen US-Dollar Risikokapital. Das Unternehmen entwickelt mit Chef eine Open-Source-Software zur Cloud-Automation.

Kommentare

NoSQL-Datenbank in C++ auf Basis von Googles Bigtable-Design (Bild: Hypertable) (Hypertable)

NoSQL: Hypertable schlägt HBase

Hypertable hat eine freie NoSQL-Datenbank entsprechend dem Design von Googles Bigtable entwickelt. Sie ist in C++ implementiert und schlägt das auf Hadoop basierende HBase zumindest in einem von Hypertable durchgeführten Benchmark deutlich.

14 Kommentare

Die zweite Alpha von Ubuntu 12.04 alias Precise Pangolin hat den neuen Kernel 3.2.2. (Bild: Mark Simpson/CC BY-SA 2.0) (Mark Simpson/CC BY-SA 2.0)

Linux-Distributionen: Canonical veröffentlicht Ubuntu 12.04 Alpha 2

Mit reichlich Aktualisierungen, aber ohne die für die finale Version geplanten Neuerungen hat Canonical die zweite Alpha von Ubuntu 12.04 veröffentlicht. Als Basis läuft der Linux-Kernel 3.2.2.

13 Kommentare

Der K.I.T.T. von Andreas sieht sehr originalgetreu aus. (Bild: Martin Wolf/Golem.de) (Martin Wolf/Golem.de)

Podcast Besser Wissen: Der eigene K.I.T.T.

Podcast Besser Wissen: Wie man freie Software betreut

Nicht immer wird man beim Berufseinstieg mitgenommen. (Bild: Public Domain / Montage: Golem.de) (Public Domain / Montage: Golem.de)

Podcast Besser Wissen: Per Anhalter durch die IT-Branche

Von BNC zu RJ45 - auch die populären Stecker haben sich geändert. (Bild: Martin Wolf/Golem.de) (Martin Wolf/Golem.de)

Podcast Besser Wissen: Von Funk bis Netz in Österreich

Ob unser PC in Flammen aufgeht und wir in der OS-Hölle landen, versuchen wir, im Podcast herauszufinden. (Bild: Pixabay / Montage: Golem.de) (Pixabay / Montage: Golem.de)

Podcast Besser Wissen: Windows 11 oder Weltuntergang?

Der C128 mit Zubehör und zwei Monitoren (Bild: Martin Wolf/Golem.de) (Martin Wolf/Golem.de)

Podcast Besser Wissen: Der 128er lebt!

Analysten sagen für 2012 ein weiteres Wachstum für Linux voraus. (Bild: Larry Ewing, Simon Budig, Anja Gerwinski) (Larry Ewing, Simon Budig, Anja Gerwinski)

Analyse: Oracle-Kunden migrieren 2012 zu Red Hat Linux

Laut einer Umfrage planen zahlreiche Oracle-Kunden den Umstieg von Solaris zu Linux. Oracle bietet zwar eine eigene Linux-Lösung an, aber die befragten Kunden bevorzugen Lösungen vom Konkurrenten Red Hat.

49 Kommentare

Hadoop 1.0.0 mit HDFS und Mapreduce (Bild: Apache Software Foundation) (Apache Software Foundation)

Mapreduce: Apache Hadoop 1.0 veröffentlicht

Die Apache Software Foundation hat Apache Hadoop in der Version 1.0.0 veröffentlicht. Hadoop basiert auf dem Mapreduce-Algorithmus von Google und erlaubt es, sehr große Datenmengen im Petabyte-Bereich auf Clustern aus vielen Einzelrechnern zu verarbeiten.

Kommentare

Mahout erhielt zahlreiche neue Algorithmen. (Bild: Apache Software Foundation) (Apache Software Foundation)

Maschinelles Lernen: Apache Mahout erhält neue Algorithmen

Das Apache-Projekt Mahout erhält zahlreiche neue Algorithmen. Über den Fortschritt der skalierbaren Implementierung von maschinenlernenden Algorithmen hat Entwickler Grant Ingersoll berichtet.

4 Kommentare

Das Tannenzapfentier ist das Maskottchen für Ubuntu 12.04. (Bild: Mark Simpson/CC BY-SA 2.0) (Mark Simpson/CC BY-SA 2.0)

Ubuntu 12.04: Precise Pangolin soll stabiler werden

Unter dem Namen Precise Pangolin soll im April 2012 Ubuntu 12.04 LTS erscheinen. Die Neuerungen der letzten beiden Ubuntu-Versionen sollen optimiert, die Linux-Distribution selbst soll auf Stabilität getrimmt werden.

28 Kommentare

NoSQL-Datenbanken: Hadoop soll in Windows Azure integriert werden

Windows will die NoSQL-Datenbank Hadoop in seine Cloud-Dienste integrieren. Später soll Hadoop auch auf Windows Server laufen.

2 Kommentare

Oracle Exadata Database Machine (Bild: Oracle) (Oracle)

Big Data Appliance: NoSQL-Datenbank von Oracle

Auf seiner Hausmesse Oracle Open World hat Oracle den Big Data Appliance vorgestellt, ein System speziell zur Analyse großer Datenmengen. Dabei kommt neben Hadoop eine NoSQL-Datenbank zum Einsatz: die Oracle NoSQL Database.

Kommentare

Bruce Perens schlägt eine neue Art von Contributor License Agreements vor. (Bild: perens.com) (perens.com)

Bruce Perens: Contributor License Agreements mit Offenheitsverpflichtung

Der ehemalige Debian-Projektleiter Bruce Perens stellt ein Konzept zur Duallizenzierung von Software vor. Demnach soll Code von freien Entwicklern nie ausschließlich proprietär verwendet werden können.

Kommentare

Storm wird im September 2011 Open Source. (Bild: Backtype) (Backtype)

Hadoop für Echtzeitdaten: Storm wird Open Source

Twitter will das von Backtype entwickelte System Storm als Open Source freigeben. Dabei handelt es sich um ein verteiltes, verlässliches und fehlertolerantes System zur Verarbeitung von Datenströmen, das Backtype als eine Art Hadoop für Echtzeitdaten bezeichnet.

3 Kommentare

Velocity-Organisator Steve Souders (Bild: O'Reilly) (O'Reilly)

Web Performance: O'Reillys Velocity-Konferenz kommt nach Berlin

O'Reilly startet einen europäischen Ableger seiner Konferenz Velocity in Berlin. Die bisher in den USA und China veranstaltete Konferenz widmet sich den Themen Web Performance und Operations.

Kommentare

Echtzeitanalyse: Twitter kauft Backtype

Twitter übernimmt das auf Echtzeitanalysen spezialisierte Unternehmen Backtype. Wie so oft bei solchen Übernahmen werden die Produkte von Backtype nicht länger angeboten.

1 Kommentare

Hortonworks: Yahoo gliedert Hadoop-Abteilung aus

Yahoo will um Apache Hadoop eine eigene Firma gründen: Hortonworks soll Hadoop-Entwickler aufnehmen und sich mit Support sowie Training finanzieren. Die Plattform soll weiterhin als Open-Source-Software angeboten werden.

Kommentare

Schema von HPCC (Bild: HPCC Systems) (HPCC Systems)

Hadoop-Alternative: Lexisnexis gibt HPCC als Open Source frei

Der Datenspezialist Lexisnexis will High Performance Computing Cluster (HPCC) als Open Source freigeben und damit eine Alternative zu Apache Hadoop schaffen. HPCC soll Unternehmen helfen, Probleme mit großen Datenmengen zu lösen.

3 Kommentare

Google-Beschäftigte in New York City (Bild: Reuters/Erin Siegal) (Reuters/Erin Siegal)

Ex-Beschäftigter: Google arbeitet mit veralteter Softwaretechnologie

Ein namhafter Entwickler hat Google verlassen und bezeichnet Softwaretools des Konzerns wie Protocol Buffers, Bigtable und Mapreduce als veraltet. Dhanji Prasanna war im Google-Wave-Team und vertrat Google in mehreren Java-Expertengruppen.

78 Kommentare

Cloud Computing: Yahoo stellt seine Hadoop-Distribution ein

Yahoo gibt seine eigene Hadoop-Distribution auf und will sich künftig stärker an Apache Hadoop beteiligen.

Kommentare

RevoscaleR: R bandelt mit Hadoop an

Revolution Analytics erweitert seine auf der freien Programmiersprache R basierende statistische Analysesoftware um Unterstützung für große Datenmengen. Damit wird es möglich, mit R Daten aus Hadoop oder NoSQL-Datenbanken gezielt zu analysieren.

6 Kommentare

Q-Sensei Boost: Suchmaschine für jedermann

Eine Suchmaschine für die eigenen Daten bietet Q-Sensei mit Boost. Die Technik soll Anwendern helfen, eigene Daten schnell und leicht aufzubereiten und mit anderen zu teilen. Dabei lassen sich auch Daten aus mehreren Quellen zusammenführen.

14 Kommentare

Apache Software Foundation: Sechs neue Projekte

Die Apache Software Foundation (ASF) hat auf einen Schlag sechs neue Top-Level-Projekte angekündigt, ein Rekord für die Organisation. Dazu zählt der Apache Traffic Server ebenso wie die Projekte Mahout, Tika, Nutch, Avro und HBase.

7 Kommentare

Riptano - kommerzieller Support für Cassandra

Unternehmen für Dienstleistungen rund um das NoSQL-System. Cassandra-Entwickler Jonathan Ellis hat mit Matt Pfeil das Unternehmen Riptano gegründet, das Dienstleistungen rund um Apaches freies NoSQL-System anbieten soll.

3 Kommentare

Hadoop erhält Googles Segen

Patentlizenz für freie Implementierung von Googles Mapreduce-Algorithmus. Das Apache-Projekt Hadoop verstößt möglicherweise gegen ein Patent von Google, doch das will Google nicht gegen die Open-Source-Projekte ins Feld führen. Damit ist ein wesentlicher Unsicherheitsfaktor des Projekts aus der Welt.

24 Kommentare

NoSQL-Datenbank Apache Cassandra 0.6 veröffentlicht

30 Prozent schneller, mi Zeilencache und Hadoop-Unterstützung. Die von Facebook entwickelte und an die Apache Software Foundation übergebene NoSQL-Datenbank Cassandra wurde in der Version 0.6.0 veröffentlicht. Es ist die erste Cassandra-Ausgabe als Apache-Top-Level-Projekt.

18 Kommentare

Twitters Open-Source-Webseite geht online

Microblogging-Dienst stellt seine quelloffenen Projekte vor. Auf einer eigens dafür geschaffenen Webseite stellt Twitter die Open-Source-Projekte vor, die der Anbieter für seine Microblogging-Dienste verwendet. Darunter befindet sich Ruby-Gems sowie Java-Anwendungen, die dort auch per Git zum Download freigegeben wurden.

18 Kommentare

Intel zeigt x86-Prozessor mit 48 Kernen unter Linux

Forschungschip benötigt zwischen 25 und 125 Watt. Singlechip Cloud Computer (SCC) nennt Intel seinen neuen Prozessor, der über 48 Kerne verfügt und den Weg hin zu Many-Core-Prozessoren ebnen soll. Dank feiner Stromsparfunktionen liegt die Leistungsaufnahme des Chips zwischen 25 und 125 Watt.

132 Kommentare

Yahoo spendet Traffic Server dem Apache-Projekt

Cloud-Computing-Software als Open Source freigegeben. Die von Yahoo seit mehreren Jahren entwickelte und eingesetzte Software Traffic Server geht als Spende an die Apache Software Foundation. Die Software kümmert sich um Session-Management, Authentifizierungen, Konfigurationsmanagement, Load-Balancing und Routing für eine komplette Servergruppe, die zu einer Cloud vernetzt wurde.

13 Kommentare

Wie Facebook die Daten von 300 Millionen Nutzern verkraftet

30.000 Server, 25 TByte Logfile täglich und 600.000 Fotos pro Sekunde. Facebook ist groß, in jeder Dimension. Das sagt Jeff Rothschild, Vice President für Technologie bei Facebook bei einer Präsentation an der Universität San Diego und unterlegte dies mit Zahlen. Rothschild erläuterte die Architektur hinter Facebook und sprach über künftige technische Herausforderungen.

134 Kommentare

Cloudera Desktop: Webbasierte Verwaltung von Hadoop-Clustern

Datei- und Jobbrowser, Cluster Health und Jobdesigner veröffentlicht. Der Hadoop-Spezialist Cloudera hat mit dem Cloudera Desktop eine GUI für Apache Hadoop vorgestellt. Mit der kostenlosen Software lassen sich Applikationen auf öffentlichen und privaten Hadoop-Clustern administrieren und überwachen.

2 Kommentare

Yahoo hält trotz Microsoft-Deal an Hadoop fest

PHP-Erfinder will Yahoo verlassen. Die Zusammenarbeit mit Microsoft, in deren Rahmen Yahoo künftig die eigene Suchmaschine durch Microsofts Bing ersetzen will, soll keine negativen Auswirkungen auf Yahoos Hadoop-Engagement haben. Hadoop sei weiterhin wichtig.

Kommentare

HadoopDB - Hybrid aus Hadoop und PostgreSQL

Skalierbar und robust wie Hadoop, so schnell wie eine parallele Datenbank. Die Skalierbarkeit von Hadoop, kombiniert mit der Geschwindigkeit eines parallelen Datenbanksystems. Das soll HadoopDB bieten - ein freies paralleles shared-nothing Datenbanksystem, das mit einer an SQL angelehnten Sprache abgefragt werden kann.

38 Kommentare

Yahoo veröffentlicht eigene Hadoop-Distribution

Ausgiebig getestete und erweiterte Hadoop-Version ausschließlich im Quelltext. Yahoo hat eine eigene Distribution von Apache Hadoop angekündigt. Die bei Yahoo intern eingesetzte Hadoop-Version stellt das Unternehmen Dritten im Quelltext zur Verfügung.

1 Kommentare

Elastic MapReduce - Amazon vermietet Hadoop-Cluster

Neuer Webservice von Amazon nutzt EC2 und S3. Amazon bietet mit seinem neuen Dienst Amazon Elastic MapReduce einen Hadoop-Cluster zum Mieten an. Damit lassen sich große Datenmengen auf verteilten Systemen verarbeiten.

3 Kommentare

Cloudera veröffentlicht Hadoop-Distribution

RPM-basierte Distribution mit webbasiertem Konfigurationsassistenten. Die Installation und Konfiguration von Hadoop ist nicht ganz einfach. Um das zu ändern, bietet Cloudera seine Hadoop-Distribution ab sofort frei zum Download an. Das Apache-Projekt dient zur Verarbeitung großer Datenmengen auf verteilten Systemen und ist an Googles Map/Reduce-Engine angelehnt.

Kommentare

Hadoop-Cluster als Live-CD

OpenSolaris als Betriebssystem. Die OpenSolaris-Community hat eine Live-CD mit einem Hadoop-Cluster veröffentlicht. Vom Start bis zum voll einsatzbereiten Cluster sollen dabei nur etwa 15 Minuten vergehen. Zudem soll sich die Software mit verhältnismäßig geringen Ressourcen ausprobieren lassen.

11 Kommentare

Testzentren für Cloud-Computing

HP, Intel und Yahoo bauen Testumgebung für Cloud-Computing auch in Karlsruhe. HP, Intel und Yahoo starten eine gemeinsame Open-Source-Testumgebung für Cloud-Computing, die mehrere Rechenzentren umfasst. Damit sollen finanzielle und logistische Barrieren bei der Forschung im Bereich Cloud-Computing abgebaut werden.

6 Kommentare

Yahoo schickt Slurp 3.0 ins Rennen

Neuer Crawler durchsucht das Netz für Yahoo. Yahoo hat seinen Crawler und die dahinterliegende Infrastruktur überarbeitet und schickt seinen Crawler Slurp nun in der Version 3.0 ins Netz. Im Vorfeld der Umstellung war es zu einigen ungewollten Unregelmäßigkeiten der Yahoo-Crawler gekommen.

4 Kommentare

Yahoo nimmt größten Hadoop-Cluster in Betrieb

Webmap umfasst 11 Billionen Verknüpfungen. Yahoo hat die bislang größte Hadoop-Installation in Betrieb genommen, auf der Yahoos Webmap liegt, die Basis von Yahoos Suche. Yahoos Hadoop-Installation umfasst mehr als 10.000 CPUs sowie 5 PByte Festplattenplatz.

7 Kommentare

M45 - Hadoop-Installation mit 4.000 Prozessoren für Forscher

Yahoo startet Programm zur Verbesserung von Open Source für Internet Computing. Yahoo legt ein Programm auf, um die Forschung und Entwicklung von Open-Source-System-Software für verteiltes Rechnen zu fördern. Dabei folgt Yahoo einem ähnlichen Plan von Google und IBM, stellt aber eine deutlich größere Hardware-Installation zur Verfügung.

3 Kommentare

Kurse

Podcast Besser Wissen