Hadoop für Echtzeitdaten
Storm wird Open Source
Twitter will das von Backtype entwickelte System Storm als Open Source freigeben. Dabei handelt es sich um ein verteiltes, verlässliches und fehlertolerantes System zur Verarbeitung von Datenströmen, das Backtype als eine Art Hadoop für Echtzeitdaten bezeichnet.

Storm soll am 19. September 2011 auf der Konferenz Strangeloop als Open Source freigegeben werden, das kündigte Nathan Marz an, der Chefentwickler von Backtype. Durch die Übernahme von Backtype durch Twitter gehört Storm mittlerweile zu dem Microblogging-Dienst, was die Frage aufwarf, ob Twitter Storm wie von Backtype geplant als Open Source freigeben wird.
Backtype beschreibt Storm als eine Art Hadoop für Echtzeitdaten: Ähnlich wie die Jobs des von Hadoop implementierten Mapreduce laufen auf einem Storm-Cluster "Topologien". Während aber ein Mapreduce-Job irgendwann zu einem Ende kommt, läuft eine Topologie, bis sie manuell gestoppt wird. Die parallele Architektur von Storm soll dabei besonders fehlertolerant sein. Fallen Systeme aus, können sie nach dem Neustart nahtlos weiterarbeiten. Zudem garantiert das System, dass Nachrichten verarbeitet werden.
Storm lasse sich in unterschiedlichster Form einsetzen, wirbt Marz. So könne Storm zur Stream-Verarbeitung genutzt werden, wobei es einen Strom eingehender Nachrichten entgegennimmt und Datenbanken in Echtzeit aktualisiert. Auch für "Continuous Computation" lasse sich Storm nutzen. Dabei wird eine unendlich laufende Abfrage auf einen Nachrichtenstrom angewandt, und die Ergebnisse werden in Echtzeit an die Clients geschickt. Als drittes Beispiel nennt Marz verteilte RPC-Systeme.
Einige erste Details und Beispiele zu Storm hat Marz in einem Blogeintrag zusammengefasst. Bis zum 19. September 2011 will er die Dokumentation verbessern, so dass Interessierte die Software leicht testen können, wenn sie dann als Open Source veröffentlicht wird.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
- ohne Werbung
- mit ausgeschaltetem Javascript
- mit RSS-Volltext-Feed
Backtype beschreibt Strom als eine Art Hadoop... :-D