NoSQL
RethinkDB 1.0 läuft nicht nur auf SSDs
Das US-Startup Hexagram 49 hat seine auf SSDs optimierte NoSQL-Datenbank RethinkDB in der Version 1.0 veröffentlicht. Sie soll linear mit der Zahl der Kerne skalieren, auf SSDs zehnmal schneller sein als herkömmliche Datenbanken und nach einem Stromausfall sofort wieder verfügbar sein.

Entstand die erste Implementierung der RethinkDB noch als MySQL-Plugin, hat sich Hexagram 49 von diesem Ansatz mittlerweile verabschiedet. RethinkDB läuft nun unabhängig und soll in Zukunft diverse Protokolle unterstützen. Für den Anfang setzt RethinkDB auf das Protokoll von Memcached, so dass die Datenbank in Setups mit Memcached dieses nahtlos ersetzen kann. Mit strukturierten beziehungsweise relationalen Daten kann RethinkDB derzeit nicht umgehen.
Auch an einer anderen Stelle sind die Macher der RethinkDB von ihrer ursprünglichen Idee abgewichen: Geplant war, konsequent auf den Einsatz mit SSDs zu setzen, nun läuft RethinkDB 1.0 auch mit herkömmlichen Festplatten und damit auch auf Amazon-Cloud-Servern. Zwar soll die NoSQL-Datenbank auch auf Festplatten besonders schnell sein, ihre Vorteile spielt sie aber vor allem auf SSDs aus.
Vorteile der RethinkDB
RethinkDB soll linear mit der Zahl der CPU-Kerne skalieren und auch die Vorteile von NUMA-Architekturen nutzen können. Vor allem aber soll RethinkDB auf Systemen mit SSD bis zu zehnmal schneller sein als Lösungen der Konkurrenz. Dazu haben die Entwickler nach eigenen Angaben Dutzende von SSDs getestet, um sicherzustellen, dass die RethinkDB immer das Optimum herausholt. Dabei soll die Datenbank eine geringe Latenz aufweisen, die in aller Regel unter 1 Millisekunde liegt. Ein ausgeklügeltes Event-System soll dafür sorgen, dass die RethinkDB mehrere zehntausend Verbindungen gleichzeitig verkraftet. Passen die Daten in den am häufigsten genutzten Blöcken in den Speicher, soll die Geschwindigkeit besonders hoch sein.
Um den Overhead von Dateisystemen zu umgehen, arbeitet die RethinkDB direkt auf Block-Geräten und kümmert sich selbst um Konsistenzprüfungen. Dadurch soll die Datenbank nach einem Stromausfall sofort wieder zur Verfügung stehen. Dabei können die Daten über mehrere Dateien oder Blockgeräte hinweg gespeichert werden. Administratoren können zudem viele Parameter - darunter die Block-Größe und Regeln zur Garbage-Collection - beeinflussen, um die Leistung des Systems zu optimieren.
Hexagram 49 hat unter rethinkdb.com/performance eine Benchmark-Übersicht zusammengestellt, die zeigen soll, in welchen Situationen RethinkDB sinnvoll einzusetzen ist.
RethinkDB ist nicht Open Source, wird aber in einer kostenlosen Basisversion ohne Support angeboten. Eine Premiumversion mit Support gibt es für 1.500 US-Dollar pro Maschine und Jahr. Als Hardware für optimale Performance wird ein System mit mindestens vier CPU-Kernen, 32 GByte RAM und einem Array aus vier oder mehr SSDs empfohlen. Zudem sollen zwei oder mehr Gigabit-Ethernet-Karten im System stecken.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
- ohne Werbung
- mit ausgeschaltetem Javascript
- mit RSS-Volltext-Feed
Steht sogar im Artikel, aber einsortiert ist der Artikel in der Open-Source-Software...