Erasure Coding: Das Ende von Raid kommt durch Mathematik

Wenn es um Datensicherheit und Redundanz geht, denken viele IT-affine Menschen direkt an Raid. Das Redundant Array of Independent Disks ist bereits seit langer Zeit ein Quasistandard für NAS-Systeme und File-Server. Raid 1, Raid 5 und Raid nutzen ein oder mehrere physische Laufwerke als Rückfallebene, sollte ein Gerät ausfallen. Das Problem: Fallen mehrere Platten gleichzeitig aus, können Daten schnell verloren gehen oder müssen zeitintensiv aus einem früheren Backup wiederhergestellt werden. Eine Alternative ist die Fehlerkorrektur durch Erasure Coding, die von einigen mittlerweile teils als Ablösung von Raid gesehen wird. Dabei ist das Verfahren genauso alt, wenn nicht sogar älter.
Variable Redundanz
Raid ist allerdings nicht obsolet: Solange sich ein Laufwerk aus nicht allzu vielen Festplatten oder SSDs zusammensetzt, sind Raid-Verbunde noch tragbar. Geht es um große Cluster, bei denen Laufwerke aus mehreren Dutzend Massenspeichern bestehen, wird die Ausfallwahrscheinlichkeit in vielen Fällen zu einem kritischen Faktor - schließlich ist es nicht unwahrscheinlich, dass in einem Cluster aus 100 Platten zwei oder mehr gleichzeitig ausfallen. Raid-Systeme kommen da schnell an ihre Grenzen. In besonders kritischen Anwendungen, etwa im Rechenzentrum, ist es daher üblich, eine oder meist sogar zwei volle Replikationen von Daten anzulegen. Das kostet Schreibleistung und viel Geld, das in zusätzliche Hardware investiert werden muss.