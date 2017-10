Apple bringt mit High Sierra das bereits in iOS integrierte APFS (Dateisystem) und Microsoft arbeitet an ReFS. Da kommt man sich mit EXT4 als Standard-Dateisystem unter Linux schon recht altmodisch vor! Doch mit ZFS existiert auch eine Alternative mit modernen Features. Ich habe sie ausprobiert.

Anzeige

Für den ein oder anderen stellt sich vermutlich die Frage, warum ein neues Dateisystem unter Linux überhaupt nötig ist. Die simple Antwort lautet: Ist es nicht, EXT4 ist weit etabliert, stabil und hat vor einiger Zeit das letzte Update erhalten, das es für die kommende Hardware-Generation fit machen soll. Der Vorteil eines neuen Dateisystems liegt vor allem für Desktops und Workstations bei neuen Funktionen, die die Arbeitsumgebung maßgeblich verbessern können.

Was ZFS ist

ZFS ist die Kurzform für Zettabyte File System. Während Dateisysteme unter Linux in der Regel als formatierte Partition gesehen werden, die in die FSTAB eingebunden werden, ist ZFS grundlegend anders: Optimalerweise gibt man ihm eine oder mehrere Festplatten und kann danach sogenannte Datasets erstellen. Das sind letztendlich nichts anderes als Partitionen einer Festplatte - nur besser. ZFS übernimmt dabei nicht nur die Rolle eines traditionellen Dateisystems, vielmehr ist es Raid-Controller, Volumen-Manager und Dateisystem in einem.

Neue Abkürzungen werden eingeführt

Während es sich bei EXT4 nur um ein Dateisystem handelt, ist ZFS deutlich komplexer aufgebaut. Ein sogenannter Speicher-Pool besteht aus einem oder mehreren VDEVs. Diese sind letztendlich nichts anderes als einzelne Partitionen, Festplatten oder eine Art Raid-Verbund - der als RaidZ, RaidZ2 oder RaidZ3 bezeichnet wird. RaidZ kann einen Festplatten-Ausfall tolerieren, RaidZ2 zwei -Ausfälle und RaidZ3 drei. Zusätzlich gibt es die Option, zwei oder mehrere Partitionen/Festplatten zu spiegeln.

Neben dieser Hauptgruppe, auf der alle Daten des Pools gespeichert werden, gibt es noch zwei weitere Bestandteile: das ZFS Intent Log (kurz: ZIL) und den Cache. Der Cache bleibt im Arbeitsspeicher und folgt einem adaptiven Austauschalgorithmus (Adaptive Replacement Cache, ARC), um häufig genutzte Daten schnell aufrufen zu können. Wenn Daten im Arbeitsspeicher weichen müssen, werden sie auf einen optionalen, eigenständigen Cache geschrieben: den L2ARC (Level 2 ARC).

Das ZFS Intent Log ist zu komplex, um hier darauf einzugehen. Die genaue Funktionsweise wird auf einer eigenen Webseite erläutert.

Datenintegrität ist am wichtigsten

Hätten die Sturmtruppen des Imperiums ZFS zum Datenabgleich eingesetzt, wäre ihnen wohl einiges erspart geblieben. Datenintegrität steht bei ZFS an erster Stelle. Die verschiedenen Raid-Level versprechen einen Schutz der Daten bei dem leider nicht seltenen Ausfall einer Festplatte, während ZFS intern jede gelesene Datei mit ihrer beim Schreiben generierten Checksumme abgleicht und im Falle eines Fehlers, falls möglich, repariert. Fehlerhafte Urlaubsbilder, Videos oder auch Textdateien gehören der Vergangenheit an.

Die Integritätsprüfung ist einer der Hauptgründe dafür, dass die Entwickler von ZFS vorsehen, fehlerkorrigierenden Arbeitsspeicher (ECC, registered ECC) einzusetzen. Dieser ist sinnvoll in Rechenzentren oder bei Backups, beim Desktop-Einsatz muss man aber nicht explizit auf den fehlerkorrigierenden Arbeitsspeicher achten. Auf meinem Notebook beispielsweise läuft eine Installation von ArchLinux unter ZFS, ohne in den letzten sechs Monaten einen einzigen Fehler gezeigt zu haben. Wer viel Wert auf die Verfügbarkeit seiner Backups legt, sollte in Erwägung ziehen, ein NAS mit fehlerkorrigierendem Arbeitsspeicher aufzubauen.