Erfahrungswerte

Der Autor beschäftigt sich seit Längerem mit SDS-Technologien und testet eine LizardFS-Umgebung im Rahmen eines Pilotierungsprojekt. Der mehrere Monate andauernde Testlauf basiert auf der zum Startzeitpunkt für Debian 7 verfügbaren LizardFS-Version 2.6 und sieht die Überprüfung der Software unter produktionsnahen Bedingungen inklusive verschiedener Tests, unter anderem Failovers, vor.

Stellenmarkt
  1. Systemadministrator*in Desktopmanagement Produktions-IT
    SCHOTT AG, Mitterteich
  2. IT Systemadministrator (m/w/d)
    Franz Mensch GmbH, Buchloe
Detailsuche

Die hier beschriebenen Tests decken zwar nur einen Teil der möglichen Ereignisse ab, zeigen aber, dass die Lösung grundsätzlich funktioniert und mit Fehlerfällen umgehen kann. Das Verhalten von LizardFS in einem solchen Fall wirkt in der Regel nachvollziehbar, wenn auch manchmal etwas träge.

Eines der Testszenarien war der Neustart eines Masters, um einen Wechsel der Master-Rolle auf einen anderen Knoten in einem anderen Rechenzentrum zu provozieren. Der gleichzeitig stattfindende Lesezugriff eines Clients wurde während des Master-Wechsels für knapp zwei Sekunden unterbrochen, lief danach jedoch weiter. In solchen Fällen scheint es also wichtig, dass die zugreifende Applikation mit solchen Wartezeiten umgehen kann und der Master-Wechsel möglichst schnell erfolgt.

Ein anderes Szenario sieht vor, dass Clients die RZ-lokalen Chunk-Server kennen und sie beim Lesezugriff gegenüber den Chunk-Servern von einem anderen Standort bevorzugen. Während eines Lesevorgangs durch einen RZ-lokalen Client wurden die Chunk-Server im gleichen Standort vom Netz getrennt, womit der Client die Daten ohne erkennbare Verzögerung von den Chunk-Servern des anderen Standorts bezog. Sobald die vom Netz getrennten Chunk-Server im gleichen RZ wieder verfügbar waren, schwenkte der Client automatisch zurück und las die Daten wieder von den ursprünglichen Nodes.

Golem Akademie
  1. Terraform mit AWS
    14./15. September 2021, online
  2. OpenShift Installation & Administration
    9.-11. August 2021, online
Weitere IT-Trainings

Diese Tests haben ein Limit aufgezeigt: In LizardFS werden Goals festgelegt, die besagen, wie oft das verteilte Dateisystem eine Datei vorhalten soll. In der Regel stellt man mindestens genauso viele bis deutlich mehr Chunk-Server auf, damit dieses Ziel erfüllt werden kann. Wenn durch Tests, Reboots, Abstürze oder andere Ausfälle jedoch zu wenige Chunk-Server online sind, um das Ziel für eine neue Datei sofort zu erfüllen, verweigert der LizardFS-Master den Schreibvorgang. In diesem Beispiel waren nur noch zwei Chunk-Server bei einem Replication-Goal von drei verfügbar. Ein LizardFS-Entwickler bestätigte dieses Verhalten und kündigte eine interne Diskussion zu diesem Thema an.

Im Vergleich

LizardFS muss sich im SDS-Bereich mit vielen verschiedenen Konkurrenten messen, etwa mit Ceph oder GlusterFS. Ceph ist primär ein zu Amazons S3-API kompatibler Object-Store, kann aber auch Block-Devices oder ein Posix-kompatibles Dateisystem ("CephFS") bereitstellen. Letzteres ist mehr ein Overlay über den Object-Store als ein robustes Dateisystem. Die Hersteller schreiben selbst auf ihrer Webseite, dass sich CephFS derzeit primär an Early-Adopter richtet und keine wichtigen Daten darauf gespeichert werden sollten. Da Ceph seinen Fokus auf die Object-Store-Funktionalität legt, kann es nicht als direkte Konkurrenz zu LizardFS betrachtet werden.

GlusterFS bietet auf dem Papier die nahezu gleiche Funktionalität, ist aber schon länger auf dem Markt und genießt dementsprechend viel Ansehen in der SDS-Community. GlusterFS bietet viele verschiedene Betriebsmodi, die je nach Konfiguration verschiedene Level an Ausfallsicherheit und Performance bieten. Es bietet diese Konfigurationsmöglichkeiten auf Volume-Ebene, während LizardFS die Replikationsziele pro Ordner oder Datei festlegt. Beide Varianten besitzen ihre Vor- und Nachteile: Bei GlusterFS muss sich der Administrator bei Erstellung des Volumes für eine Variante entscheiden, während die Replikationsart bei LizardFS jederzeit abänderbar ist.

Für sicherheitsbewusste Systembetreuer bietet GlusterFS die Möglichkeit, ein Volume mit einem Key zu verschlüsseln. Nur die Server, die den richtigen Key vorweisen können, sind dann in der Lage, das Volume einzuhängen und zu entschlüsseln. Sowohl GlusterFS als auch LizardFS werden auf Linux-Clients als FUSE-Modul im User-Space betrieben.

Während bei LizardFS die Daten nur einmal auf einen Chunk-Server geschrieben werden müssen (von dort aus replizieren die Chunk-Server untereinander weiter), übernimmt bei GlusterFS der Client die Replikation: Der Schreibvorgang geschieht auf allen beteiligten GlusterFS-Servern parallel, sodass der Client sicherstellen muss, dass die Replikation überall erfolgreich abgeschlossen wurde. Das sorgt bei Schreibzugriffen für eine langsamere Performance, fällt aber ansonsten nicht ins Gewicht.

Während LizardFS dem Client stets einen Master präsentiert, können GlusterFS-Clients beim Einhängen des Volumens mehrere GlusterFS-Server angeben. Damit kann ein Client bei einem Ausfall des ersten angegebenen Servers auf andere GlusterFS-Nodes zurückgreifen.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
 Mehr Chunk-Server für mehr SpeicherplatzAusblick 
  1.  
  2. 1
  3. 2
  4. 3
  5. 4
  6. 5
  7. 6
  8. 7
  9.  


Aktuell auf der Startseite von Golem.de
KenFM
Ken Jebsen von Anonymous gehackt

Die Aktivisten von Anonymous haben die Website des Verschwörungstheoretikers Ken Jebsen gehackt und offenbar Infos zu Spendern erbeutet.

KenFM: Ken Jebsen von Anonymous gehackt
Artikel
  1. Serverprobleme: Anlaufschwierigkeiten beim digitalen Impfnachweis
    Serverprobleme
    Anlaufschwierigkeiten beim digitalen Impfnachweis

    Nach mehreren Versuchen sind wir in Berlin an einen digitalen Impfnachweis gekommen. Doch die Apotheken berichten von Serverproblemen.

  2. Trådfri: Doom läuft auf einer Ikea-Lampe
    Trådfri
    Doom läuft auf einer Ikea-Lampe

    Nicola Wrachien hat es geschafft, Doom auf einer Ikea-Trådfri-Lampe zum Laufen zu bringen. Etwas Zusatzhardware war aber erforderlich.

  3. Geforce RTX 3000: Nvidia baut mehr Ampere-Grafikkarten auf Kosten der RTX 2060
    Geforce RTX 3000
    Nvidia baut mehr Ampere-Grafikkarten auf Kosten der RTX 2060

    Nvidia will Kapazitäten freimachen und statt Turing-Grafikkarten Geforce-RTX-3000-Varianten bauen. Das könnte zu mehr Verfügbarkeit führen.

felix.schwarz 09. Mai 2016

hm, zu den restlichen Aussagen (Microsoft's scale-out Angebote) kann ich nichts sagen...

Juge 30. Apr 2016

Kennst Du Microsoft Azure? Xbox Live? Skype? Das läuft alles auf SDS (Scale out Fileserver).

tingelchen 27. Apr 2016

Am Ende muss man eigentlich nur hergehen und die Online Speicher als FS im Linux...

olqs 27. Apr 2016

Im Text wird geschrieben, dass CephFS auch von den Entwicklern noch als "nur für Early...


Folgen Sie uns
       


Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Schnäppchen • Dualsense 59,99€ • Battlefield 2042 PC 53,99€ • XXL Sale bei Alternate • Rainbow Six Extraction Limited PS5 69,99€ • Sony Pulse 3D-Headset PS5 99,99€ • Snakebyte Gaming Seat Evo 149,99€ • Bethesda E3 Promo bei GP [Werbung]
    •  /