Original-URL des Artikels: https://www.golem.de/news/bandlaufwerke-als-backupmedium-ein-bisschen-tetris-spielen-1906-141575.html    Veröffentlicht: 03.06.2019 12:00    Kurz-URL: https://glm.io/141575

Bandlaufwerke als Backupmedium

"Wie ein bisschen Tetris spielen"

Hinter all den modernen Computern rasseln im Keller heutzutage noch immer Bandlaufwerke vor sich hin - eine der ältesten digitalen Speichertechniken. Golem.de wollte wissen, wie das im modernen Rechenzentrum aussieht und hat das GFZ Potsdam besucht, das Tape für Backups nutzt.

Obwohl die Welt der IT ständig im Wandel ist, bleiben doch einige Konstanten erhalten. So zum Beispiel Bandlaufwerke, die bereits seit den 50er Jahren das Bild eines typischen Computers prägen: riesige Konsolen mit winzigen Bildschirmen und Bändern im Schrank. Diese für Computertechnik fast antike Hardware ist im Bereich der Langzeitarchivierung und für Backup-Strategien heute noch immer im Gebrauch - allerdings in einem kompakteren Format. Doch warum ist das so? Golem.de hat das Rechenzentrum des Geoforschungszentrums in Potsdam aufgesucht und sich die Technik genauer angeschaut.

Für Steffen Loos, IT-Administrator beim Institut, ist die Antwort simpel: "Das ist eine Kostenfrage", sagt er. Tatsächlich kosten die von ihm verwendeten LTO-7-Magnetbänder momentan etwa 10 Euro pro Terabyte. Festplatten im Enterprise-Bereich sind da wesentlich teurer, genauso wie Flash-Speicher, der trotz starken Preisverfalls für Backup-Anwendungen noch immer eher ungeeignet ist.

Auch der Tape-Anbieter IBM bringt auf Anfrage von Golem.de das Argument der Kosten als Vorteil der Technik an. "Laut ESG sind die erwarteten zehnjährigen Gesamtbetriebskosten für die LTO-8-Datenspeicherlösung 86 Prozent niedriger als bei einer All-Disk-Lösung und 66 Prozent niedriger als bei einem All-Cloud-Storage", sagt Josef Weingand, Business-Development-Leiter bei IBM DACH.

Als einer der verbliebenen Anbieter stellt IBM zum Großteil Laufwerke nach dem Standard Linear Tape Open her, unter anderem LTO-5, LTO-7 und dem aktuellen Vertreter LTO-8. Dieses Format zeichnet sich dadurch aus, dass Laufwerke jeweils zwei Generationen abwärtskompatibel sind, zumindest beim Lesen älterer Bänder. LTO-8 ist nur noch zu LTO-7 abwärtskompatibel, kann allerdings leere Tapes der Vorgängergenerationen auch beschreiben. Zudem können Bänder verschiedener Hersteller meist im gleichen Bandlaufwerk betrieben werden. Andere Tape-Standards sind beispielsweise der IBM-Standard 3692, Oracle Storagetek T10000 und das erste in kommerziell verkauften Computern genutzte Format Uniservo 1 aus dem Jahr 1951.

30 Jahre Daten speichern

Tape hat zusätzlich den Vorteil, dass es ein kaltes Medium ist und daher keinen Strom benötigt - ähnlich wie andere Wechselmedien wie DVDs, CDs und Disketten. Bandlaufwerke benötigen typischerweise 20 Watt im Betrieb und 5 Watt im Ruhezustand. Die Lebensdauer von Bändern liegt laut IBM bei bis zu 30 Jahren. Allerdings sollten dazu möglichst gute Lagerbedingungen eingehalten werden. Das bedeutet, eine Temperatur von 16 bis 25 Grad und eine Luftfeuchtigkeit von 20 bis 50 Prozent zu gewährleisten, um statischer Aufladung vorzubeugen.

Auch verträgt Tape staubige Umgebungen eher weniger. Das GFZ stellt seine Tape-Backups daher in einem abgeschlossenen, sauberen und klimatisierten Rechenzentrum neben anderer Hardware auf. Neben Tape-Storage-Systemen finden wir dort viele Serverschränke in Reih und Glied. Darin sind Blades, Patchfelder, Switches, Router und Luftkühlungen verschiedenster Hersteller montiert. Es wird klar, dass die Anlage im Laufe der Zeit immer weiter gewachsen ist. Kreuz und quer gesteckte Patchkabel bezeugen, dass ständig neue Hardware hinzugefügt wird. Paletten mit vielen Magnetbändern betonen die Wichtigkeit des Mediums für das GFZ. Der Bedarf ist groß.

Robust scheinen Tapes auf jeden Fall zu sein. So erzeugte einmal ein Batteriebrand der USV-Anlage starke Rauchschwaden im Rechenzentrum. Loos berichtet von beschädigten Fileservern und Festplatten, während die alten Bänder alles anscheinend gut überstanden haben.

Loos sind die neuen LTO-8-Bänder von IBM trotz höherer Kapazität von 12 TByte noch zu teuer. Neben den Datenträgern an sich müssten bei einem Wechsel nämlich auch die Bandlaufwerke selbst ausgetauscht werden, da sie nur nach einem Standard beschreiben können. Die Laufwerke kosten einzeln schon etwa 2.500 Euro netto pro Stück. Das Institut nutzt daher momentan den etwas älteren LTO-7-Standard, gemischt mit sehr alten, aber noch lesekompatiblen LTO-5-Systemen. Auf jede der neueren Kassetten passen maximal etwa 6 TByte an Daten. Komprimiert können es 15 TByte sein.

Da Daten auf Band allerdings immer hintereinander gespeichert sind, ist es für einen effizienten Betrieb eines Backupsystems mit dieser Technik wichtig, zusammengehörende Dateien möglichst als durchgehende Sequenz zu übertragen. Im Gegensatz zu einer Festplatte kann ein Tape-Laufwerk nicht ohne Weiteres schnell zwischen Sektoren hin- und herspringen. Normalerweise wird bei LTO ein Bandsektor immer nur einmal beschrieben. Das ständige Stoppen und Starten der Spulenmotoren bei einer starken Datenfragmentierung führt zudem zu schnellerem Verschleiß der Bänder. Bei vielen Tausend Computern in der IT-Landschaft des GFZ ist das für Loos und sein Team nicht unbedingt immer trivial.

Ein Faktor für eine kürzere Haltbarkeit eines Bandes sind auch die Schreibprozesse. In der Theorie sollte ein LTO-Tape mindestens 200 Zugriffe über die komplette Bandlänge aushalten. Kurze Backup-Intervalle und das häufige Beschreiben eines Mediums sind daher schädlich für die Haltbarkeit. Loos gruppiert inkrementelle Backups mehrerer Rechner deshalb in festen zeitlichen Intervallen zu größeren Datenschüben zusammen, um diese einem Schreibdurchlauf zu sichern.

Das stellt sicher, dass all die vielen Magnetbänder lange unbeschadet lagern können. Das Archiv befindet sich in einer automatisierten Tape Library, in der Tausende von Bändern Platz haben.

Roboterarm wechselt Kassetten automatisch

Das GFZ Potsdam hat zwei redundante Backup-Systeme in zwei verschiedenen Kellern untergebracht. Auf den fast 2.000 verwendeten Bändern speichert Loos die essenziellen Daten von wissenschaftlichen Auswertungen, von Forschungsprojekten und Messungen. Dazu kommen die Ordner und Dateien der Mitarbeiter - insgesamt haben sich bereits 3 Petabyte auf Magnetbändern angesammelt. Die Anschaffungskosten für eine solche Library können schon einmal jenseits von 100.000 Euro liegen. Auf Dauer rechtfertigt sich das wegen der absurd geringen Preise im Vergleich zu HDD und SSD aber trotzdem.

Bänder werden mithilfe von Laufwerken, auch Streamer genannt, ausgelesen oder mit neuen Daten bespielt. "Das ist für Praktikanten immer spannend", sagt Loos, als er Golem.de das aufgeschraubte Gehäuse eines Laufwerkes zeigt. Innen sind viele mechanische Teile zu erkennen, etwa Zahnräder aus Kunststoff und Servomotoren, die sich theoretisch per Hand austauschen ließen. Das ist bei immer kompakter werdenden Produkten wie Festplatten nicht immer ohne Weiteres möglich.

Mehrere Laufwerke übereinander befinden sich in den automatisierten Archivsystemen, sogenannten Tape Libraries. In diesen großen Schränken liegen auch mehrere Tausend Magnetbänder neben- und übereinander. Ein Robotergreifarm kann automatisch zwei Bänder gleichzeitig aus ihren Lagerfächern ziehen und in eines der vielen parallel laufenden Bandlaufwerke einlegen. "Das ist wie ein bisschen Tetris spielen", sagt Loos über das Stapeln der Kassetten in Anlehnung an das berühmte Geschicklichkeitsspiel.

Währenddessen schiebt er händisch neu gekaufte LTO-7-Bänder in die Library, welche diese automatisch in freie Fächer einsortiert. Interessant: An einem kleinen LC-Display am Einschub erkennen wir, welches Band aus einem Fach in ein anderes Fach gelegt wird. Die Fächer sind in einer dreidimensionalen Matrix durchnummeriert, da an der hinteren Seite der Library in einem Einschub mehrere Bänder hintereinander lagern.

Wir können uns vorstellen, dass die Zugriffszeiten einer solchen Anlage teilweise im Sekunden- oder Minutenbereich liegen, wenn ein Datenträger erst gesucht, eingelegt und anschließend abgespielt werden muss.

Ganz ohne Festplatten geht es nicht

Die langen Zugriffszeiten sind ein Grund dafür, dass Tape in allen Bereichen abseits von weniger latenzabhängigen Anwendungen wie Langzeit-Backups kaum noch Verwendung findet - und das, obwohl die Laufwerke beim Lesen von durchlaufenden Datensegmenten teils schneller sind als etwa SATA- oder SAS-Festplatten. "Wir erreichen schon so 300 MByte pro Sekunde", sagt Loos. Bei komprimierten Daten kann die Lesegeschwindigkeit sogar auf 700 MByte/s steigen, da Daten kompakter auf dem Band liegen. In diesem Fall kann das an anderer Stelle zu einem Flaschenhals-Effekt führen, wenn Backups beispielsweise zurückgespielt werden müssen.

Die Tape Libraries sind nämlich per Lichtwellenleiter an eine weitere Ebene angeschlossen. Ein Fileserver mit herkömmlichen Festplatten dient beim Schreiben und Lesen großer Datenmengen als Cache. Darauf werden Backup-Daten zwischengespeichert, bevor sie in einem Zug auf die Magnetbänder überspielt werden. Das Write-Once-Read-Many-Konzept (WORM) der LTO-Bandlaufwerke erfordert eine solche Maßnahme aus besagten Gründen der Haltbarkeit. Es kann dabei vorkommen, dass die Festplatten mit den hohen Geschwindigkeiten der Bandlaufwerke nicht mithalten können, was manchmal zu Verlangsamungen bei der Datenmigration führt.

Der Festplatten-Cache steht übrigens im gleichen Raum. "Werfen wir doch mal eine Datenprüfung an, damit es etwas zu sehen gibt", sagt Loos. Tatsächlich: Grüne Lichter flackern auf. Sie zeigen, dass die Festplatten gerade viel zu tun haben. Währenddessen bewegt sich der mechanische Arm in der Tape Library zwischen den Bändern hin und her. Er ist gut durch eine Glasscheibe in der Mitte des Schrankes zu erkennen.

Dass ein Anwender seine Daten verliert und ein Backup anfordert, ist bei Loos nicht ungewöhnlich. Mit einer Steuerungssoftware kann er bestimmte Daten direkt abrufen und über das interne Netzwerk auf den Computer des Anwenders aufspielen. Darin lassen sich auch Scripts ausführen, die Backup-Prozesse anstoßen oder Datenintegritätsprüfungen von Tapes durchführen.

Sehr selten geschieht es, dass es im GFZ zu einem Totalausfall kommt. Das hatte beim letzten Mal keine äußeren Ursachen, sondern war schlicht menschliches Versagen. "Beim letzten Vorfall wurde aus Versehen das komplette Dateisystem gelöscht", sagt Loos. Aus diesem Grund musste sein Team ein Vollbackup zurückspielen, was mehrere Wochen gedauert haben soll. Auch Stromausfälle kommen auf dem Gelände, das abseits der Stadt auf einem Hügel liegt, häufiger vor. Dies fängt aber die im Rechenzentrum integrierte USV-Anlage ab.

Verhalten wie HDDs

LTO-Magnetbänder speichern auf einem Cache eine Verzeichnisstruktur, welche Informationen zu Dateien auf dem Datenträger enthält - ähnlich aktuellen Festplatten und SSDs. Theoretisch ließe sich ein Bandlaufwerk heute noch immer als Datenspeicher direkt an einen PC anschließen.

Hat ein Band ausgedient, werden dessen gespeicherte Daten nicht gelöscht. Stattdessen wird die Verzeichnisstruktur entfernt, so dass Daten theoretisch nicht mehr lesbar sind. Über Umwege können Informationen aber noch immer ausgelesen werden, weshalb ausgemusterte Laufwerke in einer Mülltonne landen, die mit einem stabilen Schloss verriegelt ist. "Das Löschen übernimmt ein Dienstleister", sagt Loos.

Neben HDDs und SSDs gibt es eine dritte Option, die Tape im Bereich Backup Konkurrenz machen könnte: Cloud Storage. Amazon Web Service bietet beispielsweise den Dienst AWS Glacier an, der auf Amazon S3 basiert. "Bei der Nutzung einer solchen Tape-Virtualisierung mit dem AWS Storage Gateway präsentiert der Gateway-Client lokal im RZ des Kunden über eine iSCSI-Schnittstelle ein virtuelles Gerät, das zu einem Bandlaufwerk oder einem Bandlaufwerk-Roboter kompatibel ist und von gängiger Software wie ein echtes Bandlaufwerk genutzt werden kann", sagt Constantin Gonzalez, Principal Solutions Architect bei AWS in Deutschland.

Solche virtuellen Tapes haben natürlich den Vorteil, dass initiale Kosten für Hardware wegfallen. Allerdings fallen monatliche Kosten pro GByte an, die am Beispiel des GFZ mit seinen 3 Petabyte und dem GByte-Preis von 0,012 US-Dollar immerhin 36.000 US-Dollar betragen würden. Zudem wird ein Preis berechnet, um Daten abzurufen. Die Wartezeit auf diese beträgt etwa fünf Stunden.

Für einige Anwendungen würde sich diese Alternative sicherlich lohnen. Es wird aber deutlich, dass selbst zentralisierter Cloud-Speicher momentan teils noch nicht mit den Preisen des mehr als 60 Jahre alten Tape-Storage mithalten kann. So werden im GFZ und anderen Einrichtungen Tape Libraries weiter ihren Platz finden - im klimatisierten Keller.  (on)


Verwandte Artikel:
LTO-8 mit 30 TByte: IBM kündigt TS2280-Laufwerk für neue LTO-Bandgeneration an   
(16.10.2017, https://glm.io/130631 )
LTO Ultrium Generation 7: 15 TByte auf einem Datenträger, aber nur komprimiert   
(08.10.2015, https://glm.io/116758 )
IBM TS1150: Neue Jaguar-Bandlaufwerke mit 10 TByte pro Band   
(07.10.2014, https://glm.io/109678 )
148 GBit pro Quadratzoll: Sony auf dem Weg zum 185-TByte-Magnetband   
(02.05.2014, https://glm.io/106208 )
201 GBit pro Quadratzoll: IBM quetscht 330 Terabyte auf ein Tape   
(03.08.2017, https://glm.io/129286 )

© 1997–2019 Golem.de, https://www.golem.de/