Cloud-Computing
Amazons Speichersystem ging der Platz aus
Der Ausfall von Amazons Cloud-Servern vor rund einer Woche ist durch einen Stromausfall ausgelöst worden, durch den Amazon der Speicherplatz ausging. Dadurch konnten einige Systeme nicht wie geplant wieder hochgefahren werden.

Amazon hat eine Analyse der Ursachen des Ausfalls von Teilen seines europäischen Cloud-Computing-Dienstes AWS veröffentlicht und Maßnahmen vorgestellt, mit denen ähnliche Probleme in Zukunft verhindert werden sollen. Zahlreiche EC2-, EBS- und RDS-Instanzen waren wegen Amazons Problemen zum Teil tagelang nicht verfügbar.
- Cloud-Computing: Amazons Speichersystem ging der Platz aus
- Probleme wirken sich auf andere Zonen aus
- Auch Datenbanken fielen aus
Wie schon in der Vergangenheit führte eine Verkettung von Problemen zu den Ausfällen. Ausgangspunkt war der Ausfall eines Transformators mit 110 kV und 10 Megawatt am 7. August 2011 um 10:41 Uhr (Pacific Time), über den die Stromversorgung des Rechenzentrums lief. Dadurch kam es zu einen Stromausfall, der alle an diesen Transformator angeschlossenen Kunden betraf, darunter auch ein großer Teil der Systeme der danach ausgefallenen AWS-Verfügbarkeitszone. Zunächst war ein Blitzeinschlag als Ursache ausgemacht worden, mittlerweile hat der Stromanbieter dies dementiert und sucht weiter nach der Ursache.
Ein Stromausfall sollte kein Problem sein
Nun sollte solch ein Stromausfall eigentlich kein größeres Problem sein, denn genau für diesen Fall sollten Rechenzentren vorsorgen, mit Strom von mehr als einem Anbieter auf unterschiedlichen Anschlussleitungen und einer Notstromversorgung über Akkus und Notstromaggregate. So auch in diesem Rechenzentrum. Bevor aber ein Notstromaggregat die Stromversorgung übernehmen kann, muss seine Phase mit den übrigen Systemen synchronisiert werden. Einer der dafür verantwortlichen Programmable Logic Controller (PLCs) funktionierte nicht korrekt, so dass ein Teil der Notstromaggregate nicht ans Netz ging. Dadurch stand letztendlich nicht genügend Strom für alle Systeme in der Verfügbarkeitszone zur Verfügung.
Laut Amazon fielen deshalb 58 Prozent der EC2-Instanzen und 58 Prozent der EBS-Volumen (Elastic Block Storage) in der Verfügbarkeitszone aus. Auch das EC2-Netzwerk, über das die Systeme ans Internet angebunden sind, war ohne Strom. Die Folge waren Verbindungsprobleme, die zu API-Fehlern führten, wenn Nutzer versuchten, Systeme in der Zone zu starten und zu erstellen.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
- ohne Werbung
- mit ausgeschaltetem Javascript
- mit RSS-Volltext-Feed
Probleme wirken sich auf andere Zonen aus |
Naja, wären nur ein paar einzelne Server ausgefallen, hätte alles wunderbar funktioniert...
Sehr gut.. YMMD 2!
Irgendwie scheint es dass wenn immer bei Amazon etwas ausfällt, dass der ganze rest...
... hätte ich in der dritten Klasse, wegen der vielen Wortwiederholungen, nur ne 3...