• IT-Karriere:
  • Services:

Cloud-Computing

Amazons Speichersystem ging der Platz aus

Der Ausfall von Amazons Cloud-Servern vor rund einer Woche ist durch einen Stromausfall ausgelöst worden, durch den Amazon der Speicherplatz ausging. Dadurch konnten einige Systeme nicht wie geplant wieder hochgefahren werden.

Artikel veröffentlicht am ,
Stromausfall verursacht große Probleme.
Stromausfall verursacht große Probleme. (Bild: Amazon)

Amazon hat eine Analyse der Ursachen des Ausfalls von Teilen seines europäischen Cloud-Computing-Dienstes AWS veröffentlicht und Maßnahmen vorgestellt, mit denen ähnliche Probleme in Zukunft verhindert werden sollen. Zahlreiche EC2-, EBS- und RDS-Instanzen waren wegen Amazons Problemen zum Teil tagelang nicht verfügbar.

Inhalt:
  1. Cloud-Computing: Amazons Speichersystem ging der Platz aus
  2. Probleme wirken sich auf andere Zonen aus
  3. Auch Datenbanken fielen aus

Wie schon in der Vergangenheit führte eine Verkettung von Problemen zu den Ausfällen. Ausgangspunkt war der Ausfall eines Transformators mit 110 kV und 10 Megawatt am 7. August 2011 um 10:41 Uhr (Pacific Time), über den die Stromversorgung des Rechenzentrums lief. Dadurch kam es zu einen Stromausfall, der alle an diesen Transformator angeschlossenen Kunden betraf, darunter auch ein großer Teil der Systeme der danach ausgefallenen AWS-Verfügbarkeitszone. Zunächst war ein Blitzeinschlag als Ursache ausgemacht worden, mittlerweile hat der Stromanbieter dies dementiert und sucht weiter nach der Ursache.

Ein Stromausfall sollte kein Problem sein

Nun sollte solch ein Stromausfall eigentlich kein größeres Problem sein, denn genau für diesen Fall sollten Rechenzentren vorsorgen, mit Strom von mehr als einem Anbieter auf unterschiedlichen Anschlussleitungen und einer Notstromversorgung über Akkus und Notstromaggregate. So auch in diesem Rechenzentrum. Bevor aber ein Notstromaggregat die Stromversorgung übernehmen kann, muss seine Phase mit den übrigen Systemen synchronisiert werden. Einer der dafür verantwortlichen Programmable Logic Controller (PLCs) funktionierte nicht korrekt, so dass ein Teil der Notstromaggregate nicht ans Netz ging. Dadurch stand letztendlich nicht genügend Strom für alle Systeme in der Verfügbarkeitszone zur Verfügung.

Laut Amazon fielen deshalb 58 Prozent der EC2-Instanzen und 58 Prozent der EBS-Volumen (Elastic Block Storage) in der Verfügbarkeitszone aus. Auch das EC2-Netzwerk, über das die Systeme ans Internet angebunden sind, war ohne Strom. Die Folge waren Verbindungsprobleme, die zu API-Fehlern führten, wenn Nutzer versuchten, Systeme in der Zone zu starten und zu erstellen.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
Probleme wirken sich auf andere Zonen aus 
  1. 1
  2. 2
  3. 3
  4.  


Anzeige
Spiele-Angebote
  1. 3,50€
  2. 26,99€
  3. (u. a. Yu-Gi-Oh! Legacy of the Duelist für 7,20€, Yu-Gi-Oh! ARC-V: ARC League Championship für...
  4. (u. a. Battlefield 5 für 14,99€, Star Wars Jedi: Fallen Order für 24,99€, Battlefield 1 für...

abfallwoscht 15. Aug 2011

Naja, wären nur ein paar einzelne Server ausgefallen, hätte alles wunderbar funktioniert...

Loolig 15. Aug 2011

Sehr gut.. YMMD 2!

Threat-Anzeiger 15. Aug 2011

Irgendwie scheint es dass wenn immer bei Amazon etwas ausfällt, dass der ganze rest...

misterunknown 15. Aug 2011

... hätte ich in der dritten Klasse, wegen der vielen Wortwiederholungen, nur ne 3...

matthias.reissner 15. Aug 2011

Zitat aus dem Artikel: Auch hier wurde offensichtlich die Software nicht getestet.


Folgen Sie uns
       


Immortals Fenyx Rising - Fazit

Im Video zeigt Golem.de das Actionspiel Immortals Fenyx Rising.

Immortals Fenyx Rising - Fazit Video aufrufen
    •  /