Amazon Web Services: Dreifacher Stromausfall verursachte Auszeit

Ein Stromausfall in einem Rechenzentrum in Ashburn im US-Bundesstaat Virginia war die Ursache für einen mehrstündigen Ausfall in der vergangenen Woche. Das führte dazu, dass Angebote wie Pinterest, Hipchat, Heroku, Quora, Hootsuite und kleinere Websites nicht erreichbar waren.
Amazon Web Services hat den Ausfall vom 14. Juni 2012 auf seinem Service Health Dashboard(öffnet im neuen Fenster) beschrieben. Die Probleme begannen demnach um 20:44 Uhr mit dem "Kabelversagen in einem Hochspannungsenergieverteiler" .
Für alle EC2-Instanzen und EBS-Volumes wurde die Energieversorgung erfolgreich von einem Backupsystem übernommen, heißt es auf dem Dashboard. "Um 20:53 Uhr überhitzte einer der Generatoren und fiel aus, weil der Lüfter defekt war."
Ein zweites Backupsystem wurde sofort automatisch aktiviert. Doch ein Leitungsschutzschalter für diesen Generator war falsch konfiguriert, was die EC2-Instanzen und EBS-Volumes ohne ausreichende Energieversorgung zusammenbrechen ließ.
AWS: Fehler beim testen der Notstromversorgung
Ein Leser von Hacker News(öffnet im neuen Fenster) kommentierte, dass der Einsatz von Generatoren zur Notstromversorgung die richtige Entscheidung von Amazon gewesen sei, wandte aber ein: "Amazon hatte einen richtige Aufbau, aber kein ausreichendes Testsystem."
Laut Web Host Industry Review(öffnet im neuen Fenster) war dies bereits der dritte größere Ausfall bei Amazon Web Services in den vergangenen 14 Monaten für die Region US-East-1. Zuvor hatte es Probleme im April 2011 und im März 2012 gegeben. Rund 70 Prozent der Kunden von Amazon Web Services kommen aus der Region US-East-1.



