Serverausfall: Keine Erklärung für Ausfall von Amazons Cloud-Diensten

Große Teile von Amazons Cloud-Angeboten mit dem Namen "Amazon Web Services" ( AWS(öffnet im neuen Fenster) ) sind über die Osterfeiertage in Nordamerika ausgefallen. Wie sich der Statusseite von AWS(öffnet im neuen Fenster) entnehmen lässt, begannen die Schwierigkeiten am 21. April 2011 und wurden erst am 24. April weitgehend behoben. Betroffen war den Statuseinträgen zufolge ein Rechenzentrum für den Dienst " Elastic Compute Cloud(öffnet im neuen Fenster) " (EC2) im US-Bundesstaat Virginia.
Aus diesen Einträgen geht jedoch nicht hervor, was die Probleme ausgelöst hat. Nur von Verbindungsproblemen zu den Webservern und den Datenbankservern untereinander ist die Rede. Hunderte von Webseiten sollen dadurch offline gewesen sein. Auch prominente EC2-Kunden wie die beliebten Dienste Foursquare oder Reddit konnten ihren Nutzern zunächst keine Erklärung liefern. Ein von einem Anwender festgehaltener Screenshot der Reddit-Startseite(öffnet im neuen Fenster) zeigt die Verzweiflung der Reddit-Administratoren über ihre Kollegen bei Amazon: "Wir warten noch darauf, bis sie bei unseren Volumes angelangt sind. Sorry."
Diese Art des Krisenmanagements kritisiert nun auch das Blog von Networkworld(öffnet im neuen Fenster) . Nicht nur eine Erklärung, sondern auch eine Entschuldigung erwartet Kommentator Paul McNamara. Die sei aber auch fünf Tage nach Beginn der Ausfälle in keinem von Amazons offiziellen Kommunikationskanälen zu finden.
Amazon alleine die Schuld an den Ausfällen von Webseiten zu geben, ist aber zu kurz gedacht, meint das Blog Webmonkey(öffnet im neuen Fenster) . Scott Gilbertson meint dort, die Kunden von AWS hätten auch einen so langen und schweren Ausfall einkalkulieren müssen. Er verlinkt dazu einen Blogeintrag von Netflix(öffnet im neuen Fenster) vom Dezember 2010. Darin beschreibt das Unternehmen, warum es auch nach einigen Ausfällen weiter auf AWS setzt, und wie man sich gegen mögliche Probleme beim Cloud-Dienstleister absichern kann. Als ein Beispiel nennt Netflix seinen "Chaos Monkey", eine Softwarekonstruktion, die ständig Fehler provoziert - die muss das Gesamtsystem aushalten.