Abo
  • Services:

Cloud-Storage: Tippfehler für AWS-S3-Ausfall verantwortlich

Menschliches Versagen hat zum Ausfall zahlreicher Internetdienste geführt: Ein falsch eingegebenes Kommando legte die Metadatenverwaltung des AWS-S3-Speichers lahm.

Artikel veröffentlicht am ,
Amazon hat den Grund für den AWS-Ausfall bekanntgegeben.
Amazon hat den Grund für den AWS-Ausfall bekanntgegeben. (Bild: Amazon)

Amazon hat nach dem Ausfall seiner S3-Cloud-Storage-Dienste in einem Rechenzentrum im US-Bundesstaat Virginia erstmals Angaben zur Ausfallursache gemacht. Einer der Administratoren nahm versehentlich zu viele Server vom Netz, was dann eine Art Kettenreaktion auslöste.

Stellenmarkt
  1. Bosch Gruppe, Berlin
  2. OKI EUROPE LIMITED, Branch Office Düsseldorf, Düsseldorf

Verantwortlich dafür war ein Tippfehler oder, wie Amazon schreibt, "eines der Kommandos wurde falsch eingegeben und ein größeres Set von Servern als beabsichtigt wurde aus dem S3-Subsystem herausgelöst." Eigentlich sollte nur ein zu Abrechnungszwecken genutztes Subsystem heruntergefahren werden, der Fehler sorgte aber dafür, dass zwei weitere Subsysteme offline genommen wurden.

Eines dieser Systeme wurde als Index eingesetzt, war also für die Verwaltung der Metadaten und Ablageinformationen im S3-Storage-System verantwortlich. Dieses System ist nach Angaben von Amazon notwendig, um alle GET-, LIST-, PUT- und DELETE-Befehle auszuführen. Das zweite betroffene System wurde als eine Art Load-Balancer für das verteilte Ablegen von Daten eingesetzt.

Neustart braucht Zeit

Nach dem erfolgreichen Neustart der Systeme brauchten andere AWS-Dienste, die auf S3 aufbauen, noch etwas Zeit, um wieder normal zu laufen. Zu diesen Diensten gehörten Amazon Elastic Computer Cloud (EC2), das Starten neuer Instanzen, Amazon Elastic Block Store (EBS) und AWS Lambda.

Man sei zwar darauf eingerichtet, auch größere Teile des S3-Subsystems kurzfristig ohne Störung abzuschalten. Einen kompletten Neustart des Index-Subsystems habe man aber seit Jahren nicht mehr vorgenommen. Ein überarbeitetes Administratorenwerkzeug soll künftig dafür sorgen, dass nicht mehr so viel Kapazität auf einen Schlag entfernt werden kann.

The Register zitiert die Analysefirma Cyence mit der Einschätzung, dass der Ausfall bei S&P 500 Firmen aus den USA einen Schaden von rund 150 Millionen US-Dollar verursacht habe, im Finanzbereich soll der Schaden etwa 160 Millionen US-Dollar betragen.



Anzeige
Blu-ray-Angebote
  1. (u. a. 3 Blu-rays für 15€, 2 Neuheiten für 15€)
  2. 5€ inkl. FSK-18-Versand
  3. (u. a. ES Blu-ray 10,83€, Die nackte Kanone Blu-ray-Box-Set 14,99€)

Sascha Klandestin 06. Mär 2017

% find . -name "_build" -exec "rm -rf" find: missing argument to `-exec' % find . -name...

ShinGouki 04. Mär 2017

Es ist schon erstaunlich da wächst vor unseren Augen das Web 3.0 und kaum jemand bemerkt...

plutoniumsulfat 04. Mär 2017

BWL ist trotzdem teilweise echt bescheuert :D

DerDy 03. Mär 2017

DAs bestreitet ja auch keiner. Aber die Wolke beherbergt das halbe Internet und die...

DerDy 03. Mär 2017

Dann schreib doch eine E-Mail an den Support und schildere dein Problem auf einem...


Folgen Sie uns
       


Dell Latitude 7400 - Hands on (CES 2019)

Das neue Latitude 7400 ist ein 2-in-1-Gerät für Geschäftskunden. Im ersten kurzen Test von Golem.de macht das Gerät einen guten Eindruck, der Preis ist mit mindestens 1.600 US-Dollar aber recht hoch.

Dell Latitude 7400 - Hands on (CES 2019) Video aufrufen
Padrone angesehen: Eine Mausalternative, die funktioniert
Padrone angesehen
Eine Mausalternative, die funktioniert

CES 2019 Ein Ring soll die Computermaus ersetzen: Am Zeigefinger getragen macht Padrone jede Oberfläche zum Touchpad. Der Prototyp fühlt sich bei der Bedienung überraschend gut an.
Von Tobias Költzsch

  1. Videostreaming Plex will Filme und Serien kostenlos und im Abo anbieten
  2. People Mover Rollende Kisten ohne Fahrer
  3. Nubia X im Hands on Lieber zwei Bildschirme als eine Notch

Schwer ausnutzbar: Die ungefixten Sicherheitslücken
Schwer ausnutzbar
Die ungefixten Sicherheitslücken

Sicherheitslücken wie Spectre, Rowhammer und Heist lassen sich kaum vollständig beheben, ohne gravierende Performance-Einbußen zu akzeptieren. Daher bleiben sie ungefixt. Trotzdem werden sie bisher kaum ausgenutzt.
Von Hanno Böck

  1. Sicherheitslücken Bauarbeitern die Maschinen weghacken
  2. Kilswitch und Apass US-Soldaten nutzten Apps mit fatalen Sicherheitslücken
  3. Sicherheitslücke Kundendaten von IPC-Computer kopiert

Datenleak: Die Fehler, die 0rbit überführten
Datenleak
Die Fehler, die 0rbit überführten

Er ließ sich bei einem Hack erwischen, vermischte seine Pseudonyme und redete zu viel - Johannes S. hinterließ viele Spuren. Trotzdem brauchte die Polizei offenbar einen Hinweisgeber, um ihn als mutmaßlichen Täter im Politiker-Hack zu überführen.

  1. Datenleak Bundestagsabgeordnete sind Zwei-Faktor-Muffel
  2. Datenleak Telekom und Politiker wollen härtere Strafen für Hacker
  3. Datenleak BSI soll Frühwarnsystem für Hackerangriffe aufbauen

    •  /