Cloud-Storage: Tippfehler für AWS-S3-Ausfall verantwortlich

Menschliches Versagen hat zum Ausfall zahlreicher Internetdienste geführt: Ein falsch eingegebenes Kommando legte die Metadatenverwaltung des AWS-S3-Speichers lahm.

Artikel veröffentlicht am ,
Amazon hat den Grund für den AWS-Ausfall bekanntgegeben.
Amazon hat den Grund für den AWS-Ausfall bekanntgegeben. (Bild: Amazon)

Amazon hat nach dem Ausfall seiner S3-Cloud-Storage-Dienste in einem Rechenzentrum im US-Bundesstaat Virginia erstmals Angaben zur Ausfallursache gemacht. Einer der Administratoren nahm versehentlich zu viele Server vom Netz, was dann eine Art Kettenreaktion auslöste.

Stellenmarkt
  1. Technische/r Mitarbeiter/in (d/m/w) im Bereich Informatik
    THD - Technische Hochschule Deggendorf, Freyung
  2. BI Data Engineer (m/w/d)
    Vodafone GmbH, Düsseldorf
Detailsuche

Verantwortlich dafür war ein Tippfehler oder, wie Amazon schreibt, "eines der Kommandos wurde falsch eingegeben und ein größeres Set von Servern als beabsichtigt wurde aus dem S3-Subsystem herausgelöst." Eigentlich sollte nur ein zu Abrechnungszwecken genutztes Subsystem heruntergefahren werden, der Fehler sorgte aber dafür, dass zwei weitere Subsysteme offline genommen wurden.

Eines dieser Systeme wurde als Index eingesetzt, war also für die Verwaltung der Metadaten und Ablageinformationen im S3-Storage-System verantwortlich. Dieses System ist nach Angaben von Amazon notwendig, um alle GET-, LIST-, PUT- und DELETE-Befehle auszuführen. Das zweite betroffene System wurde als eine Art Load-Balancer für das verteilte Ablegen von Daten eingesetzt.

Neustart braucht Zeit

Nach dem erfolgreichen Neustart der Systeme brauchten andere AWS-Dienste, die auf S3 aufbauen, noch etwas Zeit, um wieder normal zu laufen. Zu diesen Diensten gehörten Amazon Elastic Computer Cloud (EC2), das Starten neuer Instanzen, Amazon Elastic Block Store (EBS) und AWS Lambda.

Golem Akademie
  1. Jira für Systemadministratoren: virtueller Zwei-Tage-Workshop
    9.–10. Dezember 2021, virtuell
  2. Terraform mit AWS: virtueller Zwei-Tage-Workshop
    14.–15. Dezember 2021, Virtuell
Weitere IT-Trainings

Man sei zwar darauf eingerichtet, auch größere Teile des S3-Subsystems kurzfristig ohne Störung abzuschalten. Einen kompletten Neustart des Index-Subsystems habe man aber seit Jahren nicht mehr vorgenommen. Ein überarbeitetes Administratorenwerkzeug soll künftig dafür sorgen, dass nicht mehr so viel Kapazität auf einen Schlag entfernt werden kann.

The Register zitiert die Analysefirma Cyence mit der Einschätzung, dass der Ausfall bei S&P 500 Firmen aus den USA einen Schaden von rund 150 Millionen US-Dollar verursacht habe, im Finanzbereich soll der Schaden etwa 160 Millionen US-Dollar betragen.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Sascha Klandestin 06. Mär 2017

% find . -name "_build" -exec "rm -rf" find: missing argument to `-exec' % find . -name...

ShinGouki 04. Mär 2017

Es ist schon erstaunlich da wächst vor unseren Augen das Web 3.0 und kaum jemand bemerkt...

plutoniumsulfat 04. Mär 2017

BWL ist trotzdem teilweise echt bescheuert :D

DerDy 03. Mär 2017

DAs bestreitet ja auch keiner. Aber die Wolke beherbergt das halbe Internet und die...

DerDy 03. Mär 2017

Dann schreib doch eine E-Mail an den Support und schildere dein Problem auf einem...



Aktuell auf der Startseite von Golem.de
Kursabsturz
Teamviewer-Chef spricht über schwere hausgemachte Fehler

Die vielen neuen Mitarbeiter seien nicht richtig eingearbeitet worden. Und die Ziele von Teamviewer seien zu hochgesteckt gewesen, sagt Oliver Steil.

Kursabsturz: Teamviewer-Chef spricht über schwere hausgemachte Fehler
Artikel
  1. Seti: Doch kein Signal von Proxima Centauri
    Seti
    Doch kein Signal von Proxima Centauri

    2019 wurde ein vermeintlich außerirdisches Signal entdeckt, das vom Stern Proxima Centauri zu kommen schien. Doch es stammte von der Erde.

  2. Amazon-Go-Konkurrenz: Rewe eröffnet ersten kassenlosen Supermarkt
    Amazon-Go-Konkurrenz
    Rewe eröffnet ersten kassenlosen Supermarkt

    Kameras und Sensoren überwachen Kunden in Rewes kassenlosem Supermarkt. Bezahlt wird mit dem Smartphone.

  3. Smartphone-Tarife: Tchibo bietet Jahres-Tarif mit 72 GByte
    Smartphone-Tarife
    Tchibo bietet Jahres-Tarif mit 72 GByte

    In diesem Jahr stehen drei unterschiedliche Jahres-Tarife für Tchibo-Kunden zur Wahl.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Speicherprodukte von Sandisk & WD zu Bestpreisen (u. a. Sandisk SSD Plus 2TB 140,99€) • Sapphire Pulse RX 6600 497,88€ • Epos H3 Hybrid Gaming-Headset 144€ • Apple MacBook Pro 2021 erhältlich ab 2.249€ • EA-Spiele für alle Plattformen günstiger • Samsung 55" QLED 699€ [Werbung]
    •  /