Stresstest: Netflix' Chaos Monkey zerstört effektiver Infrastruktur

Die neue Version von Chaos Monkey, einem Stresstest-Werkzeug von Netflix, verzichtet zu Gunsten anderer Techniken auf viele Funktionen und kann "nur" noch ganze Instanzen offline nehmen. Das geht aber mit besserer Übersicht und auf dem ganzen Cloud-Stack.

Artikel veröffentlicht am ,
Choas ist für Netflix ein gutes Mittel zum Zweck.
Choas ist für Netflix ein gutes Mittel zum Zweck. (Bild: Netflix)

Seit mehreren Jahren gestaltet Netflix seine Werkzeuge und eingesetzte Technik derart, dass diese auch mit größeren Ausfällen problemlos zurechtkommen können. Immerhin sind auch große Cloud-Anbieter wie Amazon, deren Dienste Netflix nutzt, teilweise von stundenlangen Ausfällen geplagt. Netflix nutzt zum Testen der Ausfälle das Werkzeug Chaos Monkey, dessen aktuelle Version 2.0 einige Funktionen nicht mehr enthält und damit den Fokus ganz klar auf forcierte Ausfälle von Teilen der Infrastruktur legt.

Stellenmarkt
  1. Senior Projektleiter ICT (m/w/d)
    operational services GmbH & Co. KG, Frankfurt am Main, Berlin, Dresden
  2. Projektmanager ERP-Software (m/w/d) TimeLine
    TimeLine Consulting Wuppertal GmbH, Wuppertal
Detailsuche

Bisher konnte Chaos Monkey genutzt werden, um automatisiert Logins per SSH in Maschinen durchzuführen und deren CPU-Last auf das Maximum zu erhöhen oder auch Festplattenausfälle zu simulieren. Für die damit einhergehende nötige Präzision hat das Team bei Netflix allerdings mit dem Failure Injection Testing (FIT) ein eigenes Framework entwickelt. Chaos Monkey wird dementsprechend nur noch für die ganz harte Methode genutzt: das abrupte Ausschalten ganzer Instanzen.

Ausfälle besser strukturierbar

Für Version 2.0 hat das Team Chaos Monkey vollständig in die eigene Continuous-Delivery-Plattform Spinnaker integriert. Dank der Backend-Anbindung von Spinnaker kann Chaos Monkey dazu genutzt werden, ganze virtuelle Maschinen offline zu nehmen oder auch nur einzelne Docker-Container und zwar unabhängig von der eingesetzten Cloud-Software. Unterstützt wird dies für die Amazon Web Services, die Google Cloud Platform, Microsofts Azure, Kubernetes, oder Cloud Foundry.

Die Entwickler haben zudem an der Steuerungsoberfläche von Chaos Monkey gearbeitet. So sei es im Vergleich zur alten Version einfacher, Zeitpläne für die forcierten Ausfälle zu erstellen. Ebenso könne Chaos Monkey besser auf die unterschiedlichen Konfigurationen und eingebauten Redundanzen einzelner Anwendungen abgestimmt werden, da Ausfälle besser gruppiert und zugeordnet werden können. Eine grafische Auswertung der Aktionen von Chaos Monkey ist außerdem möglich.

Golem Karrierewelt
  1. Kotlin für Java-Entwickler: virtueller Zwei-Tage-Workshop
    13./14.10.2022, Virtuell
  2. Adobe Photoshop für Social Media Anwendungen: virtueller Zwei-Tage-Workshop
    24./25.08.2022, virtuell
Weitere IT-Trainings

Wie viele andere Werkzeuge von Netflix auch steht Chaos Monkey als Open-Source-Software auf Github bereit.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Sparmaßnahmen
"Komplettes Chaos" nach Entlassungen bei Oracle

Auch Oracle hat einen massiven Stellenabbau begonnen. Das Unternehmen will eine Milliarde US-Dollar an Kosten einsparen.

Sparmaßnahmen: Komplettes Chaos nach Entlassungen bei Oracle
Artikel
  1. Klimawandel: SSDs sind klimaschädlicher als mechanische Festplatten
    Klimawandel
    SSDs sind klimaschädlicher als mechanische Festplatten

    Während ihrer Lebensdauer verursacht eine SSD fast doppelt so hohe CO2-Emissionen wie eine mechanische HDD.

  2. Momentum 4 Wireless: Sennheisers neuer ANC-Kopfhörer hält lange durch
    Momentum 4 Wireless
    Sennheisers neuer ANC-Kopfhörer hält lange durch

    Guter Klang, hohe ANC-Leistung und eine Akkulaufzeit von 60 Stunden verspricht Sennheiser für den neuen ANC-Kopfhörer Momentum 4 Wireless.

  3. Microsoft Loop: Riesenkonzept mit Riesenchance auf Riesenchaos
    Microsoft Loop
    Riesenkonzept mit Riesenchance auf Riesenchaos

    Sehr unauffällig rollt Microsoft seine neue Technik Loop für die Onlinezusammenarbeit aus. Admins sollten sie jetzt schon auf dem Schirm haben, denn sie ist vielversprechend, erfordert aber viel Eindenken. Wir erklären sie im Detail.
    Von Mathias Küfner

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • MindStar (Gainward RTX 3070 559€, ASRock RX 6800 639€) • WD Black 2TB m. Kühlkörper (PS5) 219,90€ • Gigabyte Deals • Alternate (DeepCool Wakü 114,90€) • Apple Week bei Media Markt • be quiet! Deals • SSV bei Saturn (u. a. WD_BLACK SN850 1TB 119€) • Gamesplant Summer Sale [Werbung]
    •  /