• IT-Karriere:
  • Services:

Stresstest: Netflix' Chaos Monkey zerstört effektiver Infrastruktur

Die neue Version von Chaos Monkey, einem Stresstest-Werkzeug von Netflix, verzichtet zu Gunsten anderer Techniken auf viele Funktionen und kann "nur" noch ganze Instanzen offline nehmen. Das geht aber mit besserer Übersicht und auf dem ganzen Cloud-Stack.

Artikel veröffentlicht am ,
Choas ist für Netflix ein gutes Mittel zum Zweck.
Choas ist für Netflix ein gutes Mittel zum Zweck. (Bild: Netflix)

Seit mehreren Jahren gestaltet Netflix seine Werkzeuge und eingesetzte Technik derart, dass diese auch mit größeren Ausfällen problemlos zurechtkommen können. Immerhin sind auch große Cloud-Anbieter wie Amazon, deren Dienste Netflix nutzt, teilweise von stundenlangen Ausfällen geplagt. Netflix nutzt zum Testen der Ausfälle das Werkzeug Chaos Monkey, dessen aktuelle Version 2.0 einige Funktionen nicht mehr enthält und damit den Fokus ganz klar auf forcierte Ausfälle von Teilen der Infrastruktur legt.

Stellenmarkt
  1. Universitätsklinikum Frankfurt, Frankfurt am Main
  2. IT-Systemhaus der Bundesagentur für Arbeit, Fürth

Bisher konnte Chaos Monkey genutzt werden, um automatisiert Logins per SSH in Maschinen durchzuführen und deren CPU-Last auf das Maximum zu erhöhen oder auch Festplattenausfälle zu simulieren. Für die damit einhergehende nötige Präzision hat das Team bei Netflix allerdings mit dem Failure Injection Testing (FIT) ein eigenes Framework entwickelt. Chaos Monkey wird dementsprechend nur noch für die ganz harte Methode genutzt: das abrupte Ausschalten ganzer Instanzen.

Ausfälle besser strukturierbar

Für Version 2.0 hat das Team Chaos Monkey vollständig in die eigene Continuous-Delivery-Plattform Spinnaker integriert. Dank der Backend-Anbindung von Spinnaker kann Chaos Monkey dazu genutzt werden, ganze virtuelle Maschinen offline zu nehmen oder auch nur einzelne Docker-Container und zwar unabhängig von der eingesetzten Cloud-Software. Unterstützt wird dies für die Amazon Web Services, die Google Cloud Platform, Microsofts Azure, Kubernetes, oder Cloud Foundry.

Die Entwickler haben zudem an der Steuerungsoberfläche von Chaos Monkey gearbeitet. So sei es im Vergleich zur alten Version einfacher, Zeitpläne für die forcierten Ausfälle zu erstellen. Ebenso könne Chaos Monkey besser auf die unterschiedlichen Konfigurationen und eingebauten Redundanzen einzelner Anwendungen abgestimmt werden, da Ausfälle besser gruppiert und zugeordnet werden können. Eine grafische Auswertung der Aktionen von Chaos Monkey ist außerdem möglich.

Wie viele andere Werkzeuge von Netflix auch steht Chaos Monkey als Open-Source-Software auf Github bereit.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Anzeige
Hardware-Angebote
  1. (reduzierte Überstände, Restposten & Co.)

PiranhA 21. Okt 2016

Ich zitiere mal deine Quelle: Darum ging es dem OP. Das CDN, welches für das Streaming...


Folgen Sie uns
       


    •  /