Stresstest: Netflix' Chaos Monkey zerstört effektiver Infrastruktur
Die neue Version von Chaos Monkey, einem Stresstest-Werkzeug von Netflix, verzichtet zu Gunsten anderer Techniken auf viele Funktionen und kann "nur" noch ganze Instanzen offline nehmen. Das geht aber mit besserer Übersicht und auf dem ganzen Cloud-Stack.

Seit mehreren Jahren gestaltet Netflix seine Werkzeuge und eingesetzte Technik derart, dass diese auch mit größeren Ausfällen problemlos zurechtkommen können. Immerhin sind auch große Cloud-Anbieter wie Amazon, deren Dienste Netflix nutzt, teilweise von stundenlangen Ausfällen geplagt. Netflix nutzt zum Testen der Ausfälle das Werkzeug Chaos Monkey, dessen aktuelle Version 2.0 einige Funktionen nicht mehr enthält und damit den Fokus ganz klar auf forcierte Ausfälle von Teilen der Infrastruktur legt.
Bisher konnte Chaos Monkey genutzt werden, um automatisiert Logins per SSH in Maschinen durchzuführen und deren CPU-Last auf das Maximum zu erhöhen oder auch Festplattenausfälle zu simulieren. Für die damit einhergehende nötige Präzision hat das Team bei Netflix allerdings mit dem Failure Injection Testing (FIT) ein eigenes Framework entwickelt. Chaos Monkey wird dementsprechend nur noch für die ganz harte Methode genutzt: das abrupte Ausschalten ganzer Instanzen.
Ausfälle besser strukturierbar
Für Version 2.0 hat das Team Chaos Monkey vollständig in die eigene Continuous-Delivery-Plattform Spinnaker integriert. Dank der Backend-Anbindung von Spinnaker kann Chaos Monkey dazu genutzt werden, ganze virtuelle Maschinen offline zu nehmen oder auch nur einzelne Docker-Container und zwar unabhängig von der eingesetzten Cloud-Software. Unterstützt wird dies für die Amazon Web Services, die Google Cloud Platform, Microsofts Azure, Kubernetes, oder Cloud Foundry.
Die Entwickler haben zudem an der Steuerungsoberfläche von Chaos Monkey gearbeitet. So sei es im Vergleich zur alten Version einfacher, Zeitpläne für die forcierten Ausfälle zu erstellen. Ebenso könne Chaos Monkey besser auf die unterschiedlichen Konfigurationen und eingebauten Redundanzen einzelner Anwendungen abgestimmt werden, da Ausfälle besser gruppiert und zugeordnet werden können. Eine grafische Auswertung der Aktionen von Chaos Monkey ist außerdem möglich.
Wie viele andere Werkzeuge von Netflix auch steht Chaos Monkey als Open-Source-Software auf Github bereit.
Ich zitiere mal deine Quelle: Darum ging es dem OP. Das CDN, welches für das Streaming...