Zum Hauptinhalt Zur Navigation Zur Suche

Dispatch: Open-Source-Krisenmanagement à la Netflix

Die Entwickler von Netflix haben ihr Framework Dispatch als Open Source veröffentlicht. Damit will das Team besser auf kritische Situationen vorbereiten, auf die schnell reagiert werden muss.
/ Kristian Kißling (Linux Magazin)
Kommentare News folgen (öffnet im neuen Fenster)
Netflix stellt sein Werkzeug Dispatch als Open Source bereit. (Bild: Reuters/Lucy Nicholson/File Photo)
Netflix stellt sein Werkzeug Dispatch als Open Source bereit. Bild: Reuters/Lucy Nicholson/File Photo

Auf Vorfälle im Netzwerk zu reagieren, seien sie durch Sicherheitslecks oder Bugs entstanden, ist vor allem für Admins aufreibend. Dabei ließen sich viele kleine Gegenmaßnahmen bereits zuvor erledigen. Doch weil solche Arbeiten im täglichen Stress häufig ausbleiben, soll das als Open Source verfügbare Dispatch von Netflix helfen. Laut der Ankündigung(öffnet im neuen Fenster) nimmt es nicht nur ein paar dieser Arbeiten schon im Vorfeld für Admins ab, sondern bietet auch Prozesse an, um bei Problemen auf frühere Erfahrungen zurückzugreifen.

Dispatch bespielt dabei vier zentrale Problembereiche. Der erste ist das Ressourcen-Management. Dazu zählen nicht nur die über einen Vorfall gesammelten Daten, sondern auch die Metadaten zu den Antworten darauf. Der zweite Punkt ist das individuelle Engagement: Hier geht es darum, vor dem Hintergrund eines Vorfalls die Mitarbeiter und Teams optimal einzusetzen.

Für den dritten Bereich, das Life Cycle Management, versorgt Dispatch die Incident Commander (IC, die Personen, die das Problem lösen sollen) mit Werkzeugen, die dabei helfen, den Status des Vorfalls im Auge zu behalten. Schließlich spielt viertens auch das Incident Learning eine Rolle: Es soll dafür sorgen, die Abläufe bei einer Wiederholung zu optimieren.

Fest integriert

Dispatch integriert sich dabei eng in die im Unternehmen genutzten Tools, zu denen Slack, die G-Suite, Jira und weitere gehören. Den Zugriff auf AWS-APIs benötigt Dispatch hingegen nicht. Gibt es Meldungen zu Vorfällen von Benutzern oder über das automatische Detection-System, kommen diese in die Datenbank von Dispatch, das nun einen sogenannten Incident Workflow erzeugt.

Den bildet es dann wahlweise in Pageduty, G-Suite, Slack oder Jira ab. Slack ist dabei für die Metadaten zuständig, in Google Docs und Drive werden die eigentlichen Daten gespeichert. Ein eigenes Dispatch-UI hilft den Admins, den Überblick über die Vorfälle zu behalten. Hier finden sie für die Zukunft auch hilfreiches Wissen aus vergangenen Problemfällen.

Überblick behalten

Die Kommunikation über Vorfälle lässt sich dank Dispatch also an zentraler Stelle sammeln und über APIs für externe Tools verfügbar machen. Der Code dürfte aber vor allem für größere Firmen von Interesse sein. Zu finden ist er auf Github(öffnet im neuen Fenster). Der zugehörige Blogpost liefert noch weitere Informationen rund um typische Merkmale von Incident Management.


Relevante Themen