• IT-Karriere:
  • Services:

Container: Githubs Kubernetes-Cluster überlebt regelmäßige Kernel-Panic

Der fast ein Jahrzehnt alte monolithische Stack von Github ist in nur wenigen Monaten auf die Container-Orchestrierung Kubernetes migriert worden. Interessant daran sind vor allem die dabei aufgefundenen Fehler, deren Lösungen und die beschriebene Vorteile.

Artikel veröffentlicht am ,
Bei Github übernimmt künftig Kubernetes das Steuern der Dienste.
Bei Github übernimmt künftig Kubernetes das Steuern der Dienste. (Bild: Github)

Der Code-Hosting-Dienst Github nutzt zur Verwaltung seiner Webseite sowie der API-Zugriffe seit einigen Wochen einen selbst aufgesetzten Kubernetes-Cluster, der zur Orchestrierung der unterschiedlichen Dienste auf Githubs sogenannter Metal-Cloud dient. Damit habe das Entwickler-Team in nur wenigen Monaten den alten Aufbau völlig abgelöst, der seit acht Jahren im Grunde unverändert gewesen sei.

Stellenmarkt
  1. Stadt Regensburg, Regensburg
  2. Dr. Fritz Faulhaber GmbH & Co. KG, Schönaich

Wie das Github-Team in seinem Technikerblog schreibt, sind die mit Container-Technologie und der Orchestrierung Kubernetes üblicherweise verbundenen Vorteile so auch bei Github eingetreten. Einzelne Teams können ihre kleinen speziellen Anwendungen nun leichter und viel schneller als bisher auch einfach selbst ausrollen. Das Team für das Site Reliability Engineering (SRE) kann sich damit wieder verstärkt auf seine eigentliche Aufgabe konzentrieren: das Pflegen und Bereitstellen von Infrastruktur.

Darüber hinaus beschreibt das Team aber auch einige eher unerwartete Fehler bei ihrer Migration auf Kubernetes. So hätten etwa Tests ergeben, das der Ausfall eines einzelnen API-Knotens die gesamte verfügbare Arbeitslast im gesamten Cluster deutlich negativ beeinflusse. Da dies aber möglicherweise den gesamten Github-Dienst stören könnte, laufen die Anwendungen nun pro Rechenzentrum in mehreren Cluster. Sollte ein Cluster Probleme bereiten, werden Aufrufe dann automatisch auf andere laufende Cluster verteilt.

Das Team berichtet auch davon, dass sehr hohe Lasten teilweise zu einer Kernel-Panic in den Kubernetes-Nodes führt. Bei solch einem Systemabsturz helfen nur Neustarts des gesamten Systems. Obwohl dieses Problem weiterhin auftritt und die Entwickler noch nach einer Ursache suchen, läuft Kubernetes bereits produktiv im Einsatz. Immerhin sei Kubernetes in der Lage, diese Probleme automatisch zu umgehen, so dass die intern vorgegebenen Fehlerraten weiter eingehalten werden können.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Anzeige
Spiele-Angebote
  1. 77,97€ (Release 19.11.)
  2. 4,25€

Plasma 18. Aug 2017

Meine Güte, wer ist dir denn über die Leber gelaufen? Betreffs Zertifikate schrieb ich...


Folgen Sie uns
       


    •  /