Container: Githubs Kubernetes-Cluster überlebt regelmäßige Kernel-Panic

Der fast ein Jahrzehnt alte monolithische Stack von Github ist in nur wenigen Monaten auf die Container-Orchestrierung Kubernetes migriert worden. Interessant daran sind vor allem die dabei aufgefundenen Fehler, deren Lösungen und die beschriebene Vorteile.

Artikel veröffentlicht am ,
Bei Github übernimmt künftig Kubernetes das Steuern der Dienste.
Bei Github übernimmt künftig Kubernetes das Steuern der Dienste. (Bild: Github)

Der Code-Hosting-Dienst Github nutzt zur Verwaltung seiner Webseite sowie der API-Zugriffe seit einigen Wochen einen selbst aufgesetzten Kubernetes-Cluster, der zur Orchestrierung der unterschiedlichen Dienste auf Githubs sogenannter Metal-Cloud dient. Damit habe das Entwickler-Team in nur wenigen Monaten den alten Aufbau völlig abgelöst, der seit acht Jahren im Grunde unverändert gewesen sei.

Wie das Github-Team in seinem Technikerblog schreibt, sind die mit Container-Technologie und der Orchestrierung Kubernetes üblicherweise verbundenen Vorteile so auch bei Github eingetreten. Einzelne Teams können ihre kleinen speziellen Anwendungen nun leichter und viel schneller als bisher auch einfach selbst ausrollen. Das Team für das Site Reliability Engineering (SRE) kann sich damit wieder verstärkt auf seine eigentliche Aufgabe konzentrieren: das Pflegen und Bereitstellen von Infrastruktur.

Darüber hinaus beschreibt das Team aber auch einige eher unerwartete Fehler bei ihrer Migration auf Kubernetes. So hätten etwa Tests ergeben, das der Ausfall eines einzelnen API-Knotens die gesamte verfügbare Arbeitslast im gesamten Cluster deutlich negativ beeinflusse. Da dies aber möglicherweise den gesamten Github-Dienst stören könnte, laufen die Anwendungen nun pro Rechenzentrum in mehreren Cluster. Sollte ein Cluster Probleme bereiten, werden Aufrufe dann automatisch auf andere laufende Cluster verteilt.

Das Team berichtet auch davon, dass sehr hohe Lasten teilweise zu einer Kernel-Panic in den Kubernetes-Nodes führt. Bei solch einem Systemabsturz helfen nur Neustarts des gesamten Systems. Obwohl dieses Problem weiterhin auftritt und die Entwickler noch nach einer Ursache suchen, läuft Kubernetes bereits produktiv im Einsatz. Immerhin sei Kubernetes in der Lage, diese Probleme automatisch zu umgehen, so dass die intern vorgegebenen Fehlerraten weiter eingehalten werden können.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Discounter
Netto bringt Balkonkraftwerk mit 820 Watt Peak

Netto hat ein Balkonkraftwerk mit 820 Watt (Peak) im Angebot, das direkt an eine Steckdose angeschlossen werden kann und die Stromrechnung reduzieren soll.

Discounter: Netto bringt Balkonkraftwerk mit 820 Watt Peak
Artikel
  1. OpenAI: ChatGPT-Firma lässt Programmierer die KI trainieren
    OpenAI
    ChatGPT-Firma lässt Programmierer die KI trainieren

    OpenAI, das Unternehmen hinter ChatGPT, hat Hunderte von Freiberuflern aus Schwellenländern zum Trainieren von Programmierfähigkeiten der KI eingesetzt.

  2. Arbeit im Support: Von der Kunst, Menschen und Technik zu jonglieren
    Arbeit im Support
    Von der Kunst, Menschen und Technik zu jonglieren

    Geht nicht, gibt's oft - und dann klingelt das Telefon beim Support. Das Spektrum der Probleme ist gewaltig und die Ansprüche an einen guten Support auch. Ein Leitfaden für (angehende) Supportmitarbeiter.
    Ein Ratgebertext von Lutz Olav Däumling

  3. Raumfahrtkonzept: Schnellere Weltraumreisen durch Pellet-Strahlenantrieb
    Raumfahrtkonzept
    Schnellere Weltraumreisen durch Pellet-Strahlenantrieb

    Die Nasa fördert innovative Konzepte für die Raumfahrt. Darunter eines, dass Weltraumreisen viel schneller machen soll.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Samsung 980 PRO 1TB Heatsink 111€ • Patriot Viper VPN100 2TB 123,89€ • Corsair Ironclaw RGB Wireless 54€ • Alternate: Weekend Sale • WSV bei MediaMarkt • MindStar: XFX RX 6950 XT 799€, MSI RTX 4090 1.889€ • Epos Sennheiser Game One -55% • RAM-/Graka-Preisrutsch [Werbung]
    •  /