Cloud-Computing: Google-Cloudfehler verhindert tagelang Kubernetes-Updates

Es ist einer der Momente, die wohl alle bei der Administrationen von Software irgendwann erleben: Ein Upgrade auf eine neuere Version schlägt fehl, ohne dass sich das Problem mit offensichtlichen Mitteln beheben ließe. Dieses Szenario betrifft nun auch Nutzer und Kunden von Googles Kubernetes Engine (GKE) im Cloud-Computing-Angebot. Ungewöhnlicherweise halten die Upgrade-Probleme der GKE allerdings schon seit mehr als einer Woche an und betreffen wohl die weltweite Angebotsinfrastruktur des Unternehmens.
In dem dazugehörigen Vorfallsbericht(öffnet im neuen Fenster) äußerte sich Google erstmals am 2. Oktober gegen 21 Uhr (MESZ) zu den Problemen. Dort heißt es: "Kunden mit Nodepools der Version 1.24.14-gke.2700 können diese nicht auf die nächste Minor-Version 1.25.12-gke.500 aktualisieren." Als Workaround empfiehlt Google, die betroffenen Nodepools mit der höheren Version neu zu erzeugen, statt ein Upgrade durchzuführen. Je nach Größe der damit aufgebauten Infrastruktur könnte dies aber einen hohen Mehraufwand für Nutzer bedeuten.
Einen Grund für die Probleme bei dem Upgrade kann Google auch mehr als neun Tage nach dem ersten Auftreten des Fehlers nicht nennen und auch eine Lösung ist zumindest derzeit wohl nicht in Sicht. Nach mehreren Zwischenmeldungen, dass das Engineering-Team von Google sich des Problems angenommen habe, heißt es inzwischen von dem Unternehmen: "Zum jetzigen Zeitpunkt können wir noch nicht sagen, wann das Problem vollständig gelöst sein wird. Unsere Ingenieure arbeiten aktiv an diesem Problem."
Inzwischen empfiehlt Google zusätzlich zum neuen Aufsetzen der eigenen Infrastruktur außerdem zu versuchen, das Upgrade mehrfach durchzuführen. Aber auch das Wiederholen des Vorgangs könne im Zweifel nicht immer funktionieren, schreibt der Anbieter. Auch wenn Google beteuert, dass der Fehler nur wenige Kunden betreffe, stehen diese zunächst vor einem schwer lösbaren Probleme und sind abhängig davon, dass der Cloud-Anbieter eine Lösung findet. Bis dahin heißt es weiter abwarten.