Abo
  • IT-Karriere:

Fehler 502: Cloudflare schämt sich für den vergangenen Ausfall

Cloudflare erzählt in einem ausführlichen Blogpost die Geschichte des vergangenen Ausfalls, der einen Teil der Internetinfrastruktur belastete und sogar das eigene Team bei der Fehlersuche behinderte. Das Unternehmen schämt sich für den Fehler.

Artikel veröffentlicht am ,
Cloudflare erklärt, wie es zum 502-Fehler kam.
Cloudflare erklärt, wie es zum 502-Fehler kam. (Bild: Pixabay.com/Montage: Golem.de/CC0 1.0)

Der Internetdienstleister Cloudflare klärt auf, warum ein Teil des Internets Anfang Juli nicht erreichbar war. Im Blog-Post ist sich Cloudflare zudem des Schadens für seine Kunden bewusst. "Wir schämen uns dafür, dass das passiert ist", schreibt der Anbieter. Viele Nutzer haben ein paar Minuten lang einen 502-Bad-Gateway-Fehler statt einer Webseite erhalten. Der Grund: Ein falsch definierter regulärer Ausdruck hat die CPU-Kerne von Servern für die Bereitstellung von HTTPS und HTTP überlastet. Sie wurde unbeabsichtigt zusammen mit einer neuen Regel für die Web Application Firewall (Waf) des Herstellers eingeführt.

Stellenmarkt
  1. Stadtwerke München GmbH, München
  2. Allianz Partners Deutschland GmbH, Aschheim bei München

"Wir verbessern ständig unsere gesetzten Regeln für unsere Waf, um auf neue Sicherheitslücken und Bedrohungen zu reagieren", sagt Entwickler und CTO John Graham-Cumming. Allerdings sei laut ihm der Ausfall wohl nicht nur einem schlecht implementierten Ausdruck zuzuschreiben, nachdem sich der Fehler auch bei Cloudflare gezeigt hatte, indem etwa 80 Prozent des Traffics zusammenbrach. Die weltweit verteilten Testprogramme, die Cloudflare-Server auf ihre Funktionalität prüfen, gaben viele Fehler aus. Daraufhin sammelte sich das Londoner Entwicklerteam zu einem Meeting. Zuerst wurde angenommen, es handele sich um "einen Angriff, den wir nie zuvor gesehen haben", schreibt Graham-Cumming. Es stellte sich aber heraus, dass es ein interner Fehler war.

Um das System zum Laufen zu bringen, musste das Team die Waf abschalten. Das geschieht über ein von überall ausführbares Kommando, "Global Waf Kill". Allerdings konnte Cloudflare durch den eigenen Ausfall nicht auf die eigenen Produkte zugreifen. Die Entwickler konnten sich nicht auf dem internen Steuerungspanel einloggen. Über einen ungenannten Überbrückungsmechanismus konnte ein Teammitglied die Firewall abschalten. Sie konnte dann offline auf den Fehler überprüft werden.

Die Störung ereignete sich am 2. Juli 2019 und hatte den Ausfall mehrerer Internetseiten zur Folge. Schon damals hat Cloudflare zugegeben: Die eigenen Testmechanismen sind ungenügend. Diesen Fehler will das Unternehmen nicht wiederholen.



Anzeige
Hardware-Angebote
  1. 64,90€ (Bestpreis!)
  2. 229€ (Bestpreis!)
  3. täglich neue Deals bei Alternate.de

Geistesgegenwart 16. Jul 2019

Naja CF hat schon eine höhere Downtime als der Durchschnittserver/RZ. Aber diese...

px 16. Jul 2019

Danke für die Info! :-)

nexo1960 15. Jul 2019

Es ist der zweite größere Ausfall in den letzten zwei Monaten. Allerdings waren sie an...

on(Golem.de) 15. Jul 2019

Hallo mdxdave, "Marty! Wir müssen zurück... in die Zukunft!". :D Danke für den Hinweis...


Folgen Sie uns
       


Golem-Akademie - Trainer Florian stellt sich vor

Vom Junior-Projektleiter zum IT-Director konnte Florian Schader sämtliche Facetten der IT-Welt gestalten und hat eine Leidenschaft entwickelt, diese Erfahrungen weiterzugeben. Seine Grundmotivation ist die aktive Weitergabe seiner 20-jährigen Projekt- und Leitungserfahrung im IT-Umfeld, der Erfolg von Projekten und die aktive Weiterentwicklung von Menschen. Dabei stellt er immer den Bezug zur Praxis her. Als Trainer und Coach ist er spezialisiert auf Projektmanagement und Führungskräfteentwicklung.

Golem-Akademie - Trainer Florian stellt sich vor Video aufrufen
Telekom Smart Speaker im Test: Der smarte Lautsprecher, der mit zwei Zungen spricht
Telekom Smart Speaker im Test
Der smarte Lautsprecher, der mit zwei Zungen spricht

Die Deutsche Telekom bietet derzeit den einzigen smarten Lautsprecher an, mit dem sich parallel zwei digitale Assistenten nutzen lassen. Der Magenta-Assistent lässt einiges zu wünschen übrig, aber die Parallelnutzung von Alexa funktioniert schon fast zu gut.
Ein Test von Ingo Pakalski

  1. Smarte Lautsprecher Amazon liegt nicht nur in Deutschland vor Google
  2. Pure Discovr Schrumpfender Alexa-Lautsprecher mit Akku wird teurer
  3. Bose Portable Home Speaker Lautsprecher mit Akku, Airplay 2, Alexa und Google Assistant

Minecraft Earth angespielt: Die Invasion der Klötzchen
Minecraft Earth angespielt
Die Invasion der Klötzchen

Kämpfe mit Skeletten im Stadtpark, Begegnungen mit Schweinchen im Einkaufszentrum: Golem.de hat Minecraft Earth ausprobiert. Trotz Sammelaspekten hat das AR-Spiel ein ganz anderes Konzept als Pokémon Go - aber spannend ist es ebenfalls.
Von Peter Steinlechner

  1. Microsoft Minecraft hat 112 Millionen Spieler im Monat
  2. Machine Learning Facebooks KI-Assistent hilft beim Bau von Minecraft-Werken
  3. Nvidia Minecraft bekommt Raytracing statt Super-Duper-Grafik

Rohstoffe: Lithium aus dem heißen Untergrund
Rohstoffe
Lithium aus dem heißen Untergrund

Liefern Geothermiekraftwerke in Südwestdeutschland bald nicht nur Strom und Wärme, sondern auch einen wichtigen Rohstoff für die Akkus von Smartphones, Tablets und Elektroautos? Das Thermalwasser hat einen so hohen Gehalt an Lithium, dass sich ein Abbau lohnen könnte. Doch es gibt auch Gegner.
Ein Bericht von Werner Pluta

  1. Wasserkraft Strom aus dem Strom
  2. Energie Wie Mikroben Methan mit Windstrom produzieren
  3. Erneuerbare Energien Die Energiewende braucht Wasserstoff

    •  /