DNS, Webseiten, API: Cloudflare-Projekt zur Resilienz verursacht Ausfall

Eine kurzer, aber weltweiter Ausfall der Cloudflare-Dienste hat Hunderte Kunden und Webseiten betroffen. Die Ursache war wohl ein BGP-Fehler.

Artikel veröffentlicht am ,
Ein Fehler bei Cloudflare hatte weltweite Auswirkungen.
Ein Fehler bei Cloudflare hatte weltweite Auswirkungen. (Bild: Cloud)

Der Anbieter von Internetdiensten Cloudflare hat eine Zusammenfassung und Erklärung eines massiven Ausfalls seines Angebots veröffentlicht, das am Morgen des 21. Juni zwischen 6:34 Uhr und 8:06 Uhr UTC (8:34 bis 10:06 Uhr MESZ) zahlreiche Webseiten betraf. Viele Onlineangebote waren deshalb nicht erreichbar. Der Fehler sorgte laut Cloudflare für einen Abfall des Netzwerkverkehrs auf ungefähr 50 Prozent im Vergleich zur normalen Auslastung.

Stellenmarkt
  1. Systembetreuung Studierendensekretariate (w/m/d)
    Universität Potsdam, Potsdam
  2. Ingenieur SPS-Programmierung (m/w/d)
    Dürr Systems AG, Bietigheim-Bissingen
Detailsuche

Ironischerweise wurde der Ausfall durch Änderungen verursach, die laut Cloudflare, "Teil eines langjährigen Projekts zur Erhöhung der Ausfallsicherheit an unseren größten Standorten war". Diese Standorte wickeln demzufolge den größten Teil des internen Netzwerkverkehrs ab. Eine Konfigurationsänderungen am Netzwerk sorgte aber für einen Ausfall an diesen Standorten.

Eigentlich sollte genau das durch eine neue Netzwerkarchitektur verhindert werden, die Cloudflare seit einiger Zeit in seinen großen Standorten umsetzt. Wichtigste Idee dabei ist laut dem Anbieter eine neue interne Routing-Ebene, die es ermöglicht, "Teile des internen Netzwerks in einem Rechenzentrum zu Wartungszwecken oder zur Behebung eines Problems einfach zu deaktivieren und zu aktivieren".

BGP-Änderung mit großen Auswirkungen

Als technische Erklärung für den Ausfall schreibt Cloudflare, dass diese Netzwerke per BGP miteinander verbunden seien. Einzelne BGP-Richtlinien würden zudem sequenziell evaluiert und dann abgearbeitet. "Während wir eine Änderung an unseren Richtlininen zur Präfix-Ankündigung einführten, führte eine Neuordnung der Bedingungen dazu, dass wir eine wichtige Teilmenge von Präfixen zurückziehen mussten." Das wiederum habe einen sich selbst verstärkenden Effekt gehabt, da dies den Technikern von Cloudflare erschwert habe, auf die betroffenen Systeme überhaupt zugreifen zu können.

Golem Karrierewelt
  1. Airtable Grundlagen: virtueller Ein-Tages-Workshop
    31.08.2022, Virtuell
  2. IT-Grundschutz-Praktiker mit Zertifikat: Drei-Tage-Workshop
    21.-23.11.2022, Virtuell
Weitere IT-Trainings

Erschwert worden seien die Arbeiten darüber hinaus durch die Netzwerktechniker selbst, wie Cloudflare schreibt: "Dies verzögerte sich, da die Netzwerkingenieure die Änderungen gegenseitig übergingen und die vorherigen Rücknahme rückgängig machten, was dazu führte, dass das Problem sporadisch erneut auftrat."

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Potrimpo 23. Jun 2022 / Themenstart

Die sollen nicht konferieren oder chatten, sondern arbeiten ;) Das Problem ist halt, das...

Potrimpo 23. Jun 2022 / Themenstart

"Der Fehler sorgte laut Cloudflare für einen Abfall des Netzwerkverkehrs auf ungefähr 50...

Kommentieren



Aktuell auf der Startseite von Golem.de
Mit Aliens reden
Quantenkommunikation soll interstellar möglich sein

Mithilfe von Quanten soll es möglich sein, über interstellare Distanzen Informationen auszutauschen und mit Aliens zu reden.

Mit Aliens reden: Quantenkommunikation soll interstellar möglich sein
Artikel
  1. Lennart Poettering: Systemd-Gründer wechselt offenbar zu Microsoft
    Lennart Poettering
    Systemd-Gründer wechselt offenbar zu Microsoft

    Der einflussreiche Entwickler Lennart Poettering hat offenbar den Linux-Distributor Red Hat verlassen und wechselt zur Konkurrenz.

  2. Mobile Device Management mit Microsoft Intune
     
    Mobile Device Management mit Microsoft Intune

    Neben PCs sind mobile Endgeräte aus vielen Unternehmen nicht mehr wegzudenken. Der Onlinekurs der Golem Karrierewelt zu Microsoft Intune hilft, ihren Einsatz zu optimieren.
    Sponsored Post von Golem Karrierewelt

  3. Provokation: Singleplayer-Tweet führte zu Aufstand bei EA
    Provokation
    Singleplayer-Tweet führte zu Aufstand bei EA

    Ein abfälliger Kommentar über Singleplayer hat Spieler verärgert - und offenbar zu heftigen Diskussionen bei Electronic Arts geführt.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Red Friday: Mega-Rabatt-Aktion bei Media Markt • LG OLED TV 77" 120 Hz günstig wie nie: 2.399€ • Amazon-Geräte günstiger • AMD Ryzen 5 günstig wie nie: 125€ • EVGA RTX 3090 günstig wie nie: 1.649€ • MindStar (MSI 31,5“ 165Hz 369€) • Der beste 2.000€-Gaming-PC [Werbung]
    •  /