Centurylink Level 3: BGP-Fehler führt zu weltweiten Internetausfällen
Wenn einer der größten Transit-Provider Probleme hat, hat das Auswirkungen auf viele Dienste - das Internet aber eine schnelle Lösung.

Am gestrigen Sonntagvormittag (MESZ), dem 30. August 2020, hatte der bekannte Tier-1-Provider und weltweite Glasfaser-Netzbetreiber Level 3 beziehungsweise dessen Eigner Centurylink mit massiven Netzwerkproblemen zu kämpfen. Aufgefallen ist das vor allem Unternehmen mit direktem Peering zu Level 3 beziehungsweise denen, die auf deren Dienste setzen wie zum Beispiel Cloudflare. Bei Letzterem hatte die Störung auch Auswirkungen auf dessen Kunden.
Von Centurylink selbst gibt es bisher nur eine sehr kurze öffentliche Information dazu, dass der Ausfall stattgefunden habe und inzwischen wieder behoben worden sei. Weitere Details liefert der Anbieter selbst zurzeit noch nicht. Dafür hat aber Cloudflare aufgeschlüsselt, was aus dessen Perspektive passiert ist und stellt Vermutungen zum Auslöser des Fehlers an.
Im Cloudflare-Blog heißt es, dass das Unternehmen zunächst viele Ausfälle beim Netzwerkverkehr über Level 3 bemerkt hat. In der Analyse heißt es zudem, dass Cloudflare ungewöhnlich viele BGP-Updates bemerkt hat, die wohl im direkten Zusammenhang mit dem Ausfall stehen. BGP wird von den Netzbetreibern genutzt, um Routen festzulegen und so miteinander zu kommunizieren. Untersuchungen von Nutzern auf Twitter zeigen zudem, dass Pakete das Netz von Level 3 nicht mehr verlassen konnten, die Nutzung als Transit-Provider war damit für die Kunden und Peering-Netze nicht mehr möglich.
BGP-Fehler mit großen Auswirkungen
In einem Status-Update von Centurylink, aus dem Cloudflare zitiert, heißt es, der Ursprung des Problems sei eine fehlerhafte Flowspec-Regel gewesen. Mit Hilfe der BGP-Erweiterung Flowspec können Firewall-Regeln und Ähnliches schnell über Netzwerke und sogar deren Grenzen hinweg verteilt werden. Möglicherweise hat eben diese Flowspec-Regel dann BGP selbst geblockt, was einen Netzwerkverkehr mit Level 3 im Prinzip unmöglich gemacht haben könnte.
Laut Cloudflare bestand das Problem bei Level 3 rund 5 Stunden lang. Der Anbieter hat für sich und seine Kunden direkt zu Beginn den Netzwerkverkehr zu Level 3 so gut wie komplett eingestellt und den Verkehr über andere Netze geleitet. Ähnliches gilt wohl für viele weitere Betreiber, die ihr Peering mit Level 3 eingestellt oder zumindest deutlich reduziert haben.
Cloudflare habe eine Reduzierung des gesamten Verkehrs um rund 3,5 Prozent festgestellt. Dies führt der Anbieter auf die ISP-Dienste von Centurylink in den USA zurück, die komplett ausgefallen seien. Der Netzwerkverkehr begann sich demnach zudem erst nach rund fünf Stunden wieder zu normalisieren.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
- ohne Werbung
- mit ausgeschaltetem Javascript
- mit RSS-Volltext-Feed
... fällt einer der grössten Backbones halt mal für 4 Stunden aus. Aus der offiziellen...
Dieser Server ist schon einige Tage überfordert, bzw. die hinter der Ip zugeordnete...