Caching: App verursacht Millionen Abrufe eines Wikipedia-Bildes

Wenn 20 Prozent des Netzwerkverkehrs aus dem Herunterladen des immer gleichen Wikipedia-Bildes bestehen, läuft etwas nicht so, wie es soll.

Artikel veröffentlicht am ,
Wir haben das Bild der Aster nur einmal heruntergeladen.
Wir haben das Bild der Aster nur einmal heruntergeladen. (Bild: TeunSpaans, Wikimedia Commons/CC-BY-SA 3.0)

Das Infrastruktur-Team der Wikimedia hat in den vergangenen Tagen ein extrem ungewöhnliches Muster in seinem Netzwerkverkehr analysieren müssen, das einen viel zu hohen Anteil am gesamten Netzwerkverkehr verursacht hat. Dem Eintrag im Bugtracker des Projekts zufolge handelt es sich dabei um einen Download des immer gleichen Bildes der Neubelgischen Aster, einer Blume, und zwar bis zu 90 Millionen Mal am Tag.

Stellenmarkt
  1. (Senior) IT-Product Manager / Product Owner (m/w/d)
    NOVENTI Health SE, München
  2. Digital Operation Specialist (m/w/d)
    Bundeskriminalamt, Wiesbaden, Berlin, Meckenheim
Detailsuche

Diese überraschend hohe Anzahl umfasse dabei sogar rund 20 Prozent sämtlicher Anfragen für Medienhalten an dem Eqsin-Cluster, der als Wikimedia-Rechenzentrums-Standort in Asien fungiert. Die Downloads kommen darüber hinaus alle von verschiedenen Internetanbietern in Indien und weisen neben dem eigentlichen Download als Charakteristik nur auf, dass als User-Agent und Referer jeweils nur ein Trennstrich (-) versendet wird.

Diese Zugriffe "sind sehr seltsam, da sie von sehr unterschiedlichen IPs stammen und einem täglichen Verkehrsmuster folgen. Wir gehen daher davon aus, dass es eine mobile App gibt, die vorwiegend in Indien genutzt wird, die das Bild zum Beispiel für einen Begrüßungsbildschirm nutzt". Begonnen haben die massiven Zugriffe unvermittelt im Sommer vergangenen Jahres und halten bisher konstant an.

In den Einträgen im Bugtracker wird darauf verwiesen, dass sich Code zum Herunterladen dieses speziellen Bilds als Beispiel auf vielen verschiedenen Programmier-Seiten wie Stackoverflow findet oder auch in öffentlichen Projekten des Code-Hoster Github. Darüber hinaus ist es auch in der Vergangenheit immer wieder mal vorgekommen, dass Code in Software und Apps etwas durch Pings oder das Herunterladen fest im Code hinterlegter Dateien überprüft, ob eine Internetverbindung besteht.

Golem Akademie
  1. PowerShell Praxisworkshop: virtueller Vier-Tage-Workshop
    20.–23. Dezember 2021, virtuell
  2. Jira für Anwender: virtueller Ein-Tages-Workshop
    10. November 2021, virtuell
Weitere IT-Trainings

Es ist zumindest naheliegend, dass in dem geschilderten Fall der Wikimedia etwas ähnliches bei der externen App-Entwicklung geschehen ist und das Bild eben versehentlich millionenfach immer wieder heruntergeladen wurde. Wie das Team inzwischen mitteilt, handelt es sich beim Verursacher der vielen Aufrufe tatsächlich um eine App aus Indien und das Wikimedia-Team will nun entsprechende Schritte ergreifen, um die Downloads abzustellen.

Nachtrag vom 10. Februar 2021, 11:41 Uhr

Die Beteiligten haben inzwischen Kontakt zu dem Entwicklungsteam der App aufgenommen und den von der App ausgehenden Traffic schlicht blockiert. Das Team hat außerdem eine kurze Anleitung dazu veröffentlicht, wie es die Verursacher-App ausfindig machen konnte.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


StaTiC2206 11. Feb 2021

ist doch schön, wenn man etwas Polster aufbauen kann.

MrAndersenson 11. Feb 2021

Wikipedia sammel ja Spenden für zentrale Infrastruktur - entspricht ja nicht gerad den...

quineloe 10. Feb 2021

Ich denke mal, 20% des Traffics von Wikipedia kostet auch ne Stange Geld.

keks.de 10. Feb 2021

Dann fiele ja der Traffic bei der Wikipedia an. Dann eher die Verbindung verlangsamen...

Nasenbaer 10. Feb 2021

Ich kann nicht für "normale" Rechenzentren sprechen aber jeder Hyperscaler rechnet den...



Aktuell auf der Startseite von Golem.de
Rakuten
"Wir bauen 4. deutsches Netz mit x86-Standard-Hardware"

Billige Hardware soll 1&1 United Internet Kosten sparen. Doch in Japan explodieren bei Rakuten die Ausgaben.

Rakuten: Wir bauen 4. deutsches Netz mit x86-Standard-Hardware
Artikel
  1. Alder Lake: Intel will mit 241 Watt an die Spitze
    Alder Lake
    Intel will mit 241 Watt an die Spitze

    Kurz vor dem Launch zeigt Intel eigene Benchmarks zu Alder Lake, außerdem gibt es Details zur Kühlung und zum Denuvo-DRM.
    Ein Bericht von Marc Sauter

  2. Mäuse, Tastaturen, Headsets: Logitech hat mit Lieferengpässen zu kämpfen
    Mäuse, Tastaturen, Headsets
    Logitech hat mit Lieferengpässen zu kämpfen

    Die große Nachfrage während der Coronapandemie hat Logitech 82 Prozent mehr Umsatz beschert. Allerdings kommt die Lieferung nicht hinterher.

  3. Impfnachweise: Covid-Zertifikat für Adolf Hitler aufgetaucht
    Impfnachweise
    Covid-Zertifikat für Adolf Hitler aufgetaucht

    Im Internet sind gefälschte, aber korrekt signierte QR-Codes mit Covid-Impfnachweisen aufgetaucht.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Samsung 4K-Monitore & TVs günstiger (u. a. 50" QLED 2021 749€) • Seagate Exos 18TB 319€ • Alternate-Deals (u. a. Asus B550-Plus Mainboard 118€) • Neues Xiaomi 11T 256GB 549,90€ • Ergotron LX Desk Mount Monitorhalterung 124,90€ • Speicherprodukte von Sandisk & WD [Werbung]
    •  /