HTTP Archive

Wie sich das Web verändert

Mit dem HTTP Archive will Steve Souders ein historisches Archiv für das Web schaffen. Während das Internet Archive von Brewster Kahle die Inhalte des Webs archiviert, soll das HTTP Archive aufzeichnen, wie die Inhalte ausgeliefert wurden und werden.

Artikel veröffentlicht am ,
HTTP Archive: Wie sich das Web verändert

Das HTTP Archive soll aufzeigen, wie sich die Leistungswerte des Webs im Zeitverlauf verändern. Dabei geht es um Daten wie die Größe von Webseiten, fehlgeschlagene Anfragen und die benutzten Techniken. Durch die regelmäßige Erfassung und Aufbereitung der Daten sollen Trends erkennbar werden. Das HTTP Archive soll Aufschluss darüber geben, wie das Web gebaut ist und zugleich als zentrale Anlaufstelle für Web-Performance-Forschung dienen.

  • Daten vom 29. März 2011 aus dem HTTP Archive
  • Daten vom 29. März 2011 aus dem HTTP Archive
  • Daten vom 29. März 2011 aus dem HTTP Archive
  • Daten vom 29. März 2011 aus dem HTTP Archive
  • Daten vom 29. März 2011 aus dem HTTP Archive
  • Daten vom 29. März 2011 aus dem HTTP Archive
  • Daten vom 29. März 2011 aus dem HTTP Archive
  • Daten vom 29. März 2011 aus dem HTTP Archive
  • Daten vom 29. März 2011 aus dem HTTP Archive
  • Daten vom 29. März 2011 aus dem HTTP Archive
  • Daten vom 29. März 2011 aus dem HTTP Archive
  • Daten vom 29. März 2011 aus dem HTTP Archive
  • Daten vom 29. März 2011 aus dem HTTP Archive
  • Daten vom 29. März 2011 aus dem HTTP Archive
  • Daten vom 29. März 2011 aus dem HTTP Archive
  • Daten vom 29. März 2011 aus dem HTTP Archive
  • Daten vom 29. März 2011 aus dem HTTP Archive
  • Daten vom 29. März 2011 aus dem HTTP Archive
  • Daten vom 29. März 2011 aus dem HTTP Archive
  • Daten vom 29. März 2011 aus dem HTTP Archive
Daten vom 29. März 2011 aus dem HTTP Archive
Stellenmarkt
  1. Full Stack Developer (m/w/d)
    Allianz Technology SE, Stuttgart
  2. IT Specialist (m/w/d)
    RAMPF Holding GmbH & Co. KG, Grafenberg (bei Metzingen)
Detailsuche

Der Code des HTTP Archive ist Open Source, die gesammelten Daten können von jedem heruntergeladen werden. Erfasst werden derzeit rund 17.000 Webseiten, darunter die laut Alexa 10.000 am häufigsten besuchten Webseiten, die Seiten der größten Unternehmen (Fortune 500 und Global 500) sowie die 10.000 laut Quantcast am häufigsten besuchten Websites.

Souders fragt diese Websites seit Oktober 2010 etwa alle zwei Tage ab und nutzt dabei Pat Meenans Webpagetest, um die Daten herunterzuladen und HAR-Dateien, Screenshots, Videos und andere Information zum Ladevorgang der Seite zu erzeugen. Daraus extrahiert das HTTP Archive dann die benötigen Daten, legt diese in einer Datenbank ab und erstellt einige statistische Auswertungen.

Diese geben unter anderem Auskunft darüber, wie groß der Trafficanteil der unterschiedlichen Inhaltstypen ist. Rund 60 Prozent entfallen auf Bilder, 16,5 Prozent auf Scripte und nur 4,6 Prozent auf HTML.

Golem Karrierewelt
  1. Microsoft 365 Administration: virtueller Drei-Tage-Workshop
    09.-11.01.2023, Virtuell
  2. Entwicklung mit Unity auf der Microsoft HoloLens 2 Plattform: virtueller Zwei-Tage-Workshop
    05./06.12.2022, Virtuell
Weitere IT-Trainings

Auf rund 62 Prozent der analysierten Webseiten wird Google Analytics eingesetzt, auf 43 Prozent jQuery und auf 17 Prozent der Seiten ist Facebook eingebunden. Adobe Flash kommt auf 47 Prozent der Seiten zum Einsatz und bei den Bildformaten liegt JPEG leicht vor PNG, GIF ist abgeschlagen auf dem dritten Platz.

Darüber hinaus enthält das HTTP Archive auch Trendanalysen über die Zahl der Requests pro Seite und deren Gesamtgröße im Zeitverlauf. Dabei zeichnen sich unter anderen steigende Bildgrößen ab. Details dazu kann jeder in den gesammelten Daten selbst recherchieren.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


CruZer 31. Mär 2011

Auch nicht wenn (d)ein Name dabei steht bzw. in einem Zusammenhang mit bestimmten...

Eckstein 31. Mär 2011

Yahoo™ in beiden Listen unter den Top 4, das war meine Überraschung des Tages.

Pantoffel 31. Mär 2011

Über 3MB JS-Code. Naja ... wenns was bringt. :)



Aktuell auf der Startseite von Golem.de
25 Jahre Mars Attacks!
"Aus irgendeinem merkwürdigen Grund fehl am Platz"

Viele Amerikaner fanden Tim Burtons Mars Attacks! nicht so witzig, aber der Rest der Welt lacht umso mehr - bis heute, der Film ist grandios gealtert.
Von Peter Osteried

25 Jahre Mars Attacks!: Aus irgendeinem merkwürdigen Grund fehl am Platz
Artikel
  1. Auch ZTE betroffen: USA verbieten Verkauf und Import von Huawei-Geräten
    Auch ZTE betroffen
    USA verbieten Verkauf und Import von Huawei-Geräten

    Neben Geräten von Huawei darf auch ZTE künftig nicht mehr auf dem US-Markt agieren, wie die FCC nun beschlossen hat.

  2. Artemis I: Orion-Kapsel ist in Mondorbit eingeschwenkt
    Artemis I
    Orion-Kapsel ist in Mondorbit eingeschwenkt

    Die Testmission für Mondlandungen der Nasa Artemis I hat den Mond erreicht. In den kommenden Tagen macht sich die Orion-Kapsel auf den Rückweg.

  3. NIS 2 und Compliance vs. Security: Kann Sicherheit einfach beschlossen werden?
    NIS 2 und Compliance vs. Security
    Kann Sicherheit einfach beschlossen werden?

    Mit der NIS-2-Richtlinie will der Gesetzgeber für IT-Sicherheit sorgen. Doch gut gemeinte Regeln kommen in der Praxis nicht immer unbedingt auch gut an.
    Von Nils Brinker

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Black Friday bei Mindfactory, MediaMarkt & Saturn • Prime-Filme leihen für je 0,99€ • WD_BLACK SN770 500GB 49,99€ • GIGABYTE Z690 AORUS ELITE 179€ • Seagate FireCuda 530 1TB 119,90€ • Crucial P3 Plus 1TB 81,99 & P2 1TB 67,99€ • Alpenföhn Wing Boost 3 ARGB 120 3er-Pack 42,89€ [Werbung]
    •  /