Abo
  • Services:
Anzeige
HTTP Archive: Wie sich das Web verändert

HTTP Archive

Wie sich das Web verändert

Mit dem HTTP Archive will Steve Souders ein historisches Archiv für das Web schaffen. Während das Internet Archive von Brewster Kahle die Inhalte des Webs archiviert, soll das HTTP Archive aufzeichnen, wie die Inhalte ausgeliefert wurden und werden.

Das HTTP Archive soll aufzeigen, wie sich die Leistungswerte des Webs im Zeitverlauf verändern. Dabei geht es um Daten wie die Größe von Webseiten, fehlgeschlagene Anfragen und die benutzten Techniken. Durch die regelmäßige Erfassung und Aufbereitung der Daten sollen Trends erkennbar werden. Das HTTP Archive soll Aufschluss darüber geben, wie das Web gebaut ist und zugleich als zentrale Anlaufstelle für Web-Performance-Forschung dienen.

Anzeige
  • Daten vom 29. März 2011 aus dem HTTP Archive
  • Daten vom 29. März 2011 aus dem HTTP Archive
  • Daten vom 29. März 2011 aus dem HTTP Archive
  • Daten vom 29. März 2011 aus dem HTTP Archive
  • Daten vom 29. März 2011 aus dem HTTP Archive
  • Daten vom 29. März 2011 aus dem HTTP Archive
  • Daten vom 29. März 2011 aus dem HTTP Archive
  • Daten vom 29. März 2011 aus dem HTTP Archive
  • Daten vom 29. März 2011 aus dem HTTP Archive
  • Daten vom 29. März 2011 aus dem HTTP Archive
  • Daten vom 29. März 2011 aus dem HTTP Archive
  • Daten vom 29. März 2011 aus dem HTTP Archive
  • Daten vom 29. März 2011 aus dem HTTP Archive
  • Daten vom 29. März 2011 aus dem HTTP Archive
  • Daten vom 29. März 2011 aus dem HTTP Archive
  • Daten vom 29. März 2011 aus dem HTTP Archive
  • Daten vom 29. März 2011 aus dem HTTP Archive
  • Daten vom 29. März 2011 aus dem HTTP Archive
  • Daten vom 29. März 2011 aus dem HTTP Archive
  • Daten vom 29. März 2011 aus dem HTTP Archive
Daten vom 29. März 2011 aus dem HTTP Archive

Der Code des HTTP Archive ist Open Source, die gesammelten Daten können von jedem heruntergeladen werden. Erfasst werden derzeit rund 17.000 Webseiten, darunter die laut Alexa 10.000 am häufigsten besuchten Webseiten, die Seiten der größten Unternehmen (Fortune 500 und Global 500) sowie die 10.000 laut Quantcast am häufigsten besuchten Websites.

Souders fragt diese Websites seit Oktober 2010 etwa alle zwei Tage ab und nutzt dabei Pat Meenans Webpagetest, um die Daten herunterzuladen und HAR-Dateien, Screenshots, Videos und andere Information zum Ladevorgang der Seite zu erzeugen. Daraus extrahiert das HTTP Archive dann die benötigen Daten, legt diese in einer Datenbank ab und erstellt einige statistische Auswertungen.

Diese geben unter anderem Auskunft darüber, wie groß der Trafficanteil der unterschiedlichen Inhaltstypen ist. Rund 60 Prozent entfallen auf Bilder, 16,5 Prozent auf Scripte und nur 4,6 Prozent auf HTML.

Auf rund 62 Prozent der analysierten Webseiten wird Google Analytics eingesetzt, auf 43 Prozent jQuery und auf 17 Prozent der Seiten ist Facebook eingebunden. Adobe Flash kommt auf 47 Prozent der Seiten zum Einsatz und bei den Bildformaten liegt JPEG leicht vor PNG, GIF ist abgeschlagen auf dem dritten Platz.

Darüber hinaus enthält das HTTP Archive auch Trendanalysen über die Zahl der Requests pro Seite und deren Gesamtgröße im Zeitverlauf. Dabei zeichnen sich unter anderen steigende Bildgrößen ab. Details dazu kann jeder in den gesammelten Daten selbst recherchieren.


eye home zur Startseite
CruZer 31. Mär 2011

Auch nicht wenn (d)ein Name dabei steht bzw. in einem Zusammenhang mit bestimmten...

Eckstein 31. Mär 2011

Yahoo™ in beiden Listen unter den Top 4, das war meine Überraschung des Tages.

Pantoffel 31. Mär 2011

Über 3MB JS-Code. Naja ... wenns was bringt. :)



Anzeige

Stellenmarkt
  1. Radeberger Gruppe KG, Frankfurt am Main
  2. über Hanseatisches Personalkontor Bremen, Bremen
  3. Rohde & Schwarz GmbH & Co. KG, München
  4. via 3C - Career Consulting Company GmbH, München, Frankfurt, Hamburg, Düsseldorf, Berlin (Home-Office)


Anzeige
Hardware-Angebote
  1. 18,01€+ 3€ Versand
  2. täglich neue Deals
  3. 399€ + 3,99€ Versand

Folgen Sie uns
       


  1. Fahrdienst

    London stoppt Uber, Protest wächst

  2. Facebook

    Mark Zuckerberg lenkt im Streit mit Investoren ein

  3. Merged-Reality-Headset

    Intel stellt Project Alloy ein

  4. Teardown

    Glasrückseite des iPhone 8 kann zum Problem werden

  5. E-Mail

    Adobe veröffentlicht versehentlich privaten PGP-Key im Blog

  6. Die Woche im Video

    Schwachstellen, wohin man schaut

  7. UAV

    Matternet startet Drohnenlieferdienst in der Schweiz

  8. Joint Venture

    Microsoft und Facebook verlegen Seekabel mit 160 Terabit/s

  9. Remote Forensics

    BKA kann eigenen Staatstrojaner nicht einsetzen

  10. Datenbank

    Börsengang von MongoDB soll 100 Millionen US-Dollar bringen



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Kein App Store mehr: iOS-Nutzer sollten das neue iTunes nicht installieren
Kein App Store mehr
iOS-Nutzer sollten das neue iTunes nicht installieren
  1. Apple iOS 11 Wer WLAN und Bluetooth abschaltet, benutzt es weiter
  2. Drei Netzanbieter warnt vor Upgrade auf iOS 11
  3. Betriebssystem Apple veröffentlicht Goldmaster für iOS, tvOS und WatchOS

Inspiron 5675 im Test: Dells Ryzen-Gaming-PC reicht mindestens bis 2020
Inspiron 5675 im Test
Dells Ryzen-Gaming-PC reicht mindestens bis 2020
  1. Android 8.0 im Test Fertig oder nicht fertig, das ist hier die Frage
  2. Logitech Powerplay im Test Die niemals leere Funk-Maus
  3. Polar vs. Fitbit Duell der Schlafexperten

Energieversorgung: Windparks sind schlechter gesichert als E-Mail-Konten
Energieversorgung
Windparks sind schlechter gesichert als E-Mail-Konten
  1. Optimierungsprogramm Ccleaner-Malware sollte wohl Techkonzerne ausspionieren
  2. Messenger Wire-Server steht komplett unter Open-Source-Lizenz
  3. Apache Struts Monate alte Sicherheitslücke führte zu Equifax-Hack

  1. Re: hmmm

    DarioBerlin | 18:25

  2. Re: Und bei DSL?

    bombinho | 18:08

  3. Re: Alles verstaatlichen! :)

    Faksimile | 18:05

  4. Re: Einfach nur unter Windows nachladen

    elgooG | 17:57

  5. Kunde droht mit Auftrag

    cicero | 17:57


  1. 15:37

  2. 15:08

  3. 14:28

  4. 13:28

  5. 11:03

  6. 09:03

  7. 17:43

  8. 17:25


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel