Internet Archive: 10.000.000.000.000.000 Byte archiviert
Internet Archive speichert mehr als 10 PByte. (Bild: Internet Archive)

Internet Archive 10.000.000.000.000.000 Byte archiviert

Websites und kulturelle Artefakte aus dem Netz für die Nachwelt: Das Internet Archive hat mittlerweile 10 Petabyte an Daten archiviert.

Anzeige

Mit dem Internet Archive will es Brewster Kahle späteren Generationen ermöglichen, Entwicklungen unserer Zeit nachzuvollziehen. Über die Way Back Machine können die gesammelten Websites abgefragt werden, so dass deutlich wird, wie eine Website zu verschiedenen Zeitpunkten ausgesehen hat.

Große Datenmengen müssen dafür gespeichert werden. Im Jahr 2005 schaffte das Internet Archive dazu ein erstes System mit einer Speicherkapazität von 1 Petabyte an. Das aber reicht schon lange nicht mehr, denn am 25. Oktober 2012 hat der Datenbestand die Marke von 10 Petabyte überschritten, das sind mehr als 10 Millionen GByte.

Nun will das Internet Archive den kompletten Datensatz eines Crawler-Laufs zu Forschungszwecken bereitstellen. Das Archiv umfasst rund 80 TByte an WARC-Dateien, in denen die Inhalte von rund 2,7 Milliarden URIs zusammengefasst sind. Der Crawlerlauf begann am 9. März 2011 und endete am 23. Dezember 2011. Ausgangspunkt waren die laut Alexa 1 Million am häufigsten besuchten Websites.


__destruct() 03. Nov 2012

Das sehe ich genauso. Wir leben in einer Informationsgesellschaft und es ist sehr...

schinkenpapst 29. Okt 2012

Ich hoffe, das die nicht auf diese Idee kommen. Ja es sind urheberrechtliche Daten...

sasquash 29. Okt 2012

die gute SI-Präfix.. Da könnte man sich regelmäßig über Halbwissen aufregen :D

Spitfire777 28. Okt 2012

Es gibt sie doch ;D

attitudinized 28. Okt 2012

Das in der Wayback Maschine gespeicherte Material ist nicht das was das Internet-Archive...

Kommentieren



Anzeige

  1. Servicemitarbeiter / innen IT-Arbeitsplatzdienste
    Landeshauptstadt München, München
  2. IT-Netzwerkadministrator (m/w)
    Imtech Deutschland GmbH & Co. KG, Hamburg
  3. Junior Projektmanager (m/w) IT-Projekte/IT-Prozesse
    NRW.BANK, Düsseldorf
  4. Anwendungsentwickler / Webprogrammierer (m/w)
    alpha Tonträger Vertriebs GmbH, Erding

 

Detailsuche


Folgen Sie uns
       


  1. Nur Jailbreak betroffen

    Schadsoftware infiziert 75.000 iPhones

  2. Test Star Wars Commander

    Die dunkle Seite der Monetarisierung

  3. Probleme in der Umlaufbahn

    Galileo-Satelliten nicht ideal abgesetzt

  4. Telefonie und Internet

    Bundesweite DSL-Störungen bei O2

  5. iPhone 5

    Apple bietet für einzelne Geräte einen Akkutausch an

  6. Leistungsschutzrecht

    Kartellamt weist Beschwerde gegen Google zurück

  7. Projekt DeLorean

    Microsofts Game-Streaming rechnet 250 ms Latenz weg

  8. Digitale Agenda

    Bitkom fordert komplette Nutzung des 700-Megahertz-Bandes

  9. Watch Dogs

    Gezielt Freunde hacken

  10. Test Rules

    Gehirntraining für Fortgeschrittene



Haben wir etwas übersehen?

E-Mail an news@golem.de



Sofia: Der fliegende Blick durch den Staub
Sofia
Der fliegende Blick durch den Staub
  1. Audio aus Video Gefilmte Topfpflanze verrät Gespräche
  2. Nahrungsmittel Trinken statt Essen
  3. Bioelektronik Pilze sind die besten Zellschnittstellen

IPv6: Der holperige Weg zu neuen IP-Adressen
IPv6
Der holperige Weg zu neuen IP-Adressen
  1. Stellenanzeige Facebook will Linux-Netzwerkstack wie in FreeBSD
  2. Internet der Dinge Google, Samsung und ARM mit Thread gegen WLAN und Bluetooth
  3. Für Azure Microsoft gehen US-IPv4-Adressen aus

Digitale Agenda: Ein Papier, das alle enttäuscht
Digitale Agenda
Ein Papier, das alle enttäuscht
  1. Digitale Agenda 38 Seiten Angst vor festen Zusagen
  2. Breitbandausbau Telekom will zehn Milliarden Euro vom Staat für DSL-Ausbau
  3. Zwiespältig Gesetz gegen WLAN-Störerhaftung von Cafés und Hotels fertig

    •  / 
    Zum Artikel