Internet Archive: 10.000.000.000.000.000 Byte archiviert
Internet Archive speichert mehr als 10 PByte. (Bild: Internet Archive)

Internet Archive 10.000.000.000.000.000 Byte archiviert

Websites und kulturelle Artefakte aus dem Netz für die Nachwelt: Das Internet Archive hat mittlerweile 10 Petabyte an Daten archiviert.

Anzeige

Mit dem Internet Archive will es Brewster Kahle späteren Generationen ermöglichen, Entwicklungen unserer Zeit nachzuvollziehen. Über die Way Back Machine können die gesammelten Websites abgefragt werden, so dass deutlich wird, wie eine Website zu verschiedenen Zeitpunkten ausgesehen hat.

Große Datenmengen müssen dafür gespeichert werden. Im Jahr 2005 schaffte das Internet Archive dazu ein erstes System mit einer Speicherkapazität von 1 Petabyte an. Das aber reicht schon lange nicht mehr, denn am 25. Oktober 2012 hat der Datenbestand die Marke von 10 Petabyte überschritten, das sind mehr als 10 Millionen GByte.

Nun will das Internet Archive den kompletten Datensatz eines Crawler-Laufs zu Forschungszwecken bereitstellen. Das Archiv umfasst rund 80 TByte an WARC-Dateien, in denen die Inhalte von rund 2,7 Milliarden URIs zusammengefasst sind. Der Crawlerlauf begann am 9. März 2011 und endete am 23. Dezember 2011. Ausgangspunkt waren die laut Alexa 1 Million am häufigsten besuchten Websites.


__destruct() 03. Nov 2012

Das sehe ich genauso. Wir leben in einer Informationsgesellschaft und es ist sehr...

schinkenpapst 29. Okt 2012

Ich hoffe, das die nicht auf diese Idee kommen. Ja es sind urheberrechtliche Daten...

sasquash 29. Okt 2012

die gute SI-Präfix.. Da könnte man sich regelmäßig über Halbwissen aufregen :D

Spitfire777 28. Okt 2012

Es gibt sie doch ;D

attitudinized 28. Okt 2012

Das in der Wayback Maschine gespeicherte Material ist nicht das was das Internet-Archive...

Kommentieren



Anzeige

  1. Spezialist (m/w) IT-Sicherheitsarchitektur
    GAZPROM Germania GmbH über Personalberatung Dr. Stehle-Hartwig, Berlin
  2. PHP-Programmierer (m/w)
    Coopmedia AG, Köln
  3. Mitarbeiter in der Beratung (m/w) Produktdaten Qualität (PDQ) Services (Betrieb, Support und Testen)
    Daimler AG, Stuttgart-Untertürkheim
  4. Professur (W 2) für Informatik / Human Computer Interaction
    Hochschule Offenburg, Offenburg

 

Detailsuche


Folgen Sie uns
       


  1. Thaw

    Das Smartphone schnappt Dateien vom Bildschirm

  2. Threshold

    Beta von Windows 9 erst im Oktober 2014, aber mit Startmenü

  3. Neue AGB

    Kickstarter klärt Regeln für gescheiterte Projekte

  4. Handelsplattform

    Datenschützer warnt vor Alibaba

  5. Playstation

    Remote-Play-Funktion für viele Android-Geräte portiert

  6. Apple

    10 Millionen neue iPhones am ersten Wochenende verkauft

  7. Deutsche Post

    Sicherheitslücke in Sendungsverfolgung von DHL

  8. Star-Wars-Dreharbeiten

    Drohnenabwehr gegen übermütige Fans

  9. Asus Vivo Tab 8

    Windows-Tablet mit 8-Zoll-Display kommt für 200 Euro

  10. Test Wasteland 2

    Abenteuer in der postnuklearen Textwüste



Haben wir etwas übersehen?

E-Mail an news@golem.de



Intel Core i7-5960X im Test: Die PC-Revolution beginnt mit Octacore und DDR4
Intel Core i7-5960X im Test
Die PC-Revolution beginnt mit Octacore und DDR4
  1. Rory Read AMDs neue x86-Architektur Zen kommt 2015
  2. Intels Desktop-Chefin im Interview "Wir hatten unsere loyalsten Kunden frustriert"
  3. Intel Core i7-5960X X99-Mainboards angebrannt

Netflix-Start in Deutschland: Der Kampf um den Video-on-Demand-Markt
Netflix-Start in Deutschland
Der Kampf um den Video-on-Demand-Markt

Test Destiny: Schicksal voller Widersprüche
Test Destiny
Schicksal voller Widersprüche
  1. Destiny 500 Millionen US-Dollar Umsatz mit "steriler Welt"
  2. Destiny "Größter Unterschied sind sehr pixelige Schatten"
  3. Bungie Kostenloses Upgrade von Old- zu Current-Gen-Konsolen

    •  / 
    Zum Artikel