Internet Archive: 10.000.000.000.000.000 Byte archiviert

Websites und kulturelle Artefakte aus dem Netz für die Nachwelt: Das Internet Archive hat mittlerweile 10 Petabyte an Daten archiviert.

Artikel veröffentlicht am ,
Internet Archive speichert mehr als 10 PByte.
Internet Archive speichert mehr als 10 PByte. (Bild: Internet Archive)

Mit dem Internet Archive will es Brewster Kahle späteren Generationen ermöglichen, Entwicklungen unserer Zeit nachzuvollziehen. Über die Way Back Machine können die gesammelten Websites abgefragt werden, so dass deutlich wird, wie eine Website zu verschiedenen Zeitpunkten ausgesehen hat.

Stellenmarkt
  1. Wissenschaftlerin / Wissenschaftler (w/m/d) für die Entwicklung eines digitalen Ernährungserhebungsinstrume- ntes ... (m/w/d)
    Max Rubner-Institut, Karlsruhe
  2. SAP PP Berater (m/w/x)
    über duerenhoff GmbH, Hamburg
Detailsuche

Große Datenmengen müssen dafür gespeichert werden. Im Jahr 2005 schaffte das Internet Archive dazu ein erstes System mit einer Speicherkapazität von 1 Petabyte an. Das aber reicht schon lange nicht mehr, denn am 25. Oktober 2012 hat der Datenbestand die Marke von 10 Petabyte überschritten, das sind mehr als 10 Millionen GByte.

Nun will das Internet Archive den kompletten Datensatz eines Crawler-Laufs zu Forschungszwecken bereitstellen. Das Archiv umfasst rund 80 TByte an WARC-Dateien, in denen die Inhalte von rund 2,7 Milliarden URIs zusammengefasst sind. Der Crawlerlauf begann am 9. März 2011 und endete am 23. Dezember 2011. Ausgangspunkt waren die laut Alexa 1 Million am häufigsten besuchten Websites.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


__destruct() 03. Nov 2012

Das sehe ich genauso. Wir leben in einer Informationsgesellschaft und es ist sehr...

schinkenpapst 29. Okt 2012

Ich hoffe, das die nicht auf diese Idee kommen. Ja es sind urheberrechtliche Daten...

sasquash 29. Okt 2012

die gute SI-Präfix.. Da könnte man sich regelmäßig über Halbwissen aufregen :D

Spitfire777 28. Okt 2012

Es gibt sie doch ;D



Aktuell auf der Startseite von Golem.de
Openweather
Eine Wetter-Uhr auf dem Raspberry Pi

Wir zeigen auf einem 64-x-64-LED-Panel mithilfe eines Raspberry Pi außer der Uhrzeit auch Wetterinformationen an. Die Programmierung erfolgt in C#.
Eine Anleitung von Michael Bröde

Openweather: Eine Wetter-Uhr auf dem Raspberry Pi
Artikel
  1. Toyota, CATL etc.: China schließt Fabriken wegen Hitzewelle
    Toyota, CATL etc.
    China schließt Fabriken wegen Hitzewelle

    Unter anderem Chinas größter Batteriehersteller muss seine Fabriken in Sichuan für eine Woche schließen - Grund ist eine Hitzewelle.

  2. Hybride Arbeit: Das Schlechteste aus zwei Welten?
    Hybride Arbeit
    Das Schlechteste aus zwei Welten?

    Frust plus Probleme statt Arbeiten im Grünen plus Kollegenkontakt: Hybrides Arbeiten misslingt oft - muss es aber nicht.
    Ein Ratgebertext von Jakob Rufus Klimkait und Kristin Ottlinger

  3. J.R.R. Tolkien: The Embracer Group kauft Der Herr der Ringe
    J.R.R. Tolkien
    The Embracer Group kauft Der Herr der Ringe

    Bis auf die Buchrechte gehört Der Herr der Ringe künftig zu The Embracer Group. Nebenbei kauft der Publisher mal wieder ein paar Spielestudios.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • 10%-Gaming-Gutschein bei eBay • Grafikkarten zu Tiefpreisen (Palit RTX 3090 Ti 1.391,98€, Zotac RTX 3090 1.298,99€, MSI RTX 3080 Ti 1.059€) • PS5 bei Amazon • HP HyperX Gaming-Maus 29€ statt 99€ • MindStar (ASRock RX 6900XT 869€) • Bester 2.000€-Gaming-PC [Werbung]
    •  /