Abo
  • Services:

Internet Archive: 10.000.000.000.000.000 Byte archiviert

Websites und kulturelle Artefakte aus dem Netz für die Nachwelt: Das Internet Archive hat mittlerweile 10 Petabyte an Daten archiviert.

Artikel veröffentlicht am ,
Internet Archive speichert mehr als 10 PByte.
Internet Archive speichert mehr als 10 PByte. (Bild: Internet Archive)

Mit dem Internet Archive will es Brewster Kahle späteren Generationen ermöglichen, Entwicklungen unserer Zeit nachzuvollziehen. Über die Way Back Machine können die gesammelten Websites abgefragt werden, so dass deutlich wird, wie eine Website zu verschiedenen Zeitpunkten ausgesehen hat.

Stellenmarkt
  1. Pfennigparade SIGMETA GmbH, München
  2. Hochschule für Fernsehen und Film, München

Große Datenmengen müssen dafür gespeichert werden. Im Jahr 2005 schaffte das Internet Archive dazu ein erstes System mit einer Speicherkapazität von 1 Petabyte an. Das aber reicht schon lange nicht mehr, denn am 25. Oktober 2012 hat der Datenbestand die Marke von 10 Petabyte überschritten, das sind mehr als 10 Millionen GByte.

Nun will das Internet Archive den kompletten Datensatz eines Crawler-Laufs zu Forschungszwecken bereitstellen. Das Archiv umfasst rund 80 TByte an WARC-Dateien, in denen die Inhalte von rund 2,7 Milliarden URIs zusammengefasst sind. Der Crawlerlauf begann am 9. März 2011 und endete am 23. Dezember 2011. Ausgangspunkt waren die laut Alexa 1 Million am häufigsten besuchten Websites.



Anzeige
Hardware-Angebote
  1. und weitere 50€ mit Gutscheincode "MASTERPASS50" und Zahlung mit Masterpass
  2. (Neuware für kurze Zeit zum Sonderpreis bei Mindfactory)

__destruct() 03. Nov 2012

Das sehe ich genauso. Wir leben in einer Informationsgesellschaft und es ist sehr...

schinkenpapst 29. Okt 2012

Ich hoffe, das die nicht auf diese Idee kommen. Ja es sind urheberrechtliche Daten...

sasquash 29. Okt 2012

die gute SI-Präfix.. Da könnte man sich regelmäßig über Halbwissen aufregen :D

Spitfire777 28. Okt 2012

Es gibt sie doch ;D

attitudinized 28. Okt 2012

Das in der Wayback Maschine gespeicherte Material ist nicht das was das Internet-Archive...


Folgen Sie uns
       


Cloudgaming mit dem Fire TV Stick ausprobiert

Wir streamen und spielen mit 60 fps mit dem Fire TV Stick.

Cloudgaming mit dem Fire TV Stick ausprobiert Video aufrufen
Anthem angespielt: Action in fremder Welt und Abkühlung im Wasserfall
Anthem angespielt
Action in fremder Welt und Abkühlung im Wasserfall

E3 2018 Eine interessante Welt, schicke Grafik und ein erstaunlich gutes Fluggefühl: Golem.de hat das Actionrollenspiel Anthem von Bioware ausprobiert.

  1. Just Cause 4 und Rage 2 Physik und Psychopathen
  2. Dying Light 2 Stadtentwicklung mit Schwung
  3. E3 2018 Eindrücke, Analysen und Zuschauerfragen

Urheberrrecht: Etappensieg für Leistungsschutzrecht und Uploadfilter
Urheberrrecht
Etappensieg für Leistungsschutzrecht und Uploadfilter

Trotz aller Proteste: Der Rechtsausschuss des Europaparlaments votiert für ein Leistungsschutzrecht und Uploadfilter. Nun könnte das Plenum sich noch dagegenstellen.

  1. Urheberrecht EU-Staaten für Leistungsschutzrecht und Uploadfilter
  2. EU-Urheberrechtsreform Wie die Affen auf der Schreibmaschine
  3. Leistungsschutzrecht VG Media darf Google weiterhin bevorzugen

Shift6m-Smartphone im Hands on: Nachhaltigkeit geht auch bezahlbar und ansehnlich
Shift6m-Smartphone im Hands on
Nachhaltigkeit geht auch bezahlbar und ansehnlich

Cebit 2018 Das deutsche Unternehmen Shift baut Smartphones, die mit dem Hintergedanken der Nachhaltigkeit entstehen. Das bedeutet für die Entwickler: faire Bezahlung der Werksarbeiter, wiederverwertbare Materialien und leicht zu öffnende Hardware. Außerdem gibt es auf jedes Gerät ein Rückgabepfand - interessant.
Von Oliver Nickel


      •  /