Internet Archive speichert mehr als 10 PByte.
Internet Archive speichert mehr als 10 PByte. (Bild: Internet Archive)

Internet Archive 10.000.000.000.000.000 Byte archiviert

Websites und kulturelle Artefakte aus dem Netz für die Nachwelt: Das Internet Archive hat mittlerweile 10 Petabyte an Daten archiviert.

Anzeige

Mit dem Internet Archive will es Brewster Kahle späteren Generationen ermöglichen, Entwicklungen unserer Zeit nachzuvollziehen. Über die Way Back Machine können die gesammelten Websites abgefragt werden, so dass deutlich wird, wie eine Website zu verschiedenen Zeitpunkten ausgesehen hat.

Große Datenmengen müssen dafür gespeichert werden. Im Jahr 2005 schaffte das Internet Archive dazu ein erstes System mit einer Speicherkapazität von 1 Petabyte an. Das aber reicht schon lange nicht mehr, denn am 25. Oktober 2012 hat der Datenbestand die Marke von 10 Petabyte überschritten, das sind mehr als 10 Millionen GByte.

Nun will das Internet Archive den kompletten Datensatz eines Crawler-Laufs zu Forschungszwecken bereitstellen. Das Archiv umfasst rund 80 TByte an WARC-Dateien, in denen die Inhalte von rund 2,7 Milliarden URIs zusammengefasst sind. Der Crawlerlauf begann am 9. März 2011 und endete am 23. Dezember 2011. Ausgangspunkt waren die laut Alexa 1 Million am häufigsten besuchten Websites.


__destruct() 03. Nov 2012

Das sehe ich genauso. Wir leben in einer Informationsgesellschaft und es ist sehr...

schinkenpapst 29. Okt 2012

Ich hoffe, das die nicht auf diese Idee kommen. Ja es sind urheberrechtliche Daten...

sasquash 29. Okt 2012

die gute SI-Präfix.. Da könnte man sich regelmäßig über Halbwissen aufregen :D

Spitfire777 28. Okt 2012

Es gibt sie doch ;D

attitudinized 28. Okt 2012

Das in der Wayback Maschine gespeicherte Material ist nicht das was das Internet-Archive...

Kommentieren



Anzeige

  1. Projektmitarbeiter / -manager (m/w) mit Schwerpunkt IT-Sicherheit
    PSI AG, Aschaffenburg
  2. Experte/-in IT Security / Network / Infrastructure
    ZF Friedrichshafen AG, Friedrichshafen
  3. Entwicklungsingenieur (m/w) Software Fahrwerkselektronik
    Continental AG, Nürnberg
  4. Software Entwickler (C++ / .NET / Java / Apps) (m/w)
    MAS Software GmbH, München

 

Detailsuche


Folgen Sie uns
       


  1. Bewegungsprofile

    Dobrindt wegen "Verkehrs-Vorratsdatenspeicherung" kritisiert

  2. Anonymisierung

    Facebook ist im Tor-Netzwerk erreichbar

  3. Spielekonsole

    Neuer 20-nm-Chip für sparsamere Xbox One ist fertig

  4. Günther Oettinger

    EU-Digitalkommissar will Urheberrechtssteuer für alle

  5. Ruhemodus

    Noch ein Bug in Firmware 2.0 der Playstation 4

  6. VDSL2-Nachfolgestandard

    Telekom-Konkurrenten starten G.fast-Praxistest

  7. Ego-Shooter

    Bethesda hat Prey 2 eingestellt

  8. Keine Bußgelder

    Sicherheitslücken bleiben ohne Strafen

  9. Kinox.to

    GVU will Bitshare und Freakshare offline nehmen lassen

  10. Bungie

    Destiny und der Gesundheitsbalken



Haben wir etwas übersehen?

E-Mail an news@golem.de



3D-Druck ausprobiert: Internetausdrucker 4.0
3D-Druck ausprobiert
Internetausdrucker 4.0
  1. Sicherheit Der Arduino-Safeknacker aus dem 3D-Drucker
  2. Arduino Neue Details zum 3D-Drucker Materia 101
  3. Niedriger Schmelzpunkt 3D-Drucken mit metallischer Tinte

Qubes OS angeschaut: Abschottung bringt mehr Sicherheit
Qubes OS angeschaut
Abschottung bringt mehr Sicherheit

Schenker XMG P505 im Test: Flaches Gaming-Notebook mit überraschender GTX 970M
Schenker XMG P505 im Test
Flaches Gaming-Notebook mit überraschender GTX 970M
  1. Getac S400-S3 Das Ruggedized-Notebook mit SSD-Heizung
  2. Geforce GTX 980M und 970M Maxwell verdoppelt Spielgeschwindigkeit von Notebooks
  3. Toughbook CF-LX3 Panasonics leichtes Notebook mit der Lizenz zum Runterfallen

    •  / 
    Zum Artikel