Internet Archive: 10.000.000.000.000.000 Byte archiviert
Internet Archive speichert mehr als 10 PByte. (Bild: Internet Archive)

Internet Archive 10.000.000.000.000.000 Byte archiviert

Websites und kulturelle Artefakte aus dem Netz für die Nachwelt: Das Internet Archive hat mittlerweile 10 Petabyte an Daten archiviert.

Anzeige

Mit dem Internet Archive will es Brewster Kahle späteren Generationen ermöglichen, Entwicklungen unserer Zeit nachzuvollziehen. Über die Way Back Machine können die gesammelten Websites abgefragt werden, so dass deutlich wird, wie eine Website zu verschiedenen Zeitpunkten ausgesehen hat.

Große Datenmengen müssen dafür gespeichert werden. Im Jahr 2005 schaffte das Internet Archive dazu ein erstes System mit einer Speicherkapazität von 1 Petabyte an. Das aber reicht schon lange nicht mehr, denn am 25. Oktober 2012 hat der Datenbestand die Marke von 10 Petabyte überschritten, das sind mehr als 10 Millionen GByte.

Nun will das Internet Archive den kompletten Datensatz eines Crawler-Laufs zu Forschungszwecken bereitstellen. Das Archiv umfasst rund 80 TByte an WARC-Dateien, in denen die Inhalte von rund 2,7 Milliarden URIs zusammengefasst sind. Der Crawlerlauf begann am 9. März 2011 und endete am 23. Dezember 2011. Ausgangspunkt waren die laut Alexa 1 Million am häufigsten besuchten Websites.


__destruct() 03. Nov 2012

Das sehe ich genauso. Wir leben in einer Informationsgesellschaft und es ist sehr...

schinkenpapst 29. Okt 2012

Ich hoffe, das die nicht auf diese Idee kommen. Ja es sind urheberrechtliche Daten...

sasquash 29. Okt 2012

die gute SI-Präfix.. Da könnte man sich regelmäßig über Halbwissen aufregen :D

Spitfire777 28. Okt 2012

Es gibt sie doch ;D

attitudinized 28. Okt 2012

Das in der Wayback Maschine gespeicherte Material ist nicht das was das Internet-Archive...

Kommentieren



Anzeige

  1. Projektleiter/in Software für mechatronische Fahrwerksysteme
    Schaeffler Technologies GmbH & Co. KG, Herzogenaurach
  2. Lead Knowledge Analyst (m/w) Statistical Analytics - Knowledge Practice Analytics
    The Boston Consulting Group GmbH, Munich or Düsseldorf
  3. Gruppenleiter (m/w) für Software-Qualitätsmanagement
    TRUMPF GmbH + Co. KG, Ditzingen bei Stuttgart
  4. Web-Entwickler (m/w) mit Schwerpunkt PHP
    LLG Media GmbH, Bonn

 

Detailsuche


Folgen Sie uns
       


  1. 20-Nanometer-DRAM

    Samsung fertigt Chips für DDR4-Module mit 32 bis 128 GByte

  2. Qubes OS angeschaut

    Abschottung bringt mehr Sicherheit

  3. Die Verwandlung

    Ein Roboter spielt Gregor Samsa

  4. VDSL2-Nachfolgestandard

    Deutsche Telekom testet G.fast weiter

  5. Selfie-Smartphone

    Nokia Lumia 730 in Deutschland erhältlich

  6. Passport

    Lenovo soll erneut vor Blackberry-Übernahme stehen

  7. Benchmark

    PCMark für Android misst auch Akkulaufzeit

  8. KDE Plasma

    KWin-Wayland wird Libinput und Logind verwenden

  9. iPhone und iPad

    Apple fordert 64-Bit-Unterstützung für alle iOS-Apps

  10. Microsoft

    Neue Fensteranimationen für Windows 10



Haben wir etwas übersehen?

E-Mail an news@golem.de



iMac mit Retina 5K angeschaut: Eine Lupe könnte helfen
iMac mit Retina 5K angeschaut
Eine Lupe könnte helfen
  1. Apple Tonga-XT-Chip mit 3,5 TFLOPs für den iMac Retina
  2. iFixit iMac mit Retina-Display ist schwer zu reparieren
  3. Apple iMac Retina bringt mehr als 14 Megapixel auf das Display

Data Management: Wie Hauptspeicherdatenbanken arbeiten
Data Management
Wie Hauptspeicherdatenbanken arbeiten

Schenker XMG P505 im Test: Flaches Gaming-Notebook mit überraschender GTX 970M
Schenker XMG P505 im Test
Flaches Gaming-Notebook mit überraschender GTX 970M
  1. Geforce GTX 980M und 970M Maxwell verdoppelt Spielgeschwindigkeit von Notebooks
  2. Toughbook CF-LX3 Panasonics leichtes Notebook mit der Lizenz zum Runterfallen
  3. Entwicklung vorerst eingestellt Notebooks mit Touch-Displays sind nicht gefragt

    •  / 
    Zum Artikel