Abo
  • Services:

Mit WARC das Web archivieren

ISO legt neuen Standard zur Webarchivierung fest

Die ISO hat mit dem Dateiformat WARC alias "ISO 28500:20092" einen Standard zur Archivierung von Webseiten verabschiedet. Damit soll es einfach werden, die flüchtigen Informationen des Web für die Nachwelt verfügbar zu halten.

Artikel veröffentlicht am ,

Das Format WARC (Web ARChive) erlaubt es, mehrere Datenobjekte in einer langen Datei abzulegen. Damit sollen sich Applikationen entwickeln lassen, die Webinhalte abgrasen, verwalten, zur Verfügung stellen und deren Austausch ermöglichen. Die Standardisierung soll dafür sorgen, das Thema Archivierung breiter zu verankern.

Stellenmarkt
  1. Beckhoff Automation GmbH & Co. KG, Verl
  2. Bosch Gruppe, Grasbrunn

WARC ist eine Erweiterung des Dateiformats ARC, das vom Internet Archive seit 1996, aber auch von anderen Institutionen eingesetzt wird. Es wird genutzt, um die beim Crawlen des Webs anfallenden Daten samt der darin verlinkten Daten abzulegen. Anders als das ARC-Format erlaubt WARC auch die Aufzeichnung von HTTP-Request-Headern und beliebiger Metadaten. Zudem lassen sich Duplikate besser verwalten und Inhalte migrieren sowie segmentieren. Dabei soll WARC zur Speicherung beliebiger digitaler Inhalte geeignet sein, ganz gleich ob diese über HTTP oder ein anderes Protokoll erfasst wurden.

Einige Archivierungswerkzeuge unterstützen WARC bereits, darunter der Heritrix Crawler des Internet Archive, die WARC Tools, die Wayback Machine und NutchWAX.



Anzeige
Hardware-Angebote
  1. (reduzierte Überstände, Restposten & Co.)

Unsinn 16. Nov 2009

Was Du schreibst ist großer Unsinn. 1. Natürlich bleiben die Links erhalten, die Dateien...


Folgen Sie uns
       


Mit dem C64 ins Internet - Tutorial

Wir zeigen, wie man den C64 ins Netz bringt.

Mit dem C64 ins Internet - Tutorial Video aufrufen
Datenschutz: Nie da gewesene Kontrollmacht für staatliche Stellen
Datenschutz
"Nie da gewesene Kontrollmacht für staatliche Stellen"

Zur G20-Fahndung nutzt Hamburgs Polizei eine Software, die Gesichter von Hunderttausenden speichert. Schluss damit, sagt der Datenschutzbeauftragte - und wird ignoriert.
Ein Interview von Oliver Hollenstein

  1. Brexit-Abstimmung IT-Wirtschaft warnt vor Datenchaos in Europa
  2. Österreich Post handelt mit politischen Einstellungen
  3. Digitalisierung Bär stößt Debatte um Datenschutz im Gesundheitswesen an

CES 2019: Die Messe der unnützen Gaming-Hardware
CES 2019
Die Messe der unnützen Gaming-Hardware

CES 2019 Wer wollte schon immer dauerhaft auf einem kleinen 17-Zoll-Bildschirm spielen oder ein mehrere Kilogramm schweres Tablet mit sich herumtragen? Niemand! Das ficht die Hersteller aber nicht an - im Gegenteil, sie denken sich immer mehr Obskuritäten aus.
Ein IMHO von Oliver Nickel

  1. Slighter im Hands on Wenn das Feuerzeug smarter als der Raucher ist
  2. Sonos Keine Parallelnutzung von Alexa und Google Assistant geplant
  3. Hypersense-Prototypen ausprobiert Razers Rumpel-Peripherie sorgt für Immersion

IT-Jobs: Ein Jahr als Freelancer
IT-Jobs
Ein Jahr als Freelancer

Sicher träumen nicht wenige festangestellte Entwickler, Programmierer und andere ITler davon, sich selbstständig zu machen. Unser Autor hat vor einem Jahr den Schritt ins Vollzeit-Freelancertum gewagt und bilanziert: Vieles an der Selbstständigkeit ist gut, aber nicht alles. Und: Die Freiheit des Freelancers ist relativ.
Ein Erfahrungsbericht von Marvin Engel

  1. Job-Porträt Die Cobol Cowboys auf wichtiger Mission
  2. IT Frauen, die programmieren und Bier trinken
  3. Software-Entwickler CDU will Online-Weiterbildung à la Netflix

    •  /