Abo
  • IT-Karriere:

Freie Texterkennung erzeugt durchsuchbare PDF-Dateien

Archivierungssoftware ArchivistaBox 2008/IX veröffentlicht

Die Schweizer Firma Archivista hat die neue Version ihrer webbasierten Open-Source-Archivierungslösung "ArchivistaBox" veröffentlicht. Die neue Version kann durchsuchbare PDF-Dateien erzeugen.

Artikel veröffentlicht am , Julius Stiebert

ArchivistaBox ist eine Open-Source-Archivierungslösung, die Funktionen wie verlustfreies Drehen von JPEG-Bildern unterstützt und über einen Ajax-Webclient bedient wird. Die Bilddaten berechnet die Software für die Bildschirmgröße neu und gibt Schwarz-Weiß-TIFF-Bilder als 2-Bit-Graustufenbilder im PNG-Format aus, da nach Aussage von Archivista aktuelle Browser Schwarz-Weiß-Bilder nicht optimal darstellen. Schon länger gehört auch eine freie Texterkennung zum Umfang der Software.

Stellenmarkt
  1. Rockwell Collins Deutschland GmbH, a part of Collins Aerospace, Heidelberg
  2. IQTIG - Institut für Qualitätssicherung und Transparenz im Gesundheitswesen, Berlin Tiergarten

Die neue Version 2008/IX kann gescannte Seiten nun in durchsuchbare PDF-Dateien exportieren. Mehr als 20 Sprachen werden unterstützt. Nach Angaben von Archivista soll die Erkennungsquote über 99 Prozent liegen.

Die erzeugten PDF-Dateien legt die Software direkt in einer Datenbank ab und versieht sie mit Schlagworten. So lässt sich im Dokumentenbestand suchen. Die Dokumente lassen sich über den Browser abrufen, wobei Daten auch verschlüsselt werden können.

Die ArchivistaBox wird unter der GPLv2 veröffentlicht. Die Texterkennung übernehmen Tesseract (Apache-Lizenz) oder Cuneiform (BSD-Lizenz). Die PDF-Dateien werden mit hocr2pdf von Exactcode erzeugt. Die 700 MByte große Installations-CD steht bei Sourceforge zum Download bereit.



Anzeige
Top-Angebote
  1. (u. a. MSI MPG Z390 Gaming Edge AC für 149,90€, MSI MPG Z390 Gaming Pro Carbon AC für 180,90€)
  2. 229,00€
  3. 116,13€
  4. (u. a. Sandisk Ultra 400 GB microSDXC für 56,90€, Verbatim Pinstripe 128-GB-USB-Stick für 10...

Texter 22. Sep 2008

Wozu andere freie OCR Software? Funktioniert die Vorgestellte nicht so wie du sie brauchst?

Krczmrtr 22. Sep 2008

Die Angabe ist sowieso ziemlich vage. Es könnte ebenso gut "jedes hundertste Wort wird...

archinutzer 20. Sep 2008

Als Server steckt heute aber Hi Urs, das meinte ich, früher lief der Server ja lokal auf...


Folgen Sie uns
       


LED-Projektor Viewsonic X10-4K - Test

Der Viewsonic X10-4K ist ein heller und farbtreuer 4K-Projektor - und kann einen Smart-TV ersetzen.

LED-Projektor Viewsonic X10-4K - Test Video aufrufen
Nachhaltigkeit: Jute im Plastik
Nachhaltigkeit
Jute im Plastik

Baustoff- und Autohersteller nutzen sie zunehmend, doch etabliert sind Verbundwerkstoffe mit Naturfasern noch lange nicht. Dabei gibt es gute Gründe, sie einzusetzen, Umweltschutz ist nur einer von vielen.
Ein Bericht von Werner Pluta

  1. Nachhaltigkeit Bauen fürs Klima
  2. Autos Elektro, Brennstoffzelle oder Diesel?
  3. Energie Wo die Wasserstoffqualität getestet wird

OKR statt Mitarbeitergespräch: Wir müssen reden
OKR statt Mitarbeitergespräch
Wir müssen reden

Das jährliche Mitarbeitergespräch ist eines der wichtigsten Instrumente für Führungskräfte, doch es ist gerade in der IT-Branche nicht mehr unbedingt zeitgemäß. Aus dem Silicon Valley kommt eine andere Methode: OKR. Sie erfüllt die veränderten Anforderungen an Agilität und Veränderungsbereitschaft.
Von Markus Kammermeier

  1. IT-Arbeitsmarkt Jobgarantie gibt es nie
  2. IT-Fachkräftemangel Freie sind gefragt
  3. Sysadmin "Man kommt erst ins Spiel, wenn es brennt"

Google Maps: Karten brauchen Menschen statt Maschinen
Google Maps
Karten brauchen Menschen statt Maschinen

Wenn Karten nicht mehr von Menschen, sondern allein von Maschinen erstellt werden, erfinden diese U-Bahn-Linien, Hochhäuser im Nationalpark und unmögliche Routen. Ein kurze Liste zu den Grenzen der Automatisierung.
Von Sebastian Grüner

  1. Kartendienst Google bringt AR-Navigation und Reiseinformationen in Maps
  2. Maps Duckduckgo mit Kartendienst von Apple
  3. Google Maps zeigt Bikesharing in Berlin, Hamburg, Wien und Zürich

    •  /