Abo
  • Services:

Freie Texterkennung erzeugt durchsuchbare PDF-Dateien

Archivierungssoftware ArchivistaBox 2008/IX veröffentlicht

Die Schweizer Firma Archivista hat die neue Version ihrer webbasierten Open-Source-Archivierungslösung "ArchivistaBox" veröffentlicht. Die neue Version kann durchsuchbare PDF-Dateien erzeugen.

Artikel veröffentlicht am , Julius Stiebert

ArchivistaBox ist eine Open-Source-Archivierungslösung, die Funktionen wie verlustfreies Drehen von JPEG-Bildern unterstützt und über einen Ajax-Webclient bedient wird. Die Bilddaten berechnet die Software für die Bildschirmgröße neu und gibt Schwarz-Weiß-TIFF-Bilder als 2-Bit-Graustufenbilder im PNG-Format aus, da nach Aussage von Archivista aktuelle Browser Schwarz-Weiß-Bilder nicht optimal darstellen. Schon länger gehört auch eine freie Texterkennung zum Umfang der Software.

Stellenmarkt
  1. über duerenhoff GmbH, Raum Iserlohn
  2. DATAGROUP Köln GmbH, Köln

Die neue Version 2008/IX kann gescannte Seiten nun in durchsuchbare PDF-Dateien exportieren. Mehr als 20 Sprachen werden unterstützt. Nach Angaben von Archivista soll die Erkennungsquote über 99 Prozent liegen.

Die erzeugten PDF-Dateien legt die Software direkt in einer Datenbank ab und versieht sie mit Schlagworten. So lässt sich im Dokumentenbestand suchen. Die Dokumente lassen sich über den Browser abrufen, wobei Daten auch verschlüsselt werden können.

Die ArchivistaBox wird unter der GPLv2 veröffentlicht. Die Texterkennung übernehmen Tesseract (Apache-Lizenz) oder Cuneiform (BSD-Lizenz). Die PDF-Dateien werden mit hocr2pdf von Exactcode erzeugt. Die 700 MByte große Installations-CD steht bei Sourceforge zum Download bereit.



Anzeige
Hardware-Angebote
  1. auf ausgewählte Corsair-Netzteile
  2. (reduzierte Überstände, Restposten & Co.)

Texter 22. Sep 2008

Wozu andere freie OCR Software? Funktioniert die Vorgestellte nicht so wie du sie brauchst?

Krczmrtr 22. Sep 2008

Die Angabe ist sowieso ziemlich vage. Es könnte ebenso gut "jedes hundertste Wort wird...

archinutzer 20. Sep 2008

Als Server steckt heute aber Hi Urs, das meinte ich, früher lief der Server ja lokal auf...


Folgen Sie uns
       


Sonos Beam im Hands on

Beam ist Sonos' erste smarte Soundbar und läuft mit Amazons Alexa. Im Zusammenspiel mit einem Fire-TV-Gerät kann dieses bequem mit Beam mit der Stimme bedient werden. Die Beam-Soundbar von Sonos kostet 450 Euro und soll am 17. Juli 2018 erscheinen.

Sonos Beam im Hands on Video aufrufen
Windenergie: Wie umweltfreundlich sind Offshore-Windparks?
Windenergie
Wie umweltfreundlich sind Offshore-Windparks?

Windturbinen auf hoher See liefern verlässlich grünen Strom. Frei von Umwelteinflüssen sind sie aber nicht. Während die eine Tierart profitiert, leidet die andere. Doch Abhilfe ist in Sicht.
Ein Bericht von Daniel Hautmann

  1. Hywind Scotland Windkraft Ahoi

KI in der Medizin: Keine Angst vor Dr. Future
KI in der Medizin
Keine Angst vor Dr. Future

Mit Hilfe künstlicher Intelligenz können schwer erkennbare Krankheiten früher diagnostiziert und behandelt werden, doch bei Patienten löst die Technik oft Unbehagen aus. Und das ist nicht das einzige Problem.
Ein Bericht von Tim Kröplin

  1. Medizintechnik Künstliche Intelligenz erschnüffelt Krankheiten
  2. Dota 2 128.000 CPU-Kerne schlagen fünf menschliche Helden
  3. KI-Bundesverband Deutschland soll mehr für KI-Forschung tun

Segelschiff: Das Vindskip steckt in der Flaute
Segelschiff
Das Vindskip steckt in der Flaute

Hochseeschiffe gelten als große Umweltverschmutzer. Neue saubere Antriebe sind gefragt. Der Norweger Terje Lade hat ein futuristisches Segelschiff entwickelt. Doch solch ein neuartiges Konzept umzusetzen, ist nicht so einfach.
Ein Bericht von Werner Pluta

  1. Energy Observer Toyota unterstützt Weltumrundung von Brennstoffzellenschiff
  2. Hyseas III Schottische Werft baut Hochseefähre mit Brennstoffzelle
  3. Kreuzschifffahrt Wie Brennstoffzellen Schiffe sauberer machen

    •  /