Freie Formularerkennung veröffentlicht

Archivierungssoftware ArchivistaBox 2007/VIII mit Open-Source-Texterkennung

Die Schweizer Firma Archivista hat die neue Version ihrer Web-basierten Open-Source-Archivierungslösung "ArchivistaBox" veröffentlicht. Mit einer neuen Logoerkennung sollen sich Formulare einlesen lassen.

Artikel veröffentlicht am , Julius Stiebert

ArchivistaBox ist eine Open-Source-Archivierungslösung, die Funktionen wie verlustfreies Drehen von JPEG-Bildern unterstützt und über einen Ajax-Webclient bedient wird. Die Bilddaten berechnet die Software für die Bildschirmgröße neu und gibt Schwarz/Weiß-TIFF-Bilder als 2-Bit-Graustufenbilder im PNG-Format aus, da nach Aussage von Archivista aktuelle Browser Schwarz-Weiß-Bilder nicht optimal darstellen.

Stellenmarkt
  1. IT Business Partner (m/w/d)
    Energiedienst Holding AG, Rheinfelden (Baden)
  2. IT CustomerCare First Level Agent *
    DAW SE, Ober-Ramstadt bei Darmstadt
Detailsuche

Die neue Version 2007/VIII bringt als Alternative zu Finereader - der einzig proprietären Komponente des Systems - nun auch zwei freie Texterkennungssysteme mit. Ocrad ist in der Version 0.17 enthalten, Tesseract in der Version 2.0, die beide auch Sonderzeichen mitteleuropäischer Sprachen erkennen. Bei "normaler" Korrespondenz sollen die beiden Systeme bereits gute Ergebnisse liefern.

An Finereader kommen sie jedoch noch nicht heran, hier spricht der Anbieter von einer Erkennungsrate von über 99,99 Prozent bei Formularen. Für die Formularerkennung wurde eine Logoerkennung integriert um beispielsweise Eingangsrechnungen geradezustellen. Somit können die gewünschten Informationen wie Adresse und Rechnungsnummer millimetergenau gefunden werden.

Neu ist außerdem die Möglichkeit Bilder von USB-Speichern zu importieren, so dass Fotos direkt von Digitalkameras in das Archiv übernommen werden können. Archivista verspricht, dass mit Kameras ab 7 Megapixeln fotografierte A4-Seiten von der Texterkennung bearbeitet werden können, bei Kameras ab 10 Megapixeln soll dies auch mit Zeitungsseiten funktionieren.

Die mit Ausnahme des Finereaders unter der GPL lizenzierte Software steht ab sofort als ISO-Image zum Download bereit. Dabei läuft ArchivistaBox auf dem Linux-System T2. Das CD-Image lässt sich sowohl als Installations- als auch als Live-CD verwenden. Digitalkameras, SANE-kompatible Scanner sowie Digitalkopierer (FTP-Scanner) können als Endgeräte verwendet werden. Für die Nutzung von Archivista soll ein Pentium-III-System ausreichen.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


OhneNomenKeinOmen 05. Aug 2007

Es reicht schon Markenähnlichkeit. OrCAD gekauft von Cadence, um seinen Marktanteil im...

Tippse 03. Aug 2007

...das ist ja 'mal wieder super konstruktiv! Tippse.



Aktuell auf der Startseite von Golem.de
Google
Neues Pixel 6 kostet 650 Euro

Das Pixel 6 Pro mit Telekamera und schnellerem Display kostet ab 900 Euro. Google verbaut erstmals einen eigenen Prozessor.

Google: Neues Pixel 6 kostet 650 Euro
Artikel
  1. M1 Pro/Max: Dieses Apple Silicon ist gigantisch
    M1 Pro/Max
    Dieses Apple Silicon ist gigantisch

    Egal ob AMD-, Intel- oder Nvidia-Hardware: Mit dem M1 Pro und dem M1 Max schickt sich Apple an, die versammelte Konkurrenz zu düpieren.
    Eine Analyse von Marc Sauter

  2. Klimaforscher: Das Konzept der Klimaneutralität ist eine gefährliche Falle
    Klimaforscher
    Das Konzept der Klimaneutralität ist eine gefährliche Falle

    Mit der Entnahme von CO2 in den nächsten Jahrzehnten netto auf null Emissionen zu kommen, klingt nach einer guten Idee. Ist es aber nicht, sagen Klimaforscher.
    Von James Dyke, Robert Watson und Wolfgang Knorr

  3. Kalter Krieg 2.0?: Die Aufregung um Chinas angebliche Hyperschallwaffe
    Kalter Krieg 2.0?
    Die Aufregung um Chinas angebliche Hyperschallwaffe

    Die Volksrepublik China soll eine Hyperschallwaffe getestet haben. China dementiert die Vorwürfe aber und sagt, es wäre ein Raumschiff gewesen.
    Eine Analyse von Patrick Klapetz

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Cyber Week: Bis zu 16% auf SSDs & RAM von Adata & bis zu 30% auf Alternate • 3 Spiele für 49€: PC, PS5 uvm. • Switch OLED 369,99€ • 6 Blu-rays für 40€ • MSI 27" Curved WQHD 165Hz HDR 479€ • Chromebooks zu Bestpreisen • Alternate (u. a. Team Group PCIe-4.0-SSD 1TB 152,90€) [Werbung]
    •  /