Original-URL des Artikels: https://www.golem.de/0710/55596.html    Veröffentlicht: 24.10.2007 11:10    Kurz-URL: https://glm.io/55596

Freie Texterkennung OCropus in erster Alpha veröffentlicht

Beta-Version ist für das erste Quartal 2008 geplant

Die freie Texterkennungssoftware OCropus wurde in einer ersten Alpha-Version veröffentlicht, die einige neue Funktionen enthält. Die Software wird von der Arbeitsgruppe "Bildverstehen und Mustererkennung" am Deutschen Forschungszentrum für künstliche Intelligenz im Auftrag von Google entwickelt.

OCropus kann in der Version 0.1 in eingescannten Dokumenten Bilder und Texte voneinander trennen und bringt verbesserte Testwerkzeuge mit. Zudem werden nun mehr Informationen zum Dokumentenlayout angezeigt. Darüber hinaus überarbeiteten die Entwickler ihren Quelltext, so dass dieser nun ordentlicher aufgebaut sein soll. Die Konfiguration und Skriptsteuerung erfolgt nun mit Lua.

Die Version 0.1 von OCropus lässt sich ab sofort bei Google Code herunterladen. Während die Version 0.1 weiter gepflegt wird, gelangen neue Entwicklungen ab sofort in die Version 0.2. Das Ergebnis soll die erste Beta-Version sein, die im ersten Quartal 2008 erwartet wird. Nützliche neue Funktionen werden unter Umständen auf die Version 0.1 zurückportiert.

Das Projekt OCropus soll letztlich zu einer OCR-Software zur Dokumentenerfassung, für elektronische Bibliotheken, zur Unterstützung von Sehbehinderten sowie zur Analyse historischer Dokumente führen. Es basiert auf Tesseract und einer Methode zur Layout-Analyse. Die Software wird unter der Apache-Lizenz 2.0 veröffentlicht.  (js)


Verwandte Artikel:
OCRopus: Deutsche Forscher entwickeln freie OCRs für Google   
(10.04.2007, https://glm.io/51573 )
Freie OCR-Software von Google   
(05.09.2006, https://glm.io/47595 )
Freie Formularerkennung veröffentlicht   
(03.08.2007, https://glm.io/53899 )
Maschinelles Lernen: RCN erkennt zwei Drittel aller Recaptchas automatisch   
(30.10.2017, https://glm.io/130884 )
Mobiltelefone und PDAs lernen lesen   
(18.05.2006, https://glm.io/45418 )

Links zum Artikel:
OCRopus (.com): http://code.google.com/p/ocropus/

© 1997–2020 Golem.de, https://www.golem.de/