Freie Texterkennung OCropus in erster Alpha veröffentlicht

Beta-Version ist für das erste Quartal 2008 geplant

Die freie Texterkennungssoftware OCropus wurde in einer ersten Alpha-Version veröffentlicht, die einige neue Funktionen enthält. Die Software wird von der Arbeitsgruppe "Bildverstehen und Mustererkennung" am Deutschen Forschungszentrum für künstliche Intelligenz im Auftrag von Google entwickelt.

Artikel veröffentlicht am , Julius Stiebert

OCropus kann in der Version 0.1 in eingescannten Dokumenten Bilder und Texte voneinander trennen und bringt verbesserte Testwerkzeuge mit. Zudem werden nun mehr Informationen zum Dokumentenlayout angezeigt. Darüber hinaus überarbeiteten die Entwickler ihren Quelltext, so dass dieser nun ordentlicher aufgebaut sein soll. Die Konfiguration und Skriptsteuerung erfolgt nun mit Lua.

Stellenmarkt
  1. IT-Service-Spezialist*in / Software-Entwickler*in (m/w/d) für den Applikationsbereich Soziales
    Landschaftsverband Rheinland, Köln
  2. IT Service Manager (m/w/d)
    8com GmbH & Co. KG., Neustadt
Detailsuche

Die Version 0.1 von OCropus lässt sich ab sofort bei Google Code herunterladen. Während die Version 0.1 weiter gepflegt wird, gelangen neue Entwicklungen ab sofort in die Version 0.2. Das Ergebnis soll die erste Beta-Version sein, die im ersten Quartal 2008 erwartet wird. Nützliche neue Funktionen werden unter Umständen auf die Version 0.1 zurückportiert.

Das Projekt OCropus soll letztlich zu einer OCR-Software zur Dokumentenerfassung, für elektronische Bibliotheken, zur Unterstützung von Sehbehinderten sowie zur Analyse historischer Dokumente führen. Es basiert auf Tesseract und einer Methode zur Layout-Analyse. Die Software wird unter der Apache-Lizenz 2.0 veröffentlicht.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Christ Of Steel 24. Okt 2007

Steppenwolf 24. Okt 2007

... naja, unter Windows würde auch niemand auf die Idee kommen, dieses Programm zu...

7bf 24. Okt 2007

bei meinen Texten war die Erkennungsrate recht hoch, allerdings hab ich auch nur schnell...



Aktuell auf der Startseite von Golem.de
Liberty Lifter
US-Militär lässt ein eigenes Ekranoplan entwickeln

In den 1960er Jahren schockten die Sowjets den Westen mit dem Kaspischen Seemonster. Die Darpa will ein eigenes, besseres Bodeneffektfahrzeug bauen.

Liberty Lifter: US-Militär lässt ein eigenes Ekranoplan entwickeln
Artikel
  1. Abo: Spielebranche streitet über Game Pass
    Abo
    Spielebranche streitet über Game Pass

    Nach Kritik von Sony gibt es mehr Stimmen aus der Spielebranche, die Game Pass problematisch finden - aber auch klares Lob für das Abo.

  2. Microsoft: Der Android-App-Store für Windows 11 kommt nach Deutschland
    Microsoft
    Der Android-App-Store für Windows 11 kommt nach Deutschland

    Build 2022 Der Microsoft Store soll noch attraktiver werden. So können Kunden ihre Apps künftig ohne lange Wartezeiten direkt veröffentlichen.

  3. Macht mich einfach wahnsinnig: Kelber beklagt digitale Inkompetenz von VW
    "Macht mich einfach wahnsinnig"
    Kelber beklagt digitale Inkompetenz von VW

    Der Bundesdatenschutzbeauftragte Ulrich Kelber hat vor einem Jahr ein Elektroauto bei VW bestellt. Und seitdem nichts mehr davon gehört.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • PS5-Controller (alle Farben) günstig wie nie: 49,99€ • Samsung SSD 1TB 79€ • LG OLED TV 77" 56% günstiger: 1.099€ • Alternate (u. a. Cooler Master Curved Gaming-Monitor 34" UWQHD 144 Hz 459€) • Sony-Fernseher bis zu 47% günstiger • Samsung schenkt 19% MwSt.[Werbung]
    •  /