Abo
  • Services:
Anzeige

OCRopus: Deutsche Forscher entwickeln freie OCRs für Google

Software basiert unter anderem auf Tesseract

Im Auftrag von Google arbeitet die Arbeitsgruppe "Bildverstehen und Mustererkennung" um Prof. Dr. Thomas Breuel am Deutschen Forschungszentrum für künstliche Intelligenz an einem neuen OCR-System. Nun wurde eine erste Vorabversion der OCRopus genannten Texterkennung veröffentlicht. Auch eine Desktop-Applikation auf Basis von OCRopus ist geplant.

Ziel des Projekts OCRopus ist es, eine OCR-Software zur Dokumentenerfassung, für elektronische Bibliotheken, zur Unterstützung von Sehbehinderten sowie zur Analyse historischer Dokumente zu schaffen. Zudem soll die Software für den gewöhnlichen Desktop-Einsatz geeignet sein und sich leicht von anderen Wissenschaftlern für ihre Zwecke anpassen lassen.

Anzeige

Die OCRopus-Engine basiert dabei auf zwei Forschungsprojekten: zum einen auf der Handschriften-Erkennung Tesseract, die Mitte der 90er-Jahre entwickelt und vom US Census Bureau (Statisitkamt) genutzt wurde. Google hatte die Software im September 2006 bereits als Open Source freigegeben. Zum anderen kommt eine recht leistungsfähige Methode zur Layout-Analyse zum Einsatz, kann Tesseract das Layout von Dokumenten doch nicht analysieren.

Das OCRopus-Projekt soll über drei Jahre laufen und drei Doktoranden finanzieren. Eine Vorabversion der Software steht via SVN zum Download bereit, allerdings nur für Dokumente in englischer Sprache. Lizenziert ist sie unter der Apache-Lizenz in der Version 2.0. Entwickelt wird die Software zunächst unter Ubuntu Linux, sollte aber auch auf anderen Linux-Distributionen nutzbar sein.

Künftig sollen weitere Sprachen unterstützt und zusätzliche Zeichenerkennungssysteme integriert werden. Zudem soll es eine Desktop-Applikation für Gnome geben und die Texterkennung in die Desktop-Suche von Gnome integriert werden. Google verspricht, diese Arbeiten auch weiterhin als Open Source zur Verfügung zu stellen.


eye home zur Startseite
Kleinkind 23. Mai 2007

Ja, selbstverständlich sind Computerspiele nur für Jungendlich unter 16 Jahren zu...

Markus Reger 10. Apr 2007

Google gibt Geld für die deutsche Forschung und finanziert ein open source Projekt, das...



Anzeige

Stellenmarkt
  1. STIEBEL ELTRON GmbH & Co. KG, Holzminden
  2. LuK GmbH & Co. KG, Bühl
  3. AWEK GmbH, Barsbüttel, später Hamburg
  4. ROHDE & SCHWARZ SIT GmbH, Stuttgart


Anzeige
Top-Angebote
  1. 129,99€ (219,98€ für zwei)
  2. 49,99€ + 5,99€ Versand (Vergleichspreis 65,87€)

Folgen Sie uns
       


  1. Facebook Messenger

    Bug lässt iPhone-Nutzer nur wenige Wörter tippen

  2. Multi-Shot-Kamera

    Hasselblad macht 400-Megapixel-Fotos mit 2,4 GByte Größe

  3. Mitsubishi

    Rückkamera identifiziert Verkehrsteilnehmer

  4. Otherside Entertainment

    Underworld Ascendant soll mehr Licht ins Dunkle bringen

  5. Meltdown und Spectre

    "Dann sind wir performancemäßig wieder am Ende der 90er"

  6. Google Play Services

    Update gegen Chromecast-WLAN-Blockade kommt bald

  7. Cars 3 und Coco in HDR

    Die ersten Pixar-Filme kommen als Ultra-HD-Blu-ray

  8. Überwachungstechnik

    EU-Parlament fordert schärfere Ausfuhrregeln

  9. Loki

    App zeigt Inhalte je nach Stimmung des Nutzers an

  10. Spielebranche

    Fox kündigt Studiokauf und Alien-MMORPG an



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Security: Das Jahr, in dem die Firmware brach
Security
Das Jahr, in dem die Firmware brach
  1. Wallet Programmierbare Kreditkarte mit ePaper, Akku und Mobilfunk
  2. Fehlalarm Falsche Raketenwarnung verunsichert Hawaii
  3. Asynchronous Ratcheting Tree Facebook demonstriert sicheren Gruppenchat für Apps

Computerforschung: Quantencomputer aus Silizium werden realistisch
Computerforschung
Quantencomputer aus Silizium werden realistisch
  1. Tangle Lake Intel zeigt 49-Qubit-Chip
  2. Die Woche im Video Alles kaputt
  3. Q# und QDK Microsoft veröffentlicht Entwicklungskit für Quantenrechner

Netzsperren: Wie Katalonien die spanische Internetzensur austrickste
Netzsperren
Wie Katalonien die spanische Internetzensur austrickste

  1. Re: Bin seit 2006 dabei

    M.P. | 14:38

  2. Re: Als einziger Hersteller von Smartphones hat...

    lottikarotti | 14:36

  3. Antivirussoftware

    mrgenie | 14:34

  4. was wurde seit Ende der 90er schon besser

    Hackfleisch | 14:34

  5. Re: Verstehe ich nicht

    ecv | 14:33


  1. 13:15

  2. 13:00

  3. 12:45

  4. 12:30

  5. 12:00

  6. 11:58

  7. 11:48

  8. 11:27


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel