Texterkennung

Google Docs mit OCR

Google hat in seiner Onlinetextverarbeitung "Texte & Tabellen" (Google Docs) nun eine Funktion freigeschaltet, mit der Texte aus hochgeladenen Bildern und PDFs erkannt und in editierbaren Text umgewandelt werden.

Artikel veröffentlicht am ,
Texterkennung: Google Docs mit OCR

Im Uploaddialog hat der Anwender nun die Wahl, Texte aus PDFs und Bilddateien in "Google Texte & Tabellen"-Dokumente zu konvertieren. Das Google-Docs-API unterstützt die optische Zeichenerkennung (OCR) seit Anfang Oktober 2009. Bei Google Docs selbst war die Texterkennung bislang nur als experimentelle Funktion verfügbar. Programmierer können die Funktion nutzen, um gescannte Texte per Upload zu Google direkt in die Onlinetextverarbeitung zu importieren. Dies nutzt zum Beispiel der FTP-Client Cyberduck für Mac OS X.

Google unterstützt Uploads als JPEGs, PNGs, GIFs und PDFs mit Bildern. Letztere werden häufig von Multifunktionsgeräten und Scannern bereitgestellt. Sie sind ohne Texterkennung jedoch nicht durchsuchbar. Die Texterkennung bei Google Docs läuft mittlerweile in wenigen Minuten durch.

Ein Buchstabe sollte nach Angaben von Google mindestens 10 Pixel hoch sein - und die Bilder möglichst schwarz-weiß oder in Graustufen vorliegen. Höhere Erkennungsraten konnte Golem.de bei kontrastreichen Scans erzielen. Als Auflösung haben sich 200 dpi als durchaus brauchbar erwiesen. Die Erkennungsraten sind selbst bei guten Vorlagen allerdings nur durchschnittlich.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


majcho 23. Jun 2010

Wie hoch ist die Erkennungsrate im Gegensatz zu Abby oder Omnipage? Wenn das Produkt...

Flasher10.1 23. Jun 2010

Ja, und eigentlich erkennt Google den Text komplett! Aber politisch nicht korrekte Texte...

Kallo 23. Jun 2010

Du hast den OCR Service noch nicht ausprobiert oder? Selbst normale Scans von...



Aktuell auf der Startseite von Golem.de
25 Jahre Starship Troopers
Paul Verhoevens missverstandene Satire

Als Starship Troopers in die Kinos kam, wurde ihm faschistoides Gedankengut unterstellt. Dabei ist der Film des Niederländers Paul Verhoeven eine beißende Satire.
Von Peter Osteried

25 Jahre Starship Troopers: Paul Verhoevens missverstandene Satire
Artikel
  1. Cyber Resilience Act: Große Auswirkungen auf Open Source befürchtet
    Cyber Resilience Act
    Große Auswirkungen auf Open Source befürchtet

    Aus vielen größeren Projekten mehren sich die Stimmen, die in dem EU-Vorschlag für sicherere Hard- und Softwareprodukte eine Gefahr für Open Source sehen.
    Von Boris Mayer

  2. Sichergestellte Kryptowährung: Mehr beschlagnahmte Bitcoin bringen Land weniger Geld ein
    Sichergestellte Kryptowährung
    Mehr beschlagnahmte Bitcoin bringen Land weniger Geld ein

    Das niedersächische Justizministerium hat mitgeteilt, wie viel Kryptowährung 2022 sichergestellt wurde. 2021 floss noch eine halbe Millionen Euro mehr in die Staatskasse.

  3. Amazon: Höherer Mindestbestellwert für versandkostenfreie Lieferung
    Amazon
    Höherer Mindestbestellwert für versandkostenfreie Lieferung

    Unverändert lässt Amazon die Versandkosten, wenn der Mindestbestellwert für versandkostenfreie Lieferungen nicht erreicht wird.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • MindStar-Tiefstpreise: MSI RTX 4090 Gaming X Trio 1.982€, Sapphire RX 7900 XT Gaming 939€ • Asus Gaming-Laptops bis -25% • Kingston NV2 2TB 112,90€ • WSV bei MediaMarkt • XIAOMI Watch S1 149€ [Werbung]
    •  /