• IT-Karriere:
  • Services:

Texterkennung

Google Docs mit OCR

Google hat in seiner Onlinetextverarbeitung "Texte & Tabellen" (Google Docs) nun eine Funktion freigeschaltet, mit der Texte aus hochgeladenen Bildern und PDFs erkannt und in editierbaren Text umgewandelt werden.

Artikel veröffentlicht am ,
Texterkennung: Google Docs mit OCR

Im Uploaddialog hat der Anwender nun die Wahl, Texte aus PDFs und Bilddateien in "Google Texte & Tabellen"-Dokumente zu konvertieren. Das Google-Docs-API unterstützt die optische Zeichenerkennung (OCR) seit Anfang Oktober 2009. Bei Google Docs selbst war die Texterkennung bislang nur als experimentelle Funktion verfügbar. Programmierer können die Funktion nutzen, um gescannte Texte per Upload zu Google direkt in die Onlinetextverarbeitung zu importieren. Dies nutzt zum Beispiel der FTP-Client Cyberduck für Mac OS X.

Stellenmarkt
  1. Eurowings Aviation GmbH, Köln
  2. Forschungszentrum Jülich GmbH, Jülich bei Köln

Google unterstützt Uploads als JPEGs, PNGs, GIFs und PDFs mit Bildern. Letztere werden häufig von Multifunktionsgeräten und Scannern bereitgestellt. Sie sind ohne Texterkennung jedoch nicht durchsuchbar. Die Texterkennung bei Google Docs läuft mittlerweile in wenigen Minuten durch.

Ein Buchstabe sollte nach Angaben von Google mindestens 10 Pixel hoch sein - und die Bilder möglichst schwarz-weiß oder in Graustufen vorliegen. Höhere Erkennungsraten konnte Golem.de bei kontrastreichen Scans erzielen. Als Auflösung haben sich 200 dpi als durchaus brauchbar erwiesen. Die Erkennungsraten sind selbst bei guten Vorlagen allerdings nur durchschnittlich.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Anzeige
Hardware-Angebote

majcho 23. Jun 2010

Wie hoch ist die Erkennungsrate im Gegensatz zu Abby oder Omnipage? Wenn das Produkt...

Flasher10.1 23. Jun 2010

Ja, und eigentlich erkennt Google den Text komplett! Aber politisch nicht korrekte Texte...

Kallo 23. Jun 2010

Du hast den OCR Service noch nicht ausprobiert oder? Selbst normale Scans von...


Folgen Sie uns
       


Gemanagte Netzwerke: Was eine Quasi-Virtualisierung von WANs und LANs bringt
Gemanagte Netzwerke
Was eine Quasi-Virtualisierung von WANs und LANs bringt

Cloud Managed LAN, Managed WAN Optimization, SD-WAN oder SD-LAN versprechen mehr Durchsatz, mehr Ausfallsicherheit oder weniger Datenstau.
Von Boris Mayer


    Next-Gen: Tolle Indiegames für PS5 und Xbox Series X/S
    Next-Gen
    Tolle Indiegames für PS5 und Xbox Series X/S

    Kaum ein unabhängiger Entwickler hat Dev-Kits für PS5 und Xbox Series X/S - aber The Pathinder und Falconeer sind tolle Next-Gen-Indiegames!
    Von Rainer Sigl

    1. Indiegames-Rundschau Raumschiffknacker im Orbit
    2. Rollenspiel Fans übersetzen Disco Elysium ins Deutsche
    3. Indiegames-Rundschau Einmal durchspielen in 400 Tagen

    iPhone 12 Mini im Test: Leistungsstark, hochwertig, winzig
    iPhone 12 Mini im Test
    Leistungsstark, hochwertig, winzig

    Mit dem iPhone 12 Mini komplettiert Apple seine Auswahl an aktuellen iPhones für alle Geschmäcker: Auf 5,4 Zoll sind hochwertige technischen Finessen vereint, ein besseres kleines Smartphone gibt es nicht.
    Ein Test von Tobias Költzsch

    1. Apple Bauteile des iPhone 12 kosten 313 Euro
    2. Touchscreen und Hörgeräte iOS 14.2.1 beseitigt iPhone-12-Fehler
    3. iPhone Magsafe ist nicht gleich Magsafe

      •  /