Abo
  • Services:

Texterkennung

Google Docs mit OCR

Google hat in seiner Onlinetextverarbeitung "Texte & Tabellen" (Google Docs) nun eine Funktion freigeschaltet, mit der Texte aus hochgeladenen Bildern und PDFs erkannt und in editierbaren Text umgewandelt werden.

Artikel veröffentlicht am ,
Texterkennung: Google Docs mit OCR

Im Uploaddialog hat der Anwender nun die Wahl, Texte aus PDFs und Bilddateien in "Google Texte & Tabellen"-Dokumente zu konvertieren. Das Google-Docs-API unterstützt die optische Zeichenerkennung (OCR) seit Anfang Oktober 2009. Bei Google Docs selbst war die Texterkennung bislang nur als experimentelle Funktion verfügbar. Programmierer können die Funktion nutzen, um gescannte Texte per Upload zu Google direkt in die Onlinetextverarbeitung zu importieren. Dies nutzt zum Beispiel der FTP-Client Cyberduck für Mac OS X.

Stellenmarkt
  1. Lidl Dienstleistung GmbH & Co. KG, Neckarsulm
  2. Viega Holding GmbH & Co. KG, Attendorn

Google unterstützt Uploads als JPEGs, PNGs, GIFs und PDFs mit Bildern. Letztere werden häufig von Multifunktionsgeräten und Scannern bereitgestellt. Sie sind ohne Texterkennung jedoch nicht durchsuchbar. Die Texterkennung bei Google Docs läuft mittlerweile in wenigen Minuten durch.

Ein Buchstabe sollte nach Angaben von Google mindestens 10 Pixel hoch sein - und die Bilder möglichst schwarz-weiß oder in Graustufen vorliegen. Höhere Erkennungsraten konnte Golem.de bei kontrastreichen Scans erzielen. Als Auflösung haben sich 200 dpi als durchaus brauchbar erwiesen. Die Erkennungsraten sind selbst bei guten Vorlagen allerdings nur durchschnittlich.



Anzeige
Blu-ray-Angebote
  1. (2 Monate Sky Ticket für nur 4,99€)
  2. (nur für Prime-Mitglieder)

majcho 23. Jun 2010

Wie hoch ist die Erkennungsrate im Gegensatz zu Abby oder Omnipage? Wenn das Produkt...

Flasher10.1 23. Jun 2010

Ja, und eigentlich erkennt Google den Text komplett! Aber politisch nicht korrekte Texte...

Kallo 23. Jun 2010

Du hast den OCR Service noch nicht ausprobiert oder? Selbst normale Scans von...


Folgen Sie uns
       


Nintendo E3 2018 Direct - Golem.de Live

Wir zeigen uns enttäuscht von fehlenden Infos zu Metroid 4, erfreut vom neuen Super Smash und entzückt vom neuen Fire Emblem.

Nintendo E3 2018 Direct - Golem.de Live Video aufrufen
Automatisiertes Fahren: Der schwierige Weg in den selbstfahrenden Stau
Automatisiertes Fahren
Der schwierige Weg in den selbstfahrenden Stau

Der Staupilot im neuen Audi A8 soll der erste Schritt auf dem Weg zum hochautomatisierten Fahren sein. Doch die Verhandlungen darüber, was solche Autos können müssen, sind sehr kompliziert. Und die Tests stellen Audi vor große Herausforderungen.
Ein Bericht von Friedhelm Greis

  1. Nach tödlichem Unfall Uber entlässt 100 Testfahrer für autonome Autos
  2. Autonomes Fahren Daimler und Bosch testen fahrerlose Flotte im Silicon Valley
  3. Kooperationen vereinbart Deutschland setzt beim Auto der Zukunft auf China

Smartphone von Gigaset: Made in Bocholt
Smartphone von Gigaset
Made in Bocholt

Gigaset baut sein Smartphone GS185 in Bocholt - und verpasst dem Gerät trotz kompletter Anlieferung von Teilen aus China das Label "Made in Germany". Der Fokus auf die Region ist aber vorhanden, eine erweiterte Fertigung durchaus eine Option. Wir haben uns das Werk angeschaut.
Ein Bericht von Tobias Költzsch

  1. Bocholt Gigaset baut Smartphone in Deutschland

Krankenversicherung: Der Papierkrieg geht weiter
Krankenversicherung
Der Papierkrieg geht weiter

Die Krankenversicherung der Zukunft wird digital und direkt, aber eine tiefgreifende Disruption des Gesundheitswesens à la Amazon wird in Deutschland wohl ausbleiben. Die Beharrungskräfte sind zu groß.
Eine Analyse von Daniel Fallenstein

  1. Imagen Tech KI-System Osteodetect erkennt Knochenbrüche
  2. Medizintechnik Implantat wird per Ultraschall programmiert
  3. Telemedizin Neue Patienten für die Onlinepraxis

    •  /