Texterkennung

Google Docs mit OCR

Google hat in seiner Onlinetextverarbeitung "Texte & Tabellen" (Google Docs) nun eine Funktion freigeschaltet, mit der Texte aus hochgeladenen Bildern und PDFs erkannt und in editierbaren Text umgewandelt werden.

Artikel veröffentlicht am ,
Texterkennung: Google Docs mit OCR

Im Uploaddialog hat der Anwender nun die Wahl, Texte aus PDFs und Bilddateien in "Google Texte & Tabellen"-Dokumente zu konvertieren. Das Google-Docs-API unterstützt die optische Zeichenerkennung (OCR) seit Anfang Oktober 2009. Bei Google Docs selbst war die Texterkennung bislang nur als experimentelle Funktion verfügbar. Programmierer können die Funktion nutzen, um gescannte Texte per Upload zu Google direkt in die Onlinetextverarbeitung zu importieren. Dies nutzt zum Beispiel der FTP-Client Cyberduck für Mac OS X.

Stellenmarkt
  1. IT Spezialist (m/w/d) für den 1st Level Support
    Modis IT Outsourcing GmbH, Erfurt, Leipzig (Home-Office)
  2. Product Owner (m/w/d) Software
    LayTec AG, Berlin
Detailsuche

Google unterstützt Uploads als JPEGs, PNGs, GIFs und PDFs mit Bildern. Letztere werden häufig von Multifunktionsgeräten und Scannern bereitgestellt. Sie sind ohne Texterkennung jedoch nicht durchsuchbar. Die Texterkennung bei Google Docs läuft mittlerweile in wenigen Minuten durch.

Ein Buchstabe sollte nach Angaben von Google mindestens 10 Pixel hoch sein - und die Bilder möglichst schwarz-weiß oder in Graustufen vorliegen. Höhere Erkennungsraten konnte Golem.de bei kontrastreichen Scans erzielen. Als Auflösung haben sich 200 dpi als durchaus brauchbar erwiesen. Die Erkennungsraten sind selbst bei guten Vorlagen allerdings nur durchschnittlich.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Raspberry Pi
Mit einem DVB-T-Stick die Wetterstation retten

Was kann man machen, wenn ein Regenmesser abraucht und man nicht die komplette Wetterstation neu kaufen will? Das Zauberwort heißt SDR.
Ein Bericht von Friedhelm Greis

Raspberry Pi: Mit einem DVB-T-Stick die Wetterstation retten
Artikel
  1. Coronapandemie: 42,6 Millionen mehr digitale Impfzertifikate als Impfdosen
    Coronapandemie
    42,6 Millionen mehr digitale Impfzertifikate als Impfdosen

    Einem Medienbericht zufolge gibt es eine Lücke zwischen ausgestellten Impfnachweisen und verabreichten Dosen. Diese wird sogar noch größer.

  2. Ransomware: Qnap-NAS werden mit Zero Day angegriffen
    Ransomware
    Qnap-NAS werden mit Zero Day angegriffen

    Die Ransomware-Gruppe Deadbolt verschlüsselt NAS-Geräte von Qnap nach eigenen Angaben über eine bis dato unbekannte Sicherheitslücke.

  3. Rauchgranate: Tesla zeigt Versuch mit Biowaffen-Abwehrmodus des Model Y
    Rauchgranate
    Tesla zeigt Versuch mit Biowaffen-Abwehrmodus des Model Y

    Mit einer Rauchgranate hat Tesla den Effekt des Biowaffen-Abwehrmodus im Model Y auf die Insassen veranschaulicht.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • RX 6900 XTU 16GB 1.449€ • Intel i7 3,6Ghz 399€ • Alternate: u.a. Acer Gaming-Monitor 119,90€ • Logitech Gaming-Headset 75€ • iRobot Saugroboter ab 289,99€ • 1TB SSD PCIe 4.0 128,07€ • Razer Gaming-Tastatur 155€ • GOG New Year Sale: bis zu 90% Rabatt • LG OLED 65 Zoll 1.599€ [Werbung]
    •  /