Anzeige
Texterkennung: Google Docs mit OCR

Texterkennung

Google Docs mit OCR

Google hat in seiner Onlinetextverarbeitung "Texte & Tabellen" (Google Docs) nun eine Funktion freigeschaltet, mit der Texte aus hochgeladenen Bildern und PDFs erkannt und in editierbaren Text umgewandelt werden.

Im Uploaddialog hat der Anwender nun die Wahl, Texte aus PDFs und Bilddateien in "Google Texte & Tabellen"-Dokumente zu konvertieren. Das Google-Docs-API unterstützt die optische Zeichenerkennung (OCR) seit Anfang Oktober 2009. Bei Google Docs selbst war die Texterkennung bislang nur als experimentelle Funktion verfügbar. Programmierer können die Funktion nutzen, um gescannte Texte per Upload zu Google direkt in die Onlinetextverarbeitung zu importieren. Dies nutzt zum Beispiel der FTP-Client Cyberduck für Mac OS X.

Anzeige

Google unterstützt Uploads als JPEGs, PNGs, GIFs und PDFs mit Bildern. Letztere werden häufig von Multifunktionsgeräten und Scannern bereitgestellt. Sie sind ohne Texterkennung jedoch nicht durchsuchbar. Die Texterkennung bei Google Docs läuft mittlerweile in wenigen Minuten durch.

Ein Buchstabe sollte nach Angaben von Google mindestens 10 Pixel hoch sein - und die Bilder möglichst schwarz-weiß oder in Graustufen vorliegen. Höhere Erkennungsraten konnte Golem.de bei kontrastreichen Scans erzielen. Als Auflösung haben sich 200 dpi als durchaus brauchbar erwiesen. Die Erkennungsraten sind selbst bei guten Vorlagen allerdings nur durchschnittlich.


eye home zur Startseite
majcho 23. Jun 2010

Wie hoch ist die Erkennungsrate im Gegensatz zu Abby oder Omnipage? Wenn das Produkt...

Flasher10.1 23. Jun 2010

Ja, und eigentlich erkennt Google den Text komplett! Aber politisch nicht korrekte Texte...

Kallo 23. Jun 2010

Du hast den OCR Service noch nicht ausprobiert oder? Selbst normale Scans von...



Anzeige

Stellenmarkt
  1. MESSTEC Power Converter GmbH, Penzberg
  2. medizinfuchs GmbH, Berlin
  3. Robert Bosch GmbH, Abstatt
  4. WITZENMANN GmbH, Pforzheim


Anzeige
Spiele-Angebote
  1. 59,99€ (Vorbesteller-Preisgarantie)
  2. 49,99€ (Vorbesteller-Preisgarantie)
  3. 49,99€

Folgen Sie uns
       


  1. Layer-2-Bitstrom

    Bundesagentur fordert 100-MBit/s-Zugang für 19 Euro

  2. Thomson Reuters

    Terrordatenbank World-Check im Netz zu finden

  3. Linux-Distribution

    Ubuntu diskutiert Ende der 32-Bit-Unterstützung

  4. Anrufweiterschaltung

    Bundesnetzagentur schaltet falsche Ortsnetznummern ab

  5. Radeon RX 480 im Test

    Eine bessere Grafikkarte gibt es für den Preis nicht

  6. Overwatch

    Ranglistenspiele mit kleinen Hindernissen

  7. Fraunhofer SIT

    Volksverschlüsselung startet ohne Quellcode

  8. Axon 7 im Hands on

    Oneplus bekommt starke Konkurrenz

  9. Brexit

    Vodafone prüft Umzug des Konzernsitzes aus UK

  10. Patent

    Apple will Konzertaufnahmen verhindern



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Oneplus Three im Test: Ein Alptraum für die Android-Konkurrenz
Oneplus Three im Test
Ein Alptraum für die Android-Konkurrenz
  1. Android-Smartphone Diskussionen um Speichermanagement beim Oneplus Three
  2. Smartphones Oneplus soll keine günstigeren Modellreihen mehr planen
  3. Ohne Einladung Oneplus Three kommt mit 6 GByte RAM für 400 Euro

Mikko Hypponen: "Microsoft ist nicht mehr scheiße"
Mikko Hypponen
"Microsoft ist nicht mehr scheiße"

Prozessor: Den einen Core M gibt es nicht
Prozessor
Den einen Core M gibt es nicht
  1. Elitebook 1030 G1 HPs Core-M-Notebook soll 13 Stunden durchhalten

  1. Re: An alle die wegen PCI nun verunsichert sind

    Carlo Escobar | 21:49

  2. Re: Probleme mit Win10

    Opferwurst | 21:41

  3. Totgeburt

    pointX | 21:40

  4. Re: Das Risiko ist sehr gering

    Moe479 | 21:35

  5. Re: Amazon ist sehr Kulant!

    kommentar4711 | 21:35


  1. 18:14

  2. 18:02

  3. 16:05

  4. 15:12

  5. 15:00

  6. 14:45

  7. 14:18

  8. 12:11


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel