API von Google Docs unterstützt nun OCR und Übersetzungen

Texterkennung und Übersetzungen beim Upload

Die Google Docs API unterstützt nun die optische Zeichenerkennung (OCR). Programmierer können die Funktion nutzen, um gescannte Texte per Upload zu Google direkt in die Onlinetextverarbeitung zu importieren. Auch die Übersetzungsfunktion wurde nun in die Programmierschnittstelle integriert.

Anzeige

Google hat eine Demo der OCR-Anbindung ins Netz gestellt, die die Möglichkeiten demonstrieren soll, die sich dadurch eröffnen. Der Dienst ist derzeit stark überlaufen, so dass nicht jeder Upload und jede Texterkennung glückt. Zum Ausprobieren ist ein Google Account erforderlich.

Google unterstützt Uploads als JPEGs, PNGs und GIFs. Die Auflösung sollte recht hoch sein, damit die Erkennung funktioniert. Google gab nur an, dass ein Buchstabe mindestens 10 Pixel hoch sein sollte. Die maximale Dateigröße liegt bei 10 Megabyte und die maximale Auflösung bei 25 Megapixeln. Die Erkennung dauert recht lang - ein 500-KByte-Bild benötigt rund 15 Sekunden, eine 2-Megapixel-Datei nimmt 40 Sekunden in Anspruch.

Um die Texterkennung anzusprechen, muss der Parameter "ocr=true" an den Uploadrequest angehängt werden:

POST /feeds/default/private/full?ocr=true HTTP/1.1

Außerdem hat Google die Übersetzungsfunktion in die Programmierschnittstelle eingebaut. So können Texte nach dem Upload direkt übersetzt und in Googles Texte und Tabellen eingefügt werden. Dazu müssen nur die Parameter "targetLanguage" und "sourceLanguage" an den Uploadrequest angehängt werden:

POST /feeds/default/private/full/?targetLanguage=de&sourceLanguage=en HTTP/1.1

Wird die Quellsprache nicht angegeben, versucht Google die Sprache automatisch zu erkennen. Sämtliche Sprachpaare von Google Translate werden unterstützt.

Noch sind die speziellen Uploadfunktionen nicht in Googles Text und Tabellen integriert, doch das dürfte nur eine Frage der Zeit sein. Eine ausführliche Dokumentation der neuen Funktionen hat Google online gestellt.


MovieKnight 01. Okt 2009

Naja, die erste Klammer erkennt er... Dann sollte sich der Algorithmus schon auf eine...

einer 01. Okt 2009

Und alle so Yeah!

GnickGnack 01. Okt 2009

dann mit der eigenen Google OCR knacken?? :D

mr_pain 01. Okt 2009

Oder weiss jemand welche Engine da zum Einsatz kommt?

Kommentieren




Anzeige
  1. Database Manager (m/w) im Dialogmarketing
    Teambank AG, Nürnberg
  2. Softwareentwickler (m/w) TargetLink Code-Generator
    dSPACE GmbH, Paderborn
  3. Testspezialist (m/w)
    PENTASYS AG, München und Frankfurt
  4. Webentwickler PHP / MySQL (m/w)
    Guest-One GmbH, Wuppertal

 

Detailsuche


Folgen Sie uns
       


Meistgelesen
  1. Tablet-Nachfolger

    iPad-3-Teile aufgetaucht

  2. Gema-Vermerk

    Youtube sperrt irrtümlich Acta-Video von Bruno Kramm

  3. Tim Schafer

    40.000 US-Dollar für einen Konsolenpatch

  4. ProLiant Gen8

    HP macht Server unabhängig

  5. Linux-Handbuch

    Umfassendes Nachschlagewerk als Openbook erhältlich


Meistkommentiert
  1. Kommentare: 270 | letzter Beitrag 13.02. 23:28

  2. Kommentare: 193 | letzter Beitrag 13:12 Uhr

  3. Kommentare: 184 | letzter Beitrag 13:27 Uhr

  4. Kommentare: 117 | letzter Beitrag 12:39 Uhr

  5. Kommentare: 96 | letzter Beitrag 13.02. 16:40

Mehr


  1. HTC Velocity 4G

    Android-Smartphone mit LTE und 4,5-Zoll-Touchscreen

  2. Farmville & Co.

    Patentklage gegen Zynga

  3. Document Foundation

    Libreoffice 3.5 ist fertig

  4. Pegatron

    Übt Apple Druck auf OEM-Hersteller von Ultrabooks aus?

  5. Blackhole Toolkit

    Cryptome gehackt und mit Malware infiziert

  6. Piranha Bytes

    Risen 2 geht am 20. Februar in den geschlossenen Betatest

  7. Google

    EU und USA geben Kauf von Motorola frei

  8. Watchdog

    Mozilla visualisiert Wiederverwendung von Passwörtern

  9. Apple

    Apple-Aktie erreicht neuen Höchststand

  10. SSL

    Twitter macht HTTPS zum Standard



Haben wir etwas übersehen?

E-Mail an news@golem.de


Test X-Plane 10: Flugsimulator mit Openstreetmap und vielen Rechnern
Test X-Plane 10
Flugsimulator mit Openstreetmap und vielen Rechnern

Ernsthafte Flugsimulationen gibt es kaum noch. Eine der letzten verbliebenen ist X-Plane 10 für Windows, Mac OS X und Linux. Golem.de hat sich ins virtuelle Cockpit gesetzt und den Flugsimulator mit mehreren Rechnern und iPads als Instrumente gespielt.


Paypal: Nutzern von Kino.to drohen Strafverfahren
Paypal
Nutzern von Kino.to drohen Strafverfahren

Zahlenden Nutzern der im Juni 2011 geschlossenen Filmplattform Kino.to drohen dem Nachrichtenmagazin Focus zufolge Strafverfahren. Rechtsanwalt Udo Vetter befürchtet sogar Hausdurchsuchungen, "wenn die Strafverfolger sich auf glattes Parkett begeben". Noch im Februar 2012 will die GVU zudem gegen den Kino.to-Nachfolger Kinox.to Strafanzeige erstatten.

  1. Kino.to-Prozess Kein Unterschied zwischen Streaming und Herunterladen
  2. Kino.to Drei Jahre Haft wegen Links auf illegale Filmkopien
  3. Kino.to Haftstrafe wegen gewerbsmäßiger Urheberrechtsverletzung

Test PS Vita: Ausstattungswunder mit Speicherproblem
Test PS Vita
Ausstattungswunder mit Speicherproblem

Zwei Analogsticks und starke Grafik, Berührungs- und Bewegungssteuerung, UMTS und Bluetooth: Sony Computer Entertainment packt in den Nachfolger der Playstation Portable so gut wie alles, was irgendwie Sinn ergibt - nur Speicher etwa für Savegames fehlt der PS Vita von Haus aus.

  1. Playstation Network Umbenennung der Konten und neue Firmware

Zum Artikel