Abo
  • Services:

API von Google Docs unterstützt nun OCR und Übersetzungen

Texterkennung und Übersetzungen beim Upload

Die Google Docs API unterstützt nun die optische Zeichenerkennung (OCR). Programmierer können die Funktion nutzen, um gescannte Texte per Upload zu Google direkt in die Onlinetextverarbeitung zu importieren. Auch die Übersetzungsfunktion wurde nun in die Programmierschnittstelle integriert.

Artikel veröffentlicht am ,

Google hat eine Demo der OCR-Anbindung ins Netz gestellt, die die Möglichkeiten demonstrieren soll, die sich dadurch eröffnen. Der Dienst ist derzeit stark überlaufen, so dass nicht jeder Upload und jede Texterkennung glückt. Zum Ausprobieren ist ein Google Account erforderlich.

Stellenmarkt
  1. item Industrietechnik GmbH, Solingen
  2. Zurich Gruppe Deutschland, Köln

Google unterstützt Uploads als JPEGs, PNGs und GIFs. Die Auflösung sollte recht hoch sein, damit die Erkennung funktioniert. Google gab nur an, dass ein Buchstabe mindestens 10 Pixel hoch sein sollte. Die maximale Dateigröße liegt bei 10 Megabyte und die maximale Auflösung bei 25 Megapixeln. Die Erkennung dauert recht lang - ein 500-KByte-Bild benötigt rund 15 Sekunden, eine 2-Megapixel-Datei nimmt 40 Sekunden in Anspruch.

Um die Texterkennung anzusprechen, muss der Parameter "ocr=true" an den Uploadrequest angehängt werden:

POST /feeds/default/private/full?ocr=true HTTP/1.1

Außerdem hat Google die Übersetzungsfunktion in die Programmierschnittstelle eingebaut. So können Texte nach dem Upload direkt übersetzt und in Googles Texte und Tabellen eingefügt werden. Dazu müssen nur die Parameter "targetLanguage" und "sourceLanguage" an den Uploadrequest angehängt werden:

POST /feeds/default/private/full/?targetLanguage=de&sourceLanguage=en HTTP/1.1

Wird die Quellsprache nicht angegeben, versucht Google die Sprache automatisch zu erkennen. Sämtliche Sprachpaare von Google Translate werden unterstützt.

Noch sind die speziellen Uploadfunktionen nicht in Googles Text und Tabellen integriert, doch das dürfte nur eine Frage der Zeit sein. Eine ausführliche Dokumentation der neuen Funktionen hat Google online gestellt.



Anzeige
Hardware-Angebote
  1. und Vive Pro vorbestellbar
  2. 229,90€ + 5,99€ Versand
  3. für 147,99€ statt 259,94€
  4. 120,84€ + Versand

MovieKnight 01. Okt 2009

Naja, die erste Klammer erkennt er... Dann sollte sich der Algorithmus schon auf eine...

einer 01. Okt 2009

Und alle so Yeah!

GnickGnack 01. Okt 2009

dann mit der eigenen Google OCR knacken?? :D

mr_pain 01. Okt 2009

Oder weiss jemand welche Engine da zum Einsatz kommt?


Folgen Sie uns
       


God of War (2018) - Fazit

Viele langjährige Fans von Kratos dürften beim neuen God of War erst mal vom Glauben abfallen. Der Neue hat aber auf eigenständige Art ebenfalls das Zeug zum Kulthelden.

God of War (2018) - Fazit Video aufrufen
Klimaschutz: Unter der Erde ist das Kohlendioxid gut aufgehoben
Klimaschutz
Unter der Erde ist das Kohlendioxid gut aufgehoben

Die Kohlendioxid-Emissionen steigen und steigen. Die auf der UN-Klimakonferenz in Paris vereinbarten Ziele sind so kaum zu schaffen. Fachleute fordern daher den Einsatz von Techniken, die Kohlendioxid in Kraftwerken abscheiden oder sogar aus der Luft filtern.
Ein Bericht von Daniel Hautmann

  1. Xiaoice und Zo Microsoft erforscht menschlicher wirkende Sprachchat-KIs
  2. Hyperschallgeschwindigkeit Projektil schießt sich durch den Boden
  3. Materialforschung Stanen - ein neues Wundermaterial?

NUC8i7HVK (Hades Canyon) im Test: Intels Monster-Mini mit Radeon-Grafikeinheit
NUC8i7HVK (Hades Canyon) im Test
Intels Monster-Mini mit Radeon-Grafikeinheit

Unter dem leuchtenden Schädel steckt der bisher schnellste NUC: Der buchgroße Hades Canyon kombiniert einen Intel-Quadcore mit AMDs Vega-GPU und strotzt förmlich vor Anschlüssen. Obendrein ist er recht leise und eignet sich für VR - selten hat uns ein System so gut gefallen.
Ein Test von Marc Sauter und Sebastian Grüner

  1. Crimson Canyon Intel plant weiteren Mini-PC mit Radeon-Grafik
  2. NUC7CJYS und NUC7PJYH Intel bringt Atom-betriebene Mini-PCs
  3. NUC8 Intels Mini-PC hat mächtig viel Leistung

BeA: Rechtsanwaltsregister wegen Sicherheitslücke abgeschaltet
BeA
Rechtsanwaltsregister wegen Sicherheitslücke abgeschaltet

Das deutsche Rechtsanwaltsregister hat eine schwere Sicherheitslücke. Schuld daran ist eine veraltete Java-Komponente, die für einen Padding-Oracle-Angriff verwundbar ist. Das Rechtsanwaltsregister ist Teil des besonderen elektronischen Anwaltspostfachs, war aber anders als dieses weiterhin online.
Eine Exklusivmeldung von Hanno Böck

  1. BeA Secunet findet noch mehr Lücken im Anwaltspostfach
  2. EGVP Empfangsbestätigungen einer Klage sind verwertbar
  3. BeA Anwälte wollen Ende-zu-Ende-Verschlüsselung einklagen

    •  /