API von Google Docs unterstützt nun OCR und Übersetzungen
Texterkennung und Übersetzungen beim Upload
Die Google Docs API unterstützt nun die optische Zeichenerkennung (OCR). Programmierer können die Funktion nutzen, um gescannte Texte per Upload zu Google direkt in die Onlinetextverarbeitung zu importieren. Auch die Übersetzungsfunktion wurde nun in die Programmierschnittstelle integriert.
Google hat eine Demo der OCR-Anbindung ins Netz gestellt, die die Möglichkeiten demonstrieren soll, die sich dadurch eröffnen. Der Dienst ist derzeit stark überlaufen, so dass nicht jeder Upload und jede Texterkennung glückt. Zum Ausprobieren ist ein Google Account erforderlich.
Google unterstützt Uploads als JPEGs, PNGs und GIFs. Die Auflösung sollte recht hoch sein, damit die Erkennung funktioniert. Google gab nur an, dass ein Buchstabe mindestens 10 Pixel hoch sein sollte. Die maximale Dateigröße liegt bei 10 Megabyte und die maximale Auflösung bei 25 Megapixeln. Die Erkennung dauert recht lang - ein 500-KByte-Bild benötigt rund 15 Sekunden, eine 2-Megapixel-Datei nimmt 40 Sekunden in Anspruch.
Um die Texterkennung anzusprechen, muss der Parameter "ocr=true" an den Uploadrequest angehängt werden:
POST /feeds/default/private/full?ocr=true HTTP/1.1
Außerdem hat Google die Übersetzungsfunktion in die Programmierschnittstelle eingebaut. So können Texte nach dem Upload direkt übersetzt und in Googles Texte und Tabellen eingefügt werden. Dazu müssen nur die Parameter "targetLanguage" und "sourceLanguage" an den Uploadrequest angehängt werden:
POST /feeds/default/private/full/?targetLanguage=de&sourceLanguage=en HTTP/1.1
Wird die Quellsprache nicht angegeben, versucht Google die Sprache automatisch zu erkennen. Sämtliche Sprachpaare von Google Translate werden unterstützt.
Noch sind die speziellen Uploadfunktionen nicht in Googles Text und Tabellen integriert, doch das dürfte nur eine Frage der Zeit sein. Eine ausführliche Dokumentation der neuen Funktionen hat Google online gestellt.






Naja, die erste Klammer erkennt er... Dann sollte sich der Algorithmus schon auf eine...
Und alle so Yeah!
dann mit der eigenen Google OCR knacken?? :D
Oder weiss jemand welche Engine da zum Einsatz kommt?
Kommentieren