API von Google Docs unterstützt nun OCR und Übersetzungen

Texterkennung und Übersetzungen beim Upload

Die Google Docs API unterstützt nun die optische Zeichenerkennung (OCR). Programmierer können die Funktion nutzen, um gescannte Texte per Upload zu Google direkt in die Onlinetextverarbeitung zu importieren. Auch die Übersetzungsfunktion wurde nun in die Programmierschnittstelle integriert.

Anzeige

Google hat eine Demo der OCR-Anbindung ins Netz gestellt, die die Möglichkeiten demonstrieren soll, die sich dadurch eröffnen. Der Dienst ist derzeit stark überlaufen, so dass nicht jeder Upload und jede Texterkennung glückt. Zum Ausprobieren ist ein Google Account erforderlich.

Google unterstützt Uploads als JPEGs, PNGs und GIFs. Die Auflösung sollte recht hoch sein, damit die Erkennung funktioniert. Google gab nur an, dass ein Buchstabe mindestens 10 Pixel hoch sein sollte. Die maximale Dateigröße liegt bei 10 Megabyte und die maximale Auflösung bei 25 Megapixeln. Die Erkennung dauert recht lang - ein 500-KByte-Bild benötigt rund 15 Sekunden, eine 2-Megapixel-Datei nimmt 40 Sekunden in Anspruch.

Um die Texterkennung anzusprechen, muss der Parameter "ocr=true" an den Uploadrequest angehängt werden:

POST /feeds/default/private/full?ocr=true HTTP/1.1

Außerdem hat Google die Übersetzungsfunktion in die Programmierschnittstelle eingebaut. So können Texte nach dem Upload direkt übersetzt und in Googles Texte und Tabellen eingefügt werden. Dazu müssen nur die Parameter "targetLanguage" und "sourceLanguage" an den Uploadrequest angehängt werden:

POST /feeds/default/private/full/?targetLanguage=de&sourceLanguage=en HTTP/1.1

Wird die Quellsprache nicht angegeben, versucht Google die Sprache automatisch zu erkennen. Sämtliche Sprachpaare von Google Translate werden unterstützt.

Noch sind die speziellen Uploadfunktionen nicht in Googles Text und Tabellen integriert, doch das dürfte nur eine Frage der Zeit sein. Eine ausführliche Dokumentation der neuen Funktionen hat Google online gestellt.


MovieKnight 01. Okt 2009

Naja, die erste Klammer erkennt er... Dann sollte sich der Algorithmus schon auf eine...

einer 01. Okt 2009

Und alle so Yeah!

GnickGnack 01. Okt 2009

dann mit der eigenen Google OCR knacken?? :D

mr_pain 01. Okt 2009

Oder weiss jemand welche Engine da zum Einsatz kommt?

Kommentieren




Anzeige
  1. Mitarbeiter (m/w) IT-Helpdesk 1st- und 2nd-Level-Support
    SV Deutschland GmbH, Langenfeld
  2. System Spezialist (m/w)
    ADAC e. V., München
  3. Web-Redakteurin / Web-Redakteur
    Universität Passau, Passau
  4. Informatiker / Fachinformatiker IT Support (m/w)
    CROWN Gabelstapler GmbH & Co. KG, München

 

Detailsuche


Folgen Sie uns
       


Meistgelesen
  1. Kim Dotcom

    "Gebt mir meine Rechner zurück!"

  2. PGP vs. Geheimdienste

    "PGP ist weiterhin sicher"

  3. Anstößige Animationen

    Cinemagram-App wieder in Apples App Store

  4. Google Maps

    Behörde verschleudert Bundesdaten an Google

  5. Bang! Lamp

    Eine Designlampe zum Abknallen


Meistkommentiert
  1. Kommentare: 382 | letzter Beitrag 11:50 Uhr

  2. Kommentare: 215 | letzter Beitrag 11:40 Uhr

  3. Kommentare: 205 | letzter Beitrag 11:59 Uhr

  4. Kommentare: 180 | letzter Beitrag 12:20 Uhr

  5. Kommentare: 125 | letzter Beitrag 24.05. 18:01

Mehr


  1. Test HTC One XL

    Smartphone-Leichtgewicht mit LTE

  2. Gerücht

    Spiele-Streaming kommt auf die Playstation

  3. Owncloud Inc.

    "Wir sind kein Serviceprovider"

  4. Street View

    US-Abgeordnete fordern Untersuchung der WLAN-Datensammlung

  5. Schadsoftware

    Empfänger von Angry-Birds-SMS muss Strafe zahlen

  6. Project Glass

    Videoaufnahme mit der Google-Brille

  7. Bernd Schlömer

    Piratenchef darf im Dienst weder mailen noch twittern

  8. Toshiba AT300

    10-Zoll-Tablet mit Quad-Core-Prozessor und Android 4

  9. Kingdoms of Amalur

    38 Studios entlässt alle Mitarbeiter

  10. Solarflugzeug

    Solar Impulse kommt in Madrid an



Haben wir etwas übersehen?

E-Mail an news@golem.de


Lenovo: PC-Hersteller öffnet einen Outlet Store im Netz
Lenovo
PC-Hersteller öffnet einen Outlet Store im Netz

Lenovo Deutschland hat im Internet einen Outlet Store eröffnet. Darüber verkauft der chinesische PC-Hersteller neben Neuware auch von Kunden zurückgeschickte und generalüberholte gebrauchte Hardware.

  1. PC-Markt Europa HP, Acer und Asus verkaufen die meisten Rechner
  2. Lenovo Ideatab S2109 Android-Tablet in 8,9 mm dünnem Unibody-Gehäuse
  3. Android-Tablet Lenovo Ideapad K1 Aldis neues Medion-Tablet teurer als Original

Rüstung: Ramsch-Technik aus China in US-Waffensystemen
Rüstung
Ramsch-Technik aus China in US-Waffensystemen

Fälscher infiltrieren die US-Streitkräfte: In mehr als 1.800 Fällen hat ein Komitee des Washingtoner Senats gefälschte Elektronikteile in Hightech-Waffen entdeckt. Mehr als eine Million Komponenten sollen auf Umwegen in die Lieferkette der Rüstungsindustrie gelangt sein. Die meisten der Ramsch-Teile stammen aus China.


F2, F8, F12: Windows 8 startet zu schnell
F2, F8, F12
Windows 8 startet zu schnell

Windows 8 kann auf entsprechender Hardware in weniger als 8 Sekunden booten. Dabei bleibt zu wenig Zeit, um den Bootvorgang zum Sprung ins Bios, ins UEFI-Menü oder in die Startauswahl von Windows zu unterbrechen.

  1. Dice Einige Frostbite-2-Spiele nur mit 64-Bit-Betriebssystem
  2. Windows RT Windows-Tablet-Lizenz soll angeblich 100 US-Dollar kosten
  3. Windows 8 Release Preview Microsoft verbessert Multi-Monitor-Unterstützung

  1. Re: Was is das eigentlich mit dem LG Hamburg ?!?

    Replay | 12:44

  2. ja. wird wahnsinnigen aufstand geben...

    fratze123 | 12:43

  3. Re: Hallo? Entweder oder: Verbeamteter Nimmersatt

    derGerd | 12:43

  4. Stopp: .. wieder nicht verstanden!

    RioDerReiser | 12:43

  5. Re: Meinungsfreiheit

    DerKleineHorst | 12:43


  1. 12:29

  2. 12:28

  3. 12:25

  4. 12:06

  5. 11:55

  6. 11:41

  7. 11:41

  8. 11:27


Zum Artikel