Abo
  • Services:
Anzeige

API von Google Docs unterstützt nun OCR und Übersetzungen

Texterkennung und Übersetzungen beim Upload

Die Google Docs API unterstützt nun die optische Zeichenerkennung (OCR). Programmierer können die Funktion nutzen, um gescannte Texte per Upload zu Google direkt in die Onlinetextverarbeitung zu importieren. Auch die Übersetzungsfunktion wurde nun in die Programmierschnittstelle integriert.

Google hat eine Demo der OCR-Anbindung ins Netz gestellt, die die Möglichkeiten demonstrieren soll, die sich dadurch eröffnen. Der Dienst ist derzeit stark überlaufen, so dass nicht jeder Upload und jede Texterkennung glückt. Zum Ausprobieren ist ein Google Account erforderlich.

Anzeige

Google unterstützt Uploads als JPEGs, PNGs und GIFs. Die Auflösung sollte recht hoch sein, damit die Erkennung funktioniert. Google gab nur an, dass ein Buchstabe mindestens 10 Pixel hoch sein sollte. Die maximale Dateigröße liegt bei 10 Megabyte und die maximale Auflösung bei 25 Megapixeln. Die Erkennung dauert recht lang - ein 500-KByte-Bild benötigt rund 15 Sekunden, eine 2-Megapixel-Datei nimmt 40 Sekunden in Anspruch.

Um die Texterkennung anzusprechen, muss der Parameter "ocr=true" an den Uploadrequest angehängt werden:

POST /feeds/default/private/full?ocr=true HTTP/1.1

Außerdem hat Google die Übersetzungsfunktion in die Programmierschnittstelle eingebaut. So können Texte nach dem Upload direkt übersetzt und in Googles Texte und Tabellen eingefügt werden. Dazu müssen nur die Parameter "targetLanguage" und "sourceLanguage" an den Uploadrequest angehängt werden:

POST /feeds/default/private/full/?targetLanguage=de&sourceLanguage=en HTTP/1.1

Wird die Quellsprache nicht angegeben, versucht Google die Sprache automatisch zu erkennen. Sämtliche Sprachpaare von Google Translate werden unterstützt.

Noch sind die speziellen Uploadfunktionen nicht in Googles Text und Tabellen integriert, doch das dürfte nur eine Frage der Zeit sein. Eine ausführliche Dokumentation der neuen Funktionen hat Google online gestellt.


eye home zur Startseite
MovieKnight 01. Okt 2009

Naja, die erste Klammer erkennt er... Dann sollte sich der Algorithmus schon auf eine...

einer 01. Okt 2009

Und alle so Yeah!

GnickGnack 01. Okt 2009

dann mit der eigenen Google OCR knacken?? :D

mr_pain 01. Okt 2009

Oder weiss jemand welche Engine da zum Einsatz kommt?



Anzeige

Stellenmarkt
  1. Computacenter AG & Co. oHG, verschiedene Einsatzorte
  2. Computacenter AG & Co. oHG, verschiedene Standorte
  3. b.power GmbH, Stuttgart
  4. Haufe Group, Freiburg im Breisgau


Anzeige
Hardware-Angebote
  1. mit dem Gutscheincode PSUPERTECH
  2. 34,99€ statt 59,99€

Folgen Sie uns
       


  1. Alexa und Co.

    Wirtschaftsverband sieht Megatrend zu smarten Lautsprechern

  2. Apple TV

    Deutsche TV-App startet mit nur vier Anbietern

  3. King's Field 1 (1994)

    Die Saat für Dark Souls

  4. Anheuser Busch

    US-Brauerei bestellt 40 Tesla-Trucks vor

  5. Apple

    Jony Ive übernimmt wieder Apples Produktdesign

  6. Elon Musk

    Tesla will eigene KI-Chips bauen

  7. Die Woche im Video

    Lauscher auf!

  8. Entlassungen

    Kaufland beendet Online-Lieferservice für Lebensmittel

  9. DigiNetz-Gesetz

    Unitymedia überbaut keine Glasfaser in Fördergebieten

  10. Telekom

    Mobilfunk an neuer ICE-Strecke München-Berlin ausgebaut



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Berlin: Verfassungsschutz hat Lizenz zur Gesichtserkennung
Berlin
Verfassungsschutz hat Lizenz zur Gesichtserkennung
  1. Finnairs Gesichtsscanner ausprobiert Boarden mit einem Blick in die Kamera

Watch Series 3 im Praxistest: So hätte Apples erste Smartwatch sein müssen
Watch Series 3 im Praxistest
So hätte Apples erste Smartwatch sein müssen
  1. Apple Watch Apple veröffentlicht WatchOS 4.2
  2. Alivecor Kardiaband Uhrenarmband für Apple Watch zeichnet EKG auf
  3. Smartwatch Die Apple Watch lieber nicht nach dem Wetter fragen

Twitch, Youtube Gaming und Mixer: Weltweites Aufmerksamkeitsdefizit
Twitch, Youtube Gaming und Mixer
Weltweites Aufmerksamkeitsdefizit
  1. Kiyo und Seiren X Razer bringt Ringlicht-Webcam für Streamer
  2. Roboter Megabots kündigt Video vom Roboterkampf an
  3. Free to Play World of Tanks bringt pro Nutzer und Monat 3,30 Dollar ein

  1. Re: Warum IoT pöse ist (Kritische Masse)

    kraemere | 07:00

  2. Re: Einseitiger Artikel

    serra.avatar | 06:58

  3. Re: Wie viele Fahrzeuge hat Anheuser Busch?

    VigarLunaris | 06:58

  4. Och wie putzig ... süsssss

    VigarLunaris | 06:56

  5. Re: Addblocker nach wie vor nötig

    serra.avatar | 06:41


  1. 10:59

  2. 09:41

  3. 08:00

  4. 15:44

  5. 14:05

  6. 13:09

  7. 09:03

  8. 19:18


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel