Forschung: Google investiert in Handschriften-Texterkennung

Das Forschungsvorhaben ist Teil des von Google formulierten Ziels, irgendwann alle Informationen recherchierbar zu machen. Die Forschung in Irland hat zum Ziel, beispielsweise das Book of Kells oder die Tagebücher von George Washington textlich zu erfassen und damit weltweit verfügbar zu machen.
Derzeit befinden sich solche Dokumente meist hinter verschlossenen Türen oder sind nur Seite für Seite für das Internet eingescannt, was zwar die Verfügbarkeit verbessert, das Durchsuchen aber nicht erleichtert.
Die verwendeten Algorithmen stammen ursprünglich aus der Objekterkennung in Videos. Dabei müssen Bilder von Menschen, Autos und anderen Objekten in verschiedenen Winkeln und Positionen zuverlässig wiedererkannt werden. Mit einigen Abwandlungen konnte man das System auch zum Erkennen von Handschriften einzelner Wörter und Buchstaben in verschiedenen Variationen nutzen.
Dr. O'Connor führte aus, dass man bei Handschriften sehr gute Erkennungsraten erziele, wenn nach der Form ganzer Wörter gesucht würde, selbst wenn der Autor beim Schreiben jedes Mal leichte Veränderungen vornimmt. Man habe mit der Methode bereits hunderte Seiten der Tagebücher Washingtons erfasst, so O’Connor.
Professor Smeaton bemerkte, dass mit der Methode historische Manuskripte für Forscher und andere in einer Art und Weise aufbereitet werden könnten, die niemals zuvor möglich war. Weltweit erfassen Bibliotheken mittlerweile ihre historischen Bestände digital - die Texterkennung könnte sich dem anschließen und man könnte die Inhalte über Google weltweit verfügbar und durchsuchbar machen.
Das Forschungsprojekt wird am ACI der DCU in Partnerschaft mit der Universität Buffalo und der Universität Massachusetts am Standort Amherst durchgeführt.
Der Adaptive Information Cluster (AIC) an der Dublin City University (DCU) wurde vor zwei Jahren ins Leben gerufen und wird von der Science Foundation Ireland finanziert. Die multidisziplinäre Forschungsgruppe besteht aus Informatikern, Elektroingenieuren sowie Spezialisten auf dem Gebiet der Sensortechnik und der Software-Entwicklung.



