Zum Hauptinhalt Zur Navigation

Forschung: Google investiert in Handschriften-Texterkennung

Handschriftliche Tagebücher von George Washington bald bei Google? Google hat an der Dublin City University (DCU) ein Projekt ins Leben gerufen, bei dem die Forschungsgruppe Adaptive Information Cluster (AIC) mit zwei amerikanischen Unis zusammen daran arbeitet, alte Manuskripte und andere historische Dokumente durchsuchbar zu machen. Dazu muss eine Handschrifterkennung vorgenommen werden, was ungleich größere Probleme mit sich bringt, als sie sich bei ausschließlich gedruckten Buchstaben ergeben.
/ Christian Klaß
9 Kommentare News folgen (öffnet im neuen Fenster)

Das Forschungsvorhaben ist Teil des von Google formulierten Ziels, irgendwann alle Informationen recherchierbar zu machen. Die Forschung in Irland hat zum Ziel, beispielsweise das Book of Kells oder die Tagebücher von George Washington textlich zu erfassen und damit weltweit verfügbar zu machen.

Derzeit befinden sich solche Dokumente meist hinter verschlossenen Türen oder sind nur Seite für Seite für das Internet eingescannt, was zwar die Verfügbarkeit verbessert, das Durchsuchen aber nicht erleichtert.

Das Forschungsteam der DCU wird angeführt von Professor Alan Smeaton und Dr. Noel O'Connor, die international anerkannte Experten auf dem Gebiet der Videoanalyse sind und dieses Wissen auf die Handschrifterkennung in Dokumenten anwenden wollen.

Die verwendeten Algorithmen stammen ursprünglich aus der Objekterkennung in Videos. Dabei müssen Bilder von Menschen, Autos und anderen Objekten in verschiedenen Winkeln und Positionen zuverlässig wiedererkannt werden. Mit einigen Abwandlungen konnte man das System auch zum Erkennen von Handschriften einzelner Wörter und Buchstaben in verschiedenen Variationen nutzen.

Dr. O'Connor führte aus, dass man bei Handschriften sehr gute Erkennungsraten erziele, wenn nach der Form ganzer Wörter gesucht würde, selbst wenn der Autor beim Schreiben jedes Mal leichte Veränderungen vornimmt. Man habe mit der Methode bereits hunderte Seiten der Tagebücher Washingtons erfasst, so O’Connor.

Professor Smeaton bemerkte, dass mit der Methode historische Manuskripte für Forscher und andere in einer Art und Weise aufbereitet werden könnten, die niemals zuvor möglich war. Weltweit erfassen Bibliotheken mittlerweile ihre historischen Bestände digital - die Texterkennung könnte sich dem anschließen und man könnte die Inhalte über Google weltweit verfügbar und durchsuchbar machen.

Das Forschungsprojekt wird am ACI der DCU in Partnerschaft mit der Universität Buffalo und der Universität Massachusetts am Standort Amherst durchgeführt.

Der Adaptive Information Cluster (AIC) an der Dublin City University (DCU) wurde vor zwei Jahren ins Leben gerufen und wird von der Science Foundation Ireland finanziert. Die multidisziplinäre Forschungsgruppe besteht aus Informatikern, Elektroingenieuren sowie Spezialisten auf dem Gebiet der Sensortechnik und der Software-Entwicklung.


Relevante Themen