Zum Hauptinhalt Zur Navigation

EU will computergestützte Übersetzung verbessern

Dokumente in 22 Sprachen als "Lernhilfe" für Computersysteme. Die Europäische Kommission will helfen, die Qualität von computergestützter Übersetzung zu verbessern und stellt dazu eine Sammlung von mehr als einer Million Sätzen und deren hochwertiger Übersetzung in 22 von 23 EU-Amtssprachen zur Verfügung. Die Daten sollen Entwicklern von Übersetzungssoftware helfen, ihre Systeme zu verbessern.
/ Jens Ihlenfeld
14 Kommentare News folgen (öffnet im neuen Fenster)

Die Texte stellen laut EU-Kommission den weltweit größten Bestand in derart vielen Sprachen dar. Dieser wird künftig frei zugänglich sein, damit Übersetzungsprogramme mit den Inhalten trainiert werden können. Die Software soll so "lernen", wie Wörter und Sätze im Zusammenhang richtig zu übersetzen sind. Auch andere Programme wie Grammatik- und Rechtschreibprüfung, Online-Wörterbücher und mehrsprachige Textklassifizierungssysteme können von den Daten profitieren.

Die Freigabe der Daten ist Teil der Initiative "Einheit Europas in der Vielfalt". EU-Wissenschaftskommissar Janez Potocnik spricht von einem "einzigartigen Sprachdatenbestand" , der "zur Schaffung einer neuen Generation von Softwarewerkzeugen für die Verarbeitung menschlicher Sprache" beiträgt.

Insgesamt verfügen die EU-Organe über weit mehr mehrsprachige Texte als jede andere Organisation, weil die EU-Vorschriften in allen 23 Amtssprachen vorliegen müssen. Ihre Übersetzungsdienste arbeiten mit 253 möglichen Sprachkombinationen und produzieren jährlich etwa 1,5 Millionen Übersetzungsseiten.

Während sich Übersetzungen englischer oder französischer Texte im Internet häufig leicht finden lassen, sind Übersetzungen aus Sprachen wie Lettisch oder Rumänisch selten und für die Kombination zweier seltenerer Sprachen praktisch unauffindbar. Deshalb macht die Kommission dank der Zusammenarbeit ihrer Übersetzer und ihrer eigenen Forscher nun umfangreiche Sammlungen von Sätzen aus Rechtstexten über technische, politische und soziale Fragen in 22 Sprachen zugänglich. Diese Übersetzungsspeicher enthalten Sätze mit ihrer jeweiligen Entsprechung in allen anderen Amtssprachen.

Einzige Ausnahme sind die irischen Übersetzungen, da die entsprechenden Daten noch nicht vorliegen.


Relevante Themen