EU will computergestützte Übersetzung verbessern
Dokumente in 22 Sprachen als "Lernhilfe" für Computersysteme
Die Europäische Kommission will helfen, die Qualität von computergestützter Übersetzung zu verbessern und stellt dazu eine Sammlung von mehr als einer Million Sätzen und deren hochwertiger Übersetzung in 22 von 23 EU-Amtssprachen zur Verfügung. Die Daten sollen Entwicklern von Übersetzungssoftware helfen, ihre Systeme zu verbessern.
Die Texte stellen laut EU-Kommission den weltweit größten Bestand in derart vielen Sprachen dar. Dieser wird künftig frei zugänglich sein, damit Übersetzungsprogramme mit den Inhalten trainiert werden können. Die Software soll so "lernen", wie Wörter und Sätze im Zusammenhang richtig zu übersetzen sind. Auch andere Programme wie Grammatik- und Rechtschreibprüfung, Online-Wörterbücher und mehrsprachige Textklassifizierungssysteme können von den Daten profitieren.
Die Freigabe der Daten ist Teil der Initiative "Einheit Europas in der Vielfalt". EU-Wissenschaftskommissar Janez Potocnik spricht von einem "einzigartigen Sprachdatenbestand", der "zur Schaffung einer neuen Generation von Softwarewerkzeugen für die Verarbeitung menschlicher Sprache" beiträgt.
Insgesamt verfügen die EU-Organe über weit mehr mehrsprachige Texte als jede andere Organisation, weil die EU-Vorschriften in allen 23 Amtssprachen vorliegen müssen. Ihre Übersetzungsdienste arbeiten mit 253 möglichen Sprachkombinationen und produzieren jährlich etwa 1,5 Millionen Übersetzungsseiten.
Während sich Übersetzungen englischer oder französischer Texte im Internet häufig leicht finden lassen, sind Übersetzungen aus Sprachen wie Lettisch oder Rumänisch selten und für die Kombination zweier seltenerer Sprachen praktisch unauffindbar. Deshalb macht die Kommission dank der Zusammenarbeit ihrer Übersetzer und ihrer eigenen Forscher nun umfangreiche Sammlungen von Sätzen aus Rechtstexten über technische, politische und soziale Fragen in 22 Sprachen zugänglich. Diese Übersetzungsspeicher enthalten Sätze mit ihrer jeweiligen Entsprechung in allen anderen Amtssprachen.
Einzige Ausnahme sind die irischen Übersetzungen, da die entsprechenden Daten noch nicht vorliegen.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
- ohne Werbung
- mit ausgeschaltetem Javascript
- mit RSS-Volltext-Feed
kann mann nicht auch die online uebersetzer dazu zählen ? beispiele : google - oder www...
Ob man es glaubt oder nicht, aber innerhalb Europas (wenn man Osteuropa mitzählt) ist...
Du musst den Artikel ERST lesen um ihn DANACH zu kommentieren, sonst ist der Beitrag...