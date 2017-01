Verstehen, was andere schreiben, ohne ihre Sprache zu kennen: Die Intelligence Advanced Research Projects Agency (Iarpa) will ein Übersetzungssystem entwickeln, mit dem Geheimdienstmitarbeiter Dokumente in über 7.000 Sprachen lesen und auswerten können. Die Iarpa ist die Forschungsagentur der US-Geheimdienste.

Machine Translation for English Retrieval of Information in Any Language, kurz Material, heißt das Programm. Die Iarpa beschreibt es als Informationsbeschaffungssystem, das ermöglichen soll, relevanten Daten aus einer vielsprachigen Datenquelle abzurufen und die abgerufenen Informationen als Zusammenfassungen wiederzugeben. Entscheidend dabei ist, dass die Abfrage in Englisch gestellt wird und dass die Ergebnisse ebenfalls in englischer Sprache sind.

Material erzeugt Zusammenfassungen der Dokumente

Die Abfrage soll jeweils zweiteilig sind: Sie solle das gesuchte Stichwort enthalten, etwa "Zika", und einen Bereich, in dem gesucht werde, schreibt die Iarpa: also etwa nach Zika im Bereich Regierung oder nach Zika im Bereich Gesundheitswesen. Die von Material erzeugten englischen Zusammenfassungen sollten die Relevanz der Informationen vermitteln. Dadurch solle der Nutzer gleich erkennen, ob das Dokument seine Anforderungen erfülle.

Übersetzungssysteme gibt es ja schon, etwa Googles Translate oder Microsofts Konkurrenzprodukt Tanslator, das auch in Skype eingesetzt wird.

Allerdings brauchten diese zum Lernen einer Sprache einen großen Fundus an Daten sowie viel Zeit - Monate, wenn nicht Jahre, schreibt die Iarpa. Das soll sich ändern: "Ein Ziel dieses Programms ist, die Zeit und die Datenmenge drastisch zu reduzieren, die die Systeme bewältigen müssen, um eine Aufgabe mit englischer Ein- und Ausgabe erfüllen zu können."