Trainingsdaten mit Tendenz: Bundesamt für Migration hält an Sprachanalyse fest

Das BAMF hält an der automatisierten Sprachanalyse von Geflüchteten fest. Obwohl die trainierte Software fehleranfällig ist, kommen neue Sprachen hinzu.

Artikel veröffentlicht am , Lennart Mühlenmeier
Erstaufnahmestelle der Polizei in Frankfurt (Oder) im November 2021
Erstaufnahmestelle der Polizei in Frankfurt (Oder) im November 2021 (Bild: Sean Gallup / GettyImages)

Das Bundesamt für Migration und Flüchtlinge (BAMF) weitet die Verwendung von Software für Sprachanalyse aus. So wurde das System im Juli 2022 um die Sprachen Dari, Persisch und Paschto erweitert. Dies geht aus der Antwort einer Kleinen Anfrage der Linken-Abgeordneten Clara Bünger hervor, die Golem.de vorliegt. Netzpolitik.org hatte zuvor mit einer detaillierten Analyse der Problematik berichtet.

Stellenmarkt
  1. IT-Architekt MEMCM / SCCM (w/m/d)
    Dataport, verschiedene Standorte
  2. Product Owner (m/w/d) Website & Digital Business
    Dortmunder Energie- und Wasserversorgung GmbH DEW21, Dortmund
Detailsuche

Das BAMF führt solche Dialekterkennungen durch, um Geflüchtete einem Herkunftsland zuordnen zu können. Das vermeintliche Herkunftsland ist entscheidend für einen möglichen Aufenthaltstitel eines Geflüchteten. Jedoch sind manche Sprachen in den Trainingsdaten teils überproportional vorhanden und das System wird somit fehleranfällig.

Vier Millionen Euro für ein fragliches System

Seit Beginn des Verwendung will das BAMF mehr als vier Millionen Euro für das System ausgegeben haben, unter anderem für die Lizenzierung der Software Nuance Speech Suite. Das BAMF hat die Spracherkennung im Jahr 2021 15.052 Mal durchgeführt, im ersten Halbjahr des Jahres 2022 bereits 7.808 Mal.

Clara Bünger sagt in einer Anmerkung zu der Antwort auf die Kleine Anfrage: "Ich habe große Zweifel daran, ob die Dialekterkennungssoftware des BAMF ein geeignetes Mittel ist, um valide Hinweise auf die Identität und Herkunft von Asylsuchenden zu bekommen. Auch die Bundesregierung scheint sich da nicht ganz sicher zu sein."

Anfechtung der Ergebnisse mit Tendenz schwer möglich

Golem Karrierewelt
  1. DP-203 Data Engineering on Microsoft Azure: virtueller Vier-Tage-Workshop
    24.-27.10.2022, virtuell
  2. Data Engineering mit Python und Spark: virtueller Zwei-Tage-Workshop
    18./19.01.2023, Virtuell
Weitere IT-Trainings

Die Bundesregierung argumentiert, dass die Erkennungssoftware keinen "Beweischarakter" hat, jedoch die Ergebnisse berücksichtigt werden sollten. Bünger sagt diesbezüglich: "Gerade bei hoher Arbeitsbelastung, unter Zeitdruck oder bei mangelnder Schulung besteht die Gefahr, dass BAMF-Mitarbeiter*innen die Ergebnisse der Software letztlich doch wie unumstößliche Fakten behandeln, um schnell eine Entscheidung treffen zu können." Asylsuchende könnten diese Entscheidungen nur schwer anfechten, so Bünger.

Die zugrundeliegenden Trainingsdaten können zu nicht eindeutig validen Ergebnissen führen, wie neben Bünger auch Netzpolitik.org argumentiert. In der Antwort der Bundesregierung zu den Trainingsdaten heißt es: "Der größte Teil der Trainingsdaten wurde vom Linguistic Data Consortium (LDC) bezogen. Ein kleiner Teil wurde über die Clickworker GmbH beschafft. Die arabischen Modelle sind darüber hinaus auch mit BAMF-eigenen anonymisierten Sprachproben trainiert worden." Zu der Fehlerquote äußert sich die Bundesregierung nicht.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Für 44 Milliarden US-Dollar
Musk will Twitter nun doch übernehmen

Tesla-Chef Elon Musk ist nun doch bereit, Twitter für den ursprünglich vereinbarten Preis zu kaufen. Offenbar will er einen Prozess vermeiden.

Für 44 Milliarden US-Dollar: Musk will Twitter nun doch übernehmen
Artikel
  1. Die große Umfrage: Das sind Deutschlands beste IT-Arbeitgeber 2023
    Die große Umfrage
    Das sind Deutschlands beste IT-Arbeitgeber 2023

    Golem.de und Statista haben 23.000 Fachkräfte nach ihrer Arbeit gefragt. Das Ergebnis ist eine Liste der 175 besten Unternehmen für IT-Profis.

  2. Monitoring von Container-Landschaften: Prometheus ist nicht alles
    Monitoring von Container-Landschaften
    Prometheus ist nicht alles

    Betreuer von Kubernetes und Co., die sich nicht ausreichend mit der Thematik beschäftigen, nehmen beim metrikbasierte Monitoring unwissentlich einige Nachteile in Kauf. Eventuell ist es notwendig, den üblichen Tool-Stack zu ergänzen.
    Von Valentin Höbel

  3. Roadmap: CD Projekt kündigt neues Cyberpunk und mehrere Witcher an
    Roadmap
    CD Projekt kündigt neues Cyberpunk und mehrere Witcher an

    Project Polaris wird eine Witcher-Saga, Orion das nächste Cyberpunk 2077 und Hadar etwas ganz Neues: CD Projekt hat seine Pläne vorgestellt.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • 3 Spiele für 49€ • Saturn Gutscheinheft • Günstig wie nie: LG OLED 48" 799€, Xbox Elite Controller 2 114,99€, AOC 28" 4K UHD 144 Hz 600,89€, Corsair RGB Midi-Tower 269,90€, Sandisk microSDXC 512GB 39€ • Bis zu 15% im eBay Restore • MindStar (PowerColor RX 6700 XT 489€) [Werbung]
    •  /