Speech-to-Text: Amazon Transcribe entfernt persönliche Informationen
Das Speech-to-Text-Angebot Transcribe von Amazon soll künftig auch automatisiert persönliche Informationen entfernen können. Dazu gehören Namen, Kontaktdaten oder auch Bankinformationen. Kunden sollten wohl aber nicht all zu großes Vertrauen in den Dienst setzen.

Der IT-Anbieter Amazon bietet in seiner AWS-Cloud eine Vielzahl verschiedener Techniken zur automatisierten Spracherkennung und Sprachverarbeitung an. Dazu gehört auch die Speech-to-Text-Engine Transcribe, die Sprachaufnahmen in Text zur weiteren Verarbeitung überführt. Wie das Unternehmen in seinem AWS-Blog ankündigt, soll Transcribe künftig persönliche Daten automatisch aus den erstellten Texten entfernen können.
Laut der Mitteilung ist der Dienst Transcribe besonders in Callcentern beliebt, um Kundenanrufe einfacher verarbeiten zu können. Das Angebot werde etwa für eine weitergehende statistische Analyse oder für direkte Aufgaben der Sprachverarbeitung wie eine Sentimentanalyse verwendet, heißt es in der Ankündigung.
Persönliche Daten werden entfernt
Mit einem Verweis auf die Privatsphäre der Aufgezeichneten sowie auch auf lokale Gesetzgebungen führt Amazon also die Möglichkeit ein, Informationen, die zur persönlichen Identifizierung führen können, aus dem transkribierten Text zu entfernen. Dazu gehören sollen etwa die Sozialversicherungsnummer, Kreditkarten- und Kontodaten, PINs oder auch Telefonnummern. Hinzu kommen Daten wie Namen und E-Mail-Adressen.
Bereitgestellt wird der Dienst zunächst nur für US-Englisch, weitere Sprachen dürften folgen. Amazon hat in seinem Blog darüber hinaus ein recht simples Beispiel veröffentlicht, das das Entfernen der Daten demonstrieren soll. Verschiedene Machine-Learning-Systeme sind der Vergangenheit jedoch dadurch aufgefallen, dass diese bestehende Vorurteile reproduzieren oder gar verstärken. Dazu gehören etwa ein sexistisches Bewerbungswerkzeug oder auch Bilderkennung, die nur bei weißen Männern gut funktioniert.
Mit Blick auf diese Negativbeispiele könnte es durchaus sein, dass das von Amazon vorgestellte Werkzeug zum Beispiel Probleme damit haben könnte, Namen tatsächlich als solche zu erkennen. Darüber hinaus schließt der Dienst schon von vornherein internationale Telefonnummern aus, die offenbar nicht automatisch erkannt werden können.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
- ohne Werbung
- mit ausgeschaltetem Javascript
- mit RSS-Volltext-Feed