• IT-Karriere:
  • Services:

Speech-to-Text: Amazon Transcribe entfernt persönliche Informationen

Das Speech-to-Text-Angebot Transcribe von Amazon soll künftig auch automatisiert persönliche Informationen entfernen können. Dazu gehören Namen, Kontaktdaten oder auch Bankinformationen. Kunden sollten wohl aber nicht all zu großes Vertrauen in den Dienst setzen.

Artikel veröffentlicht am ,
AWS Transcribe soll künftig automatisch persönliche Informationen entfernen können.
AWS Transcribe soll künftig automatisch persönliche Informationen entfernen können. (Bild: REUTERS/Ivan Alvarado)

Der IT-Anbieter Amazon bietet in seiner AWS-Cloud eine Vielzahl verschiedener Techniken zur automatisierten Spracherkennung und Sprachverarbeitung an. Dazu gehört auch die Speech-to-Text-Engine Transcribe, die Sprachaufnahmen in Text zur weiteren Verarbeitung überführt. Wie das Unternehmen in seinem AWS-Blog ankündigt, soll Transcribe künftig persönliche Daten automatisch aus den erstellten Texten entfernen können.

Stellenmarkt
  1. AcadeMedia GmbH, München
  2. Deutsche Nationalbibliothek, Frankfurt am Main

Laut der Mitteilung ist der Dienst Transcribe besonders in Callcentern beliebt, um Kundenanrufe einfacher verarbeiten zu können. Das Angebot werde etwa für eine weitergehende statistische Analyse oder für direkte Aufgaben der Sprachverarbeitung wie eine Sentimentanalyse verwendet, heißt es in der Ankündigung.

Persönliche Daten werden entfernt

Mit einem Verweis auf die Privatsphäre der Aufgezeichneten sowie auch auf lokale Gesetzgebungen führt Amazon also die Möglichkeit ein, Informationen, die zur persönlichen Identifizierung führen können, aus dem transkribierten Text zu entfernen. Dazu gehören sollen etwa die Sozialversicherungsnummer, Kreditkarten- und Kontodaten, PINs oder auch Telefonnummern. Hinzu kommen Daten wie Namen und E-Mail-Adressen.

Bereitgestellt wird der Dienst zunächst nur für US-Englisch, weitere Sprachen dürften folgen. Amazon hat in seinem Blog darüber hinaus ein recht simples Beispiel veröffentlicht, das das Entfernen der Daten demonstrieren soll. Verschiedene Machine-Learning-Systeme sind der Vergangenheit jedoch dadurch aufgefallen, dass diese bestehende Vorurteile reproduzieren oder gar verstärken. Dazu gehören etwa ein sexistisches Bewerbungswerkzeug oder auch Bilderkennung, die nur bei weißen Männern gut funktioniert.

Mit Blick auf diese Negativbeispiele könnte es durchaus sein, dass das von Amazon vorgestellte Werkzeug zum Beispiel Probleme damit haben könnte, Namen tatsächlich als solche zu erkennen. Darüber hinaus schließt der Dienst schon von vornherein internationale Telefonnummern aus, die offenbar nicht automatisch erkannt werden können.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Anzeige
Top-Angebote
  1. (u. a. Sennheiser CX SPORT für 89,99€ inkl. Versand)
  2. mit 77,01€ inkl. Versand neuer Tiefpreis bei Geizhals (MediaMarkt & Saturn)
  3. 77,01€ (Vergleichspreis 101,90€)
  4. 28,75€ + Versand oder kostenlose Marktabholung (Vergleichspreis 45,85€ + Versand)

Folgen Sie uns
       


Monkey Island - Titelmusik aller Versionen

Wir haben alle Varianten der Titelmusik im Video zusammengestellt - plus Bonusversion.

Monkey Island - Titelmusik aller Versionen Video aufrufen
    •  /