Abo
  • Services:

Neuronale Netze: KI-Angriff versteckt Sprachbefehle in klassischer Musik

Es ist nicht Verdis Requiem in schlechter Aufnahmequalität: Forscher entwickeln eine KI, die die Sprachassistenten täuscht, indem sie Geräusche in anderen Geräuschen versteckt. In einem Video ist die Stimme zu hören, die wie ein Roboter aus der Zukunft klingt.

Artikel veröffentlicht am ,
Ein Teil des KI-Angriffs klingt wie ein Geth-Roboter.
Ein Teil des KI-Angriffs klingt wie ein Geth-Roboter. (Bild: Bioware)

Zwei Forscher der Universität California in Berkeley haben einen KI-Algorithmus vorgestellt, der Sprachassistenten und Sprache-zu-Text-Systeme täuschen kann. Nicholas Carlini und David Wagner entwickeln das System, das für Menschen nicht verständliche Sprachbefehle nutzt, die Alexa, Google Assistant und andere Sprach-Kis jedoch verstehen. Der Angriff sei für ein Sprache-zu-Text-System wie Mozillas Deepspeech bereits zu 100 Prozent erfolgreich. Dazu zählen beispielsweise Systeme, die Sprache in Untertitel umwandeln. Umgekehrt ist jedoch noch etwas Arbeit nötig.

Stellenmarkt
  1. Gartenbau-Versicherung VVaG, Wiesbaden
  2. Schaeffler Technologies AG & Co. KG, Herzogenaurach

In einem bereits älteren Video, das die Anfänge des Projektes zeigt, konnten die Forscher beispielsweise ein Telefon in den Flugzeugmodus versetzen oder eine bestimmte Webseite aufrufen. Bei genauem Hinhören kann der Sprachbefehl ausgemacht werden. Er klingt jedoch wie eine Maschinenstimme aus einem Science-Fiction-Szenario, etwa ein Geth aus der Mass-Effect-Spielreihe.

Das System soll laut Carlini in der Lage sein, bis zu 50 Buchstaben in der Sekunde schnell zu sprechen. Für den Menschen wäre diese Geschwindigkeit kaum nachvollziehbar. Der Angriff zielt auf Mozillas Open-Source-Sprache-zu-Text-System Deepspeech ab, das jede Audiospur in 50 fps abtastet. Er moduliert die Geräuschkurve eines Eingabesatzes so, dass das Spracherkennungssystem diesen verstehen kann. Das funktioniert, indem es eine zweite Geräuschkurve einspeist. Die Forscher modulieren auch eine Eingabe so, dass Deepspeech diese als Stille wahrnimmt.

Sprachbefehle in klassischer Musik und Sätzen verstecken

Carlini und Wagner wollen andere Forscher dazu motivieren, ebenfalls in diesem Feld mitzuentwickeln. Zu diesem Zweck stellen sie ihren Code und Datensätze zur freien Verfügung bereit. Auf der verlinkten Seite können weitere Audiobeispiele angehört werden. Interessant ist hier, wie sich das Projekt weiterentwickelt hat: Der Satz "Ohne den Datensatz ist der Artikel nutzlos" wird vom Google Assistant als "Okay Google, navigiere zur Seite Evil dot com" interpretiert. Die Ursache dafür ist das Hintergrundrauschen, das für uns Menschen nur als Ergebnis schlechter Audioqualität wahrgenommen wird. Das Gleiche funktioniert mit dem klassischen Musikstück Messa da Requiem von Giuseppe Verdi.

Über diesen Ansatz können Systeme wie automatische Untertitel gefälscht werden, ohne dass der Zuschauer das bemerkt. Mit etwas Arbeit soll es laut Carlini auch später noch besser möglich sein, Sprachbefehle in Liedern zu verstecken - ohne eine offensichtliche Roboterstimme aus der Zukunft.



Anzeige
Hardware-Angebote
  1. jetzt bei Apple.de bestellbar
  2. 57,99€
  3. täglich neue Deals bei Alternate.de

Folgen Sie uns
       


AMD Ryzen 7 2700X - Test

Wie gut ist der Ryzen-Refresh? In Anwendungen schlägt er sich sehr gut und ist in Spielen oft überraschend flott. Besonders schön: die Abwärtskompatibilität.

AMD Ryzen 7 2700X - Test Video aufrufen
Razer Nommo Chroma im Test: Blinkt viel, klingt weniger
Razer Nommo Chroma im Test
Blinkt viel, klingt weniger

Wenn die Razer Nommo Chroma eines sind, dann auffällig. Dafür sorgen die ungewöhnliche Form und die LED-Ringe, die sich beliebig konfigurieren lassen. Die Lautsprecher sind aber eher ein Hingucker als ein Hinhörer.
Ein Test von Oliver Nickel

  1. Razer Kiyo und Seiren X im Test Nicht professionell, aber schnell im Einsatz
  2. Stereolautsprecher Razer Nommo "Sind das Haartrockner?"
  3. Nextbit Cloud-Speicher für Robin-Smartphone wird abgeschaltet

Datenverkauf bei Kommunen: Öffentliche Daten nicht verhökern, sondern sinnvoll nutzen
Datenverkauf bei Kommunen
Öffentliche Daten nicht verhökern, sondern sinnvoll nutzen

Der Städte- und Gemeindebund hat vorgeschlagen, Kommunen sollten ihre Daten verkaufen. Wie man es auch dreht und wendet: Es bleibt eine schlechte Idee.
Ein IMHO von Michael Peters und Walter Palmetshofer

  1. Gerichtsurteil Kein Recht auf anonyme IFG-Anfrage in Rheinland-Pfalz
  2. CDLA Linux Foundation veröffentlicht Open-Data-Lizenzen
  3. Deutscher Wetterdienst Wetterdaten sind jetzt Open Data

Digitalfotografie: Inkonsistentes Rauschen verrät den Fälscher
Digitalfotografie
Inkonsistentes Rauschen verrät den Fälscher

War der Anhänger wirklich so groß wie der Ring? Versucht da gerade einer, die Versicherung zu betuppen? Wenn Omas Erbstück geklaut wurde, muss die Versicherung wohl dem Digitalfoto des Geschädigten glauben. Oder sie engagiert einen Bildforensiker, der das Foto darauf untersucht, ob es bearbeitet wurde.
Ein Bericht von Werner Pluta

  1. iOS und Android Google lanciert drei experimentelle Foto-Apps
  2. Aufstecksucher für TL2 Entwarnung bei Leica

    •  /