Original-URL des Artikels: https://www.golem.de/news/maschinelles-lernen-biometrisches-captcha-nutzt-sprache-und-bild-1802-132937.html    Veröffentlicht: 22.02.2018 16:25    Kurz-URL: https://glm.io/132937

Maschinelles Lernen

Biometrisches Captcha nutzt Sprache und Bild

Gefilmt werden und eine Frage mündlich beantworten: Ein neues biometrisches Captcha-System soll verhindern, dass Algorithmen die Abfragen austricksen. Die Lösungszeit macht dabei den Unterschied zwischen Mensch und Maschine.

Forscher der Tech School of Computer Science im US-Bundesstaat Georgia entwickeln eine biometrische Captcha-Abfrage mit mehreren integrierten Sicherheitsmechanismen. Diese Software nutzt die Kamera eines Hostgerätes, um die Nutzer aufzunehmen und als Menschen zu identifizieren. In Zeiten, in denen Machine-Learning-Systeme Captchas leicht umgehen können, soll diese Methode wieder Sicherheit schaffen.

Die Authentifizierung wird per Bild und Ton durchgeführt. Der Algorithmus analysiert neben dem Gesicht auch die Spracheingabe der Nutzer, während diese eine auf dem Bildschirm angezeigte Frage mündlich beantworten müssen. Das System übersetzt das Gesprochene in einen für das Hostgerät verständlichen String und vergleicht ihn mit der gespeicherten Antwort.

Die Kombination aus Audio- und Videobeweis soll es Angreifern und automatisierten Systemen schwer machen, ein solches Captcha auszutricksen. Projektmitarbeiter Erkam Uzun sagt dazu: "Wir machen die Hürder schwieriger überwindbar, indem wir den Nutzern unvorhersehbare Abfragen senden". Gestellte Fragen werden demnach zufällig ausgewählt.

Zeitunterschied zwischen Mensch und Maschine

Trotzdem: Selbst die Authentifizierung per Stimme und Bild ist nicht vor dem Überlisten sicher. Eine Maschine soll es laut dem Forschungspapier innerhalb von sechs bis zehn Sekunden schaffen, eine Audiospur nachzustellen. Ein echter Mensch benötigt hingegen nur etwa eine Sekunde. Dieser Zeitunterschied ist das Kriterium, das Maschinen auch als solche verraten soll.

Getestet wurde das Konzept mit 30 Testpersonen. Damit sind die Erkenntnisse noch nicht repräsentativ für eine größere Bevölkerungsgruppe. Es bleibt auch abzuwarten, wie eine audiovisuelle Captcha-Abfrage auf Webseitenbesucher wirkt. Wahrscheinlich dürfte es eine solche Technik es erst einmal schwierig haben, sich zu etablieren - vor allem, wenn Nutzer nicht wissen, wo ihre Gesichts- und Stimmdaten gespeichert und ausgewertet werden.  (on)


Verwandte Artikel:
Microsoft: KI-Framework kommt auf Windows-10-Endgeräte   
(08.03.2018, https://glm.io/133217 )
Tensorflow: Das US-Militär nutzt KI-Systeme von Google   
(07.03.2018, https://glm.io/133194 )
Wintersport: Roboter Curly spielt Curling   
(08.03.2018, https://glm.io/133219 )
Nvidia: Neuronales Netzwerk generiert fotorealistische Bilder   
(01.11.2017, https://glm.io/130913 )
Neues Captcha: Facebook verlangt Foto zur Identifizierung   
(29.11.2017, https://glm.io/131379 )

© 1997–2019 Golem.de, https://www.golem.de/