Uncaptcha: Forscher überwinden Recaptcha mit Google-Sprachanalyse

Mit dem Google-Dienst Recaptcha sollen Menschen auf Webseiten nachweisen, dass sie tatsächlich Menschen sind und eben keine Bots, die zum Beispiel ein Forum mit Spam befüllen wollen. Forscher der University of Maryland haben mit Uncaptcha eine Methode(öffnet im neuen Fenster) entwickelt, um dieses System automatisiert zu überwinden. Bei der Verwendung von Googles eigener Sprachanalyse für Speech-to-Text gelingt das den Forschern zufolge sogar in 90 Prozent der Fälle, wie Motherboard berichtet(öffnet im neuen Fenster) .
Die Forschergruppe hatte demzufolge bereits im Jahr 2017 erste Vorarbeiten zu Uncaptcha geleistet. Die Vorgehensweise der Forscher nutzt dabei aus, dass Recaptcha für Menschen mit Sehbehinderung als Alternative zu Bildern eine Art Audio-Captcha verwendet. Die Idee der Arbeit ist nun, dieses Audio-Captcha automatisiert durch eine Speech-to-Text-Engine analysieren zu lassen.
Damit lässt sich, wie die Forscher zeigen, nicht nur theoretisch das vorgelesene Captcha wieder maschinell zurückgewinnen und automatisiert in das Formular von Google einpflegen. In einer ersten Version von Recaptcha wurden dafür vorgelesene Ziffern genutzt und das Forscherteam konnte diese mit einer Erfolgsrate von etwa 85 Prozent zurückgewinnen.
Besseres Ergebnis, dank Google-Umbau
Google hat seinen Captcha-Dienst daraufhin offenbar umgebaut und nutzt als sogenannte Audio-Challenge nun nicht mehr Ziffern, sondern ganze Phrasen. Das Überwinden von Recaptcha sei nun aber "einfacher als je zuvor" . Der Code benötige nun nur noch eine einzige Anfrage an ein öffentliches Speech-to-Text-API, um eine Erfolgsrate von 90 Prozent zu erreichen.
Eigenen Angaben zufolge haben die Forscher das zuständige Team bei Google vor rund einem halb Jahr über ihre Ergebnisse in Kenntnis gesetzt. Darüber hinaus habe das Team von Google kein Problem damit, dass die Forscher den Code zu ihren Ergebnissen nun veröffentlichen. Ob und inwiefern Google diese Lücke in seinem Captcha-System überwindet, ist derzeit nicht bekannt.



