Maschinelles Lernen: RCN erkennt zwei Drittel aller Recaptchas automatisch
Das Team von Vicarious AI arbeitet an einem maschinellen Lernalgorithmus, der automatisch Captchas verschiedener Anbieter lösen kann. Anders als vegleichbare Systeme nutzt das Recursive Cortical Network (RCN) aber nur einzelne Klartextbuchstaben als Referenz. Das Ergebnis soll trotzdem besser sein.

Das kalifornische Startup-Unternehmen Vicarious AI entwickelt einen maschinellen Lernalgorithmus, der mit großer Präzision Captcha-Abfragen diverser Anbieter erkennen und ausfüllen kann. Das Recursive Cortical Network (RCN) erkennt Buchstaben und Zahlen, indem es deren Konturen, Oberflächenbeschaffenheit und Hintergrund analysiert, statt vollständige Bilder von Symbolen zu nutzen.
Als Vorgabe ist dem Modell die Struktur des Alphabets in Klartext gegeben, statt gelöste Captchas und deren Ausgangsbilder. In Anwendungsbeispielen verwenden die Mitarbeiter etwa die auf dem jeweiligen Computer installierten Schriftarten als Referenz für RCN.
Über diesen Ansatz baut der Algorithmus eine Art Abhängigkeitsbaum auf, beginnend bei einem ganz kleinen Ausschnitt des Quellbilds. Abschnitte werden zu Objekten zusammengefasst und mit anderen Objekten verglichen. Dabei achtet das Modell auf die Lage von Objekten zueinander, um das Muster eines Symbols zu erkennen. Passende Objekte werden im nächsten Schritt rekursiv zu Gruppen zusammengefasst. Das wiederholt sich, bis das Symbol vollständig analysiert wurde.
Hohe Genauigkeit bei wenig Ressourcenaufwand
Die Erfolgsquote scheint für den Algorithmus zu sprechen. RCN kann laut eigenen Aussagen damit eine Erfolgsquote von 94 Prozent pro Buchstaben bei Captchas von Recaptcha erreichen. Damit seien zwei Drittel aller so erzeugten Sicherheitsabfragen automatisch erkennbar. Der Mensch selbst hat eine Genauigkeit von 87 Prozent.
Captchas von Botdetect können mit einer ähnlich hohen Genauigkeit erkannt werden. Die Systeme von Yahoo und Paypal werden zu 57 Prozent gelöst. Ein Captcha gilt als sicher, wenn automatische Systeme nur ein Prozent der gestellten Begriffe erkennen.
RCN benötigt für die Lösung 260 Bilder von einzelnen Buchstaben. Andere Deep-Learning-Algorithmen benötigen etwa 50.000 Referenzbilder und sind damit wesentlich langsamer. Dadurch könnte es in Zukunft möglich sein, dass automatisierte Brute-Force-Passwortangriffe auf Webseiten auch auf weniger potenter Hardware ausgeführt werden können.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
- ohne Werbung
- mit ausgeschaltetem Javascript
- mit RSS-Volltext-Feed
Hier geht es aber nicht um Messgeräte/algorithmische Erkennung, sondern maschinelles...
Technisch ist das interessant was die Firma da macht, und kann beispielsweise bei der...
1. spenden 2. pro x gelöste captchas werden y einheiten währung fällig 3. man hasst...
Da scheitere ich jedes mal! Zu 90% brauche ich 2 versuche, zu 50% drei und mehr. Das...