Abo
  • IT-Karriere:

Maschinelles Lernen: RCN erkennt zwei Drittel aller Recaptchas automatisch

Das Team von Vicarious AI arbeitet an einem maschinellen Lernalgorithmus, der automatisch Captchas verschiedener Anbieter lösen kann. Anders als vegleichbare Systeme nutzt das Recursive Cortical Network (RCN) aber nur einzelne Klartextbuchstaben als Referenz. Das Ergebnis soll trotzdem besser sein.

Artikel veröffentlicht am ,
RCN erkennt Captchas automatisch.
RCN erkennt Captchas automatisch. (Bild: Vicarious AI)

Das kalifornische Startup-Unternehmen Vicarious AI entwickelt einen maschinellen Lernalgorithmus, der mit großer Präzision Captcha-Abfragen diverser Anbieter erkennen und ausfüllen kann. Das Recursive Cortical Network (RCN) erkennt Buchstaben und Zahlen, indem es deren Konturen, Oberflächenbeschaffenheit und Hintergrund analysiert, statt vollständige Bilder von Symbolen zu nutzen.

Stellenmarkt
  1. BWI GmbH, deutschlandweit
  2. Giesecke+Devrient Currency Technology GmbH, München

Als Vorgabe ist dem Modell die Struktur des Alphabets in Klartext gegeben, statt gelöste Captchas und deren Ausgangsbilder. In Anwendungsbeispielen verwenden die Mitarbeiter etwa die auf dem jeweiligen Computer installierten Schriftarten als Referenz für RCN.

  • Erfolgsquote von RCN und Konkurrenz bei Buchstabenabstand (Bild: Vicarious AI)
  • RCN rekonstruiert Buchstaben. (Bild: Vicarious AI)
  • Baumstruktur beim Erkennen von Mustern (Bild: Vicarious AI)
  • Der Buchstabe A als Problem für OCR-Systeme (Bild: Vicarious AI)
Baumstruktur beim Erkennen von Mustern (Bild: Vicarious AI)

Über diesen Ansatz baut der Algorithmus eine Art Abhängigkeitsbaum auf, beginnend bei einem ganz kleinen Ausschnitt des Quellbilds. Abschnitte werden zu Objekten zusammengefasst und mit anderen Objekten verglichen. Dabei achtet das Modell auf die Lage von Objekten zueinander, um das Muster eines Symbols zu erkennen. Passende Objekte werden im nächsten Schritt rekursiv zu Gruppen zusammengefasst. Das wiederholt sich, bis das Symbol vollständig analysiert wurde.

Hohe Genauigkeit bei wenig Ressourcenaufwand

Die Erfolgsquote scheint für den Algorithmus zu sprechen. RCN kann laut eigenen Aussagen damit eine Erfolgsquote von 94 Prozent pro Buchstaben bei Captchas von Recaptcha erreichen. Damit seien zwei Drittel aller so erzeugten Sicherheitsabfragen automatisch erkennbar. Der Mensch selbst hat eine Genauigkeit von 87 Prozent.

Captchas von Botdetect können mit einer ähnlich hohen Genauigkeit erkannt werden. Die Systeme von Yahoo und Paypal werden zu 57 Prozent gelöst. Ein Captcha gilt als sicher, wenn automatische Systeme nur ein Prozent der gestellten Begriffe erkennen.

RCN benötigt für die Lösung 260 Bilder von einzelnen Buchstaben. Andere Deep-Learning-Algorithmen benötigen etwa 50.000 Referenzbilder und sind damit wesentlich langsamer. Dadurch könnte es in Zukunft möglich sein, dass automatisierte Brute-Force-Passwortangriffe auf Webseiten auch auf weniger potenter Hardware ausgeführt werden können.



Anzeige
Hardware-Angebote
  1. 239,00€
  2. 73,90€ + Versand
  3. 72,99€ (Release am 19. September)

Trollversteher 01. Nov 2017

Hier geht es aber nicht um Messgeräte/algorithmische Erkennung, sondern maschinelles...

twothe 01. Nov 2017

Technisch ist das interessant was die Firma da macht, und kann beispielsweise bei der...

Benutzer0000 31. Okt 2017

1. spenden 2. pro x gelöste captchas werden y einheiten währung fällig 3. man hasst...

AllDayPiano 31. Okt 2017

Da scheitere ich jedes mal! Zu 90% brauche ich 2 versuche, zu 50% drei und mehr. Das...

Hotohori 31. Okt 2017

Ja, stimmt, schon öfters gehabt das wenn ich beim Passwort nicht mehr sicher war welches...


Folgen Sie uns
       


Timex Data Link ausprobiert

Die Data Link wurde von Timex und Microsoft entwickelt und ist eine der ersten Smartwatches. Anlässlich des 25-jährigen Jubiläums haben wir uns die Uhr genauer angeschaut - und über einen alten PC mit Röhrenmonitor programmiert.

Timex Data Link ausprobiert Video aufrufen
5G-Report: Nicht jedes Land braucht zur Frequenzvergabe Auktionen
5G-Report
Nicht jedes Land braucht zur Frequenzvergabe Auktionen

Die umstrittene Versteigerung von 5G-Frequenzen durch die Bundesnetzagentur ist zu Ende. Die Debatte darüber, wie Funkspektrum verteilt werden soll, geht weiter. Wir haben uns die Praxis in anderen Ländern angeschaut.
Ein Bericht von Stefan Krempl

  1. Telefónica Deutschland Samsung will in Deutschland 5G-Netze aufbauen
  2. Landtag Niedersachsen beschließt Ausstieg aus DAB+
  3. Vodafone 5G-Technik funkt im Werk des Elektroautoherstellers e.Go

Ada und Spark: Mehr Sicherheit durch bessere Programmiersprachen
Ada und Spark
Mehr Sicherheit durch bessere Programmiersprachen

Viele Sicherheitslücken in Software sind auf Programmierfehler zurückzuführen. Diese Fehler lassen sich aber vermeiden - und zwar unter anderem durch die Wahl einer guten Programmiersprache. Ada und Spark gehören dazu, leider sind sie immer noch wenig bekannt.
Von Johannes Kanig

  1. Das andere How-to Deutsch lernen für Programmierer
  2. Programmiersprachen, Pakete, IDEs So steigen Entwickler in Machine Learning ein

5G-Auktion: Warum der Preis der 5G-Frequenzen so hoch war
5G-Auktion
Warum der Preis der 5G-Frequenzen so hoch war

Dass die Frequenzen für den 5G-Mobilfunk teuer wurden, lasten Telekom, Vodafone und Telefónica dem Newcomer United Internet an. Doch dies ist laut dem Netzplaner Kai Seim nicht so gewesen.
Eine Analyse von Achim Sawall

  1. Funklöcher Hohe Bußgelder gegen säumige Mobilfunknetzbetreiber
  2. Bundesnetzagentur 5G-Frequenzauktion erreicht 6,5 Milliarden Euro
  3. 5G-Auktion Etablierte wollen Preis für 1&1 Drillisch hochtreiben

    •  /