Google übernimmt Recaptcha

Nutzer helfen, Bücher zu digitalisieren

Google kauft Recaptcha, ein Spin-off der Carnegie-Mellon-Universität, das hinter dem gleichnamigen Captcha-System steckt. Die Technik soll bei der Digitalisierung von Büchern helfen.

Artikel veröffentlicht am ,

Das Akronym "CAPTCHA" steht für "Completely Automated Public Turing test to tell Computers and Humans Apart". Mit zufälligen, schwer zu erkennenden Buchstabenfolgen sollen Computer vom Menschen unterschieden werden. Eingesetzt wird das Verfahren insbesondere als Spamschutz für Webseiten.

Stellenmarkt
  1. Informatiker (w/m/d) für elektronische Formularverarbeitung
    Stadt Erlangen, Erlangen
  2. Technical Account Manager (m/f/d)
    SoSafe GmbH, Köln (Home-Office möglich)
Detailsuche

Recaptcha verwendet hingegen keine zufälligen Buchstabenfolgen, sondern gescannten Text, bei dem die Texterkennung (OCR) versagt hat. So kann recht gut sichergestellt werden, dass eine Software den Text nicht erkennen kann, zugleich aber werden die Eingaben genutzt, um gescannte Texte auf diesem Weg von Menschen erkennen zu lassen.

Die gescannten Texte stellt bislang das Internet Archive bereit, das im Rahmen der Open Content Alliance große Buchbestände digitalisiert. Um die erfassten Texte durchsuchbar zu machen, müssen sie von einer Texterkennung erfasst werden, was aber nicht immer funktioniert. Dies sollen nun Menschen ganz nebenbei übernehmen, denen immer zwei Wörter präsentiert werden: eines, zu dem die Software bereits die Bedeutung kennt und so feststellen kann, ob der Nutzer den Text richtig erkannt hat, ein zweites, das dem System unbekannt ist und so nebenbei vom Nutzer erkannt wird. Die einzelnen Wörter werden dabei mehreren Nutzern präsentiert, um Fehler bei der Erkennung zu minimieren. Denn wenn mehrere Nutzer die gleiche Übersetzung liefern, dürfte diese wohl korrekt sein.

Gestartet ist Recaptcha im Mai 2007, heute kommt das System auf mehr als 100.000 Websites zum Einsatz. Allein im ersten Jahr haben die Nutzer mehr als 1,2 Milliarden Recaptchas gelöst und dabei 440 Millionen für Computer unlesbare Wörter entschlüsselt. Das entspricht einer stattlichen Bibliothek mit 17.600 Bänden. Täglich kommen derzeit rund 30 Millionen gelöste Recaptchas hinzu.

Golem Akademie
  1. Hands-on C# Programmierung: virtueller Zwei-Tage-Workshop
    12.–13. Januar 2022, virtuell
  2. Linux-Shellprogrammierung: virtueller Vier-Tage-Workshop
    8.–11. März 2021, Virtuell
Weitere IT-Trainings

Künftig soll Recaptcha Google bei der Digitalisierung von Büchern helfen. Zusammen mit dem Recaptcha-Team will Google das System weiterentwickeln. Details zur Übernahme gab Google allerdings nicht bekannt.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Oktavian 17. Sep 2009

Ja hast du. Versuch es einfach nochmal. Kleiner Tipp: Könnte, rein prinzipiell, ein...

d2 17. Sep 2009

Sorry, das ist der größte Schwachsinn den ich in letzter Zeit gelesen habe! Was hindert...

d2 17. Sep 2009

Wie heißt die Firma bei der du arbeitest (falls du arbeitest)? Ich möchte auch gerne...

quentin 17. Sep 2009

Der Verlag der golem gekauft hat, gehört zu Holtzbrinck (u.a. Die Zeit)

Herb 17. Sep 2009

ja aber echt Dass Google ganz andere Möglichkeiten zur Verknüpfung der Daten hat, ist au...



Aktuell auf der Startseite von Golem.de
Resident Evil (1996)
Grauenhaft gut

Resident Evil zeigte vor 25 Jahren, wie Horror im Videospiel auszusehen hat. Wir schauen uns den Klassiker im Golem retro_ an.

Resident Evil (1996): Grauenhaft gut
Artikel
  1. Studie: Kinder erhalten Smartphone meist zwischen 6 und 11 Jahren
    Studie
    Kinder erhalten Smartphone meist zwischen 6 und 11 Jahren

    Nur eine sehr geringe Minderheit der Eltern will ihrem Kind erst mit 15 Jahren ein Smartphone zur Verfügung stellen.

  2. IT-Sicherheit: MI5-Expertin fordert gemeinsame Abwehr von Cyber-Gefahren
    IT-Sicherheit
    MI5-Expertin fordert gemeinsame Abwehr von Cyber-Gefahren

    Der britische Geheimdienst warnt vor staatlich unterstützen Cyberattacken und manipulativer Wahleinmischung durch fremde Staaten.

  3. Kanadische Polizei: Diebe nutzen Apples Airtags zum Tracking von Luxuswagen
    Kanadische Polizei
    Diebe nutzen Apples Airtags zum Tracking von Luxuswagen

    Autodiebe in Kanada nutzen offenbar Apples Airtags, um Fahrzeuge heimlich zu orten.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Saturn-Advent: Samsung Portable SSD T5 1 TB 84€ • ViewSonic VX2718-2KPC-MHD (WQHD, 165 Hz) 229€ • EPOS Sennheiser GSP 670 199€ • EK Water Blocks Elite Aurum 360 D-RGB All in One 205,89€ • KFA2 Geforce RTX 3070 OC 8 GB 1.019€ • Alternate (u. a. AKRacing Core SX 269,98€) [Werbung]
    •  /