Abo
  • Services:

Google übernimmt Recaptcha

Nutzer helfen, Bücher zu digitalisieren

Google kauft Recaptcha, ein Spin-off der Carnegie-Mellon-Universität, das hinter dem gleichnamigen Captcha-System steckt. Die Technik soll bei der Digitalisierung von Büchern helfen.

Artikel veröffentlicht am ,

Das Akronym "CAPTCHA" steht für "Completely Automated Public Turing test to tell Computers and Humans Apart". Mit zufälligen, schwer zu erkennenden Buchstabenfolgen sollen Computer vom Menschen unterschieden werden. Eingesetzt wird das Verfahren insbesondere als Spamschutz für Webseiten.

Stellenmarkt
  1. Bosch Gruppe, Berlin
  2. OKI EUROPE LIMITED, Branch Office Düsseldorf, Düsseldorf

Recaptcha verwendet hingegen keine zufälligen Buchstabenfolgen, sondern gescannten Text, bei dem die Texterkennung (OCR) versagt hat. So kann recht gut sichergestellt werden, dass eine Software den Text nicht erkennen kann, zugleich aber werden die Eingaben genutzt, um gescannte Texte auf diesem Weg von Menschen erkennen zu lassen.

Die gescannten Texte stellt bislang das Internet Archive bereit, das im Rahmen der Open Content Alliance große Buchbestände digitalisiert. Um die erfassten Texte durchsuchbar zu machen, müssen sie von einer Texterkennung erfasst werden, was aber nicht immer funktioniert. Dies sollen nun Menschen ganz nebenbei übernehmen, denen immer zwei Wörter präsentiert werden: eines, zu dem die Software bereits die Bedeutung kennt und so feststellen kann, ob der Nutzer den Text richtig erkannt hat, ein zweites, das dem System unbekannt ist und so nebenbei vom Nutzer erkannt wird. Die einzelnen Wörter werden dabei mehreren Nutzern präsentiert, um Fehler bei der Erkennung zu minimieren. Denn wenn mehrere Nutzer die gleiche Übersetzung liefern, dürfte diese wohl korrekt sein.

Gestartet ist Recaptcha im Mai 2007, heute kommt das System auf mehr als 100.000 Websites zum Einsatz. Allein im ersten Jahr haben die Nutzer mehr als 1,2 Milliarden Recaptchas gelöst und dabei 440 Millionen für Computer unlesbare Wörter entschlüsselt. Das entspricht einer stattlichen Bibliothek mit 17.600 Bänden. Täglich kommen derzeit rund 30 Millionen gelöste Recaptchas hinzu.

Künftig soll Recaptcha Google bei der Digitalisierung von Büchern helfen. Zusammen mit dem Recaptcha-Team will Google das System weiterentwickeln. Details zur Übernahme gab Google allerdings nicht bekannt.



Anzeige
Hardware-Angebote
  1. täglich neue Deals bei Alternate.de

Oktavian 17. Sep 2009

Ja hast du. Versuch es einfach nochmal. Kleiner Tipp: Könnte, rein prinzipiell, ein...

d2 17. Sep 2009

Sorry, das ist der größte Schwachsinn den ich in letzter Zeit gelesen habe! Was hindert...

d2 17. Sep 2009

Wie heißt die Firma bei der du arbeitest (falls du arbeitest)? Ich möchte auch gerne...

quentin 17. Sep 2009

Der Verlag der golem gekauft hat, gehört zu Holtzbrinck (u.a. Die Zeit)

Herb 17. Sep 2009

ja aber echt Dass Google ganz andere Möglichkeiten zur Verknüpfung der Daten hat, ist au...


Folgen Sie uns
       


Commodore CDTV (1991) - Golem retro_

Das CDTV wurde in den frühen 1990er Jahren von Commodore als High-End-Multimediasystem auf den Markt gebracht. Wir beleuchten die Hintergründe seines Scheiterns und spielen Exklusivtitel.

Commodore CDTV (1991) - Golem retro_ Video aufrufen
Urheberrecht: Warum die Kreativwirtschaft plötzlich Uploadfilter ablehnt
Urheberrecht
Warum die Kreativwirtschaft plötzlich Uploadfilter ablehnt

Eigentlich sollte der umstrittene Artikel 13 der EU-Urheberrechtsreform die Rechteinhaber gegenüber Plattformen wie Youtube stärken. Doch nun warnen TV-Sender und Medien vor Nachteilen durch das Gesetz. Software-Entwickler sollen keine zusätzlichen Rechte bekommen.
Von Friedhelm Greis

  1. Leistungsschutzrecht und Uploadfilter EU-Länder bremsen Urheberrechtsreform aus
  2. EuGH-Gutachten Deutsches Leistungsschutzrecht soll unzulässig sein
  3. Leistungsschutzrecht So oft könnten Verlage künftig an Bezahlartikeln verdienen

Zweite Staffel Star Trek Discovery: Weniger Wumms, mehr Story
Zweite Staffel Star Trek Discovery
Weniger Wumms, mehr Story

Charakterentwicklung, weniger Lens Flares, dazu eine spannende neue Storyline: Nach dem etwas mauen Ende der ersten Staffel von Star Trek: Discovery macht der Beginn der zweiten Lust auf mehr. Achtung Spoiler!
Eine Rezension von Tobias Költzsch

  1. Discovery-Spin-off Neue Star-Trek-Serie mit Michelle Yeoh geplant
  2. Star Trek Ende 2019 geht es mit Jean-Luc Picard in die Zukunft
  3. Star Trek Captain Kirk beharrt auf seinem Gehalt

Bright Memory angespielt: Brachialer PC-Shooter aus China
Bright Memory angespielt
Brachialer PC-Shooter aus China

Nur ein Entwickler und lediglich eine Stunde Spielzeit - trotzdem wischt das nur rund 6 Euro teure und ausschließlich für Windows-PC erhältliche Bright Memory mit vielen Vollpreisspielen den Boden. Selbst die vollständig chinesische Sprachausgabe stört fast nicht.

  1. Strange Brigade angespielt Feuergefechte mit Mumien und Monstern

    •  /