Abo
  • Services:
Anzeige

Google übernimmt Recaptcha

Nutzer helfen, Bücher zu digitalisieren

Google kauft Recaptcha, ein Spin-off der Carnegie-Mellon-Universität, das hinter dem gleichnamigen Captcha-System steckt. Die Technik soll bei der Digitalisierung von Büchern helfen.

Das Akronym "CAPTCHA" steht für "Completely Automated Public Turing test to tell Computers and Humans Apart". Mit zufälligen, schwer zu erkennenden Buchstabenfolgen sollen Computer vom Menschen unterschieden werden. Eingesetzt wird das Verfahren insbesondere als Spamschutz für Webseiten.

Recaptcha verwendet hingegen keine zufälligen Buchstabenfolgen, sondern gescannten Text, bei dem die Texterkennung (OCR) versagt hat. So kann recht gut sichergestellt werden, dass eine Software den Text nicht erkennen kann, zugleich aber werden die Eingaben genutzt, um gescannte Texte auf diesem Weg von Menschen erkennen zu lassen.

Anzeige

Die gescannten Texte stellt bislang das Internet Archive bereit, das im Rahmen der Open Content Alliance große Buchbestände digitalisiert. Um die erfassten Texte durchsuchbar zu machen, müssen sie von einer Texterkennung erfasst werden, was aber nicht immer funktioniert. Dies sollen nun Menschen ganz nebenbei übernehmen, denen immer zwei Wörter präsentiert werden: eines, zu dem die Software bereits die Bedeutung kennt und so feststellen kann, ob der Nutzer den Text richtig erkannt hat, ein zweites, das dem System unbekannt ist und so nebenbei vom Nutzer erkannt wird. Die einzelnen Wörter werden dabei mehreren Nutzern präsentiert, um Fehler bei der Erkennung zu minimieren. Denn wenn mehrere Nutzer die gleiche Übersetzung liefern, dürfte diese wohl korrekt sein.

Gestartet ist Recaptcha im Mai 2007, heute kommt das System auf mehr als 100.000 Websites zum Einsatz. Allein im ersten Jahr haben die Nutzer mehr als 1,2 Milliarden Recaptchas gelöst und dabei 440 Millionen für Computer unlesbare Wörter entschlüsselt. Das entspricht einer stattlichen Bibliothek mit 17.600 Bänden. Täglich kommen derzeit rund 30 Millionen gelöste Recaptchas hinzu.

Künftig soll Recaptcha Google bei der Digitalisierung von Büchern helfen. Zusammen mit dem Recaptcha-Team will Google das System weiterentwickeln. Details zur Übernahme gab Google allerdings nicht bekannt.


eye home zur Startseite
Oktavian 17. Sep 2009

Ja hast du. Versuch es einfach nochmal. Kleiner Tipp: Könnte, rein prinzipiell, ein...

d2 17. Sep 2009

Sorry, das ist der größte Schwachsinn den ich in letzter Zeit gelesen habe! Was hindert...

d2 17. Sep 2009

Wie heißt die Firma bei der du arbeitest (falls du arbeitest)? Ich möchte auch gerne...

quentin 17. Sep 2009

Der Verlag der golem gekauft hat, gehört zu Holtzbrinck (u.a. Die Zeit)

Herb 17. Sep 2009

ja aber echt Dass Google ganz andere Möglichkeiten zur Verknüpfung der Daten hat, ist au...


Developer's Guide / 16. Sep 2009



Anzeige

Stellenmarkt
  1. Pixelgenau Consulting GmbH, Frankfurt am Main
  2. über Robert Half Deutschland GmbH & Co. KG, Großraum Düsseldorf
  3. FUCHS SCHMIERSTOFFE GmbH, Mannheim
  4. T-Systems International GmbH, verschiedene Standorte


Anzeige
Top-Angebote
  1. 34,76€ (Bestpreis!)

Folgen Sie uns
       


  1. China

    Dropbox-Alternative Seafile im Streit mit Mutterkonzern

  2. Verizon Communications

    Yahoo hat einen Käufer gefunden

  3. Deutschland

    Preiserhöhung bei Netflix jetzt auch für Bestandskunden

  4. Künstliche Intelligenz

    Softbank und Honda wollen sprechendes Auto bauen

  5. Alternatives Android

    Cyanogen soll zahlreiche Mitarbeiter entlassen

  6. Update

    Onedrive erstellt automatisierte Alben und erkennt Pokémon

  7. Die Woche im Video

    Ausgesperrt, ausprobiert, ausgetüftelt

  8. 100 MBit/s

    Zusagen der Bundesnetzagentur drücken Preis für Vectoring

  9. Insolvenz

    Unister Holding mit 39 Millionen Euro verschuldet

  10. Radeons RX 480

    Die Designs von AMDs Partnern takten höher - und konstanter



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Schwachstellen aufgedeckt: Der leichtfertige Umgang mit kritischen Infrastrukturen
Schwachstellen aufgedeckt
Der leichtfertige Umgang mit kritischen Infrastrukturen
  1. Vodafone EasyBox 804 Angeblich Hochladen von Schadsoftware möglich
  2. Cyber Grand Challenge Finale US-Militär lässt Computer als Hacker aufeinander los
  3. Patchday Sicherheitslücke lässt Drucker Malware verteilen

Miniscooter: E-Floater, der Elektroroller für die letzte Meile
Miniscooter
E-Floater, der Elektroroller für die letzte Meile
  1. Leistungsschutzrecht Kollateralschäden eines unsinnigen Gesetzes
  2. Relativity Space Raketenbau ohne Menschen
  3. Besuch bei Senic Das Kreuzberger Shenzhen

Pokémon Go im Test: Hype in der Großstadt, Flaute auf dem Land
Pokémon Go im Test
Hype in der Großstadt, Flaute auf dem Land
  1. Pokémon Go Monsterjagd im Heimatland
  2. Pokémon Go Verbraucherschützer reichen Abmahnung gegen Niantic ein
  3. Nintendo auf dem Smartphone Pokémon Go Out!

  1. Re: Netflix ist es wert

    gudixd | 04:12

  2. Re: Ich glaube den Chinesen

    quasides | 02:15

  3. Re: Gut so, hoffentlich bald alle arbeitslos

    Pjörn | 02:08

  4. Re: Der Grund war eindeutig.

    zampata | 01:26

  5. Re: Immer noch kein HBM?

    ms (Golem.de) | 01:05


  1. 15:30

  2. 14:13

  3. 12:52

  4. 15:17

  5. 14:19

  6. 13:08

  7. 09:01

  8. 18:26


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel