Abo
  • Services:
Anzeige

Google übernimmt Recaptcha

Nutzer helfen, Bücher zu digitalisieren

Google kauft Recaptcha, ein Spin-off der Carnegie-Mellon-Universität, das hinter dem gleichnamigen Captcha-System steckt. Die Technik soll bei der Digitalisierung von Büchern helfen.

Das Akronym "CAPTCHA" steht für "Completely Automated Public Turing test to tell Computers and Humans Apart". Mit zufälligen, schwer zu erkennenden Buchstabenfolgen sollen Computer vom Menschen unterschieden werden. Eingesetzt wird das Verfahren insbesondere als Spamschutz für Webseiten.

Recaptcha verwendet hingegen keine zufälligen Buchstabenfolgen, sondern gescannten Text, bei dem die Texterkennung (OCR) versagt hat. So kann recht gut sichergestellt werden, dass eine Software den Text nicht erkennen kann, zugleich aber werden die Eingaben genutzt, um gescannte Texte auf diesem Weg von Menschen erkennen zu lassen.

Anzeige

Die gescannten Texte stellt bislang das Internet Archive bereit, das im Rahmen der Open Content Alliance große Buchbestände digitalisiert. Um die erfassten Texte durchsuchbar zu machen, müssen sie von einer Texterkennung erfasst werden, was aber nicht immer funktioniert. Dies sollen nun Menschen ganz nebenbei übernehmen, denen immer zwei Wörter präsentiert werden: eines, zu dem die Software bereits die Bedeutung kennt und so feststellen kann, ob der Nutzer den Text richtig erkannt hat, ein zweites, das dem System unbekannt ist und so nebenbei vom Nutzer erkannt wird. Die einzelnen Wörter werden dabei mehreren Nutzern präsentiert, um Fehler bei der Erkennung zu minimieren. Denn wenn mehrere Nutzer die gleiche Übersetzung liefern, dürfte diese wohl korrekt sein.

Gestartet ist Recaptcha im Mai 2007, heute kommt das System auf mehr als 100.000 Websites zum Einsatz. Allein im ersten Jahr haben die Nutzer mehr als 1,2 Milliarden Recaptchas gelöst und dabei 440 Millionen für Computer unlesbare Wörter entschlüsselt. Das entspricht einer stattlichen Bibliothek mit 17.600 Bänden. Täglich kommen derzeit rund 30 Millionen gelöste Recaptchas hinzu.

Künftig soll Recaptcha Google bei der Digitalisierung von Büchern helfen. Zusammen mit dem Recaptcha-Team will Google das System weiterentwickeln. Details zur Übernahme gab Google allerdings nicht bekannt.


eye home zur Startseite
Oktavian 17. Sep 2009

Ja hast du. Versuch es einfach nochmal. Kleiner Tipp: Könnte, rein prinzipiell, ein...

d2 17. Sep 2009

Sorry, das ist der größte Schwachsinn den ich in letzter Zeit gelesen habe! Was hindert...

d2 17. Sep 2009

Wie heißt die Firma bei der du arbeitest (falls du arbeitest)? Ich möchte auch gerne...

quentin 17. Sep 2009

Der Verlag der golem gekauft hat, gehört zu Holtzbrinck (u.a. Die Zeit)

Herb 17. Sep 2009

ja aber echt Dass Google ganz andere Möglichkeiten zur Verknüpfung der Daten hat, ist au...



Anzeige

Stellenmarkt
  1. Bertrandt Technikum GmbH, Ehningen bei Stuttgart
  2. CompuGroup Medical Dentalsysteme GmbH, München, Kassel, Düsseldorf
  3. Robert Bosch GmbH, Schwieberdingen
  4. DLR Deutsches Zentrum für Luft- und Raumfahrt e.V., Braunschweig


Anzeige
Hardware-Angebote
  1. bei Alternate
  2. 399€ + 3,99€ Versand

Folgen Sie uns
       


  1. U2F

    Yubico bringt winzigen Yubikey für USB-C

  2. Windows 10

    Windows Store wird zum Microsoft Store mit Hardwareangeboten

  3. Kabelnetz

    Eazy senkt Preis für 50-MBit/s-Zugang im Unitymedia-Netz

  4. Nintendo

    Super Mario Run wird umfangreicher und günstiger

  5. Seniorenhandys im Test

    Alter, sind die unpraktisch!

  6. PixelNN

    Mit Machine Learning unscharfe Bilder erkennbar machen

  7. Mobilfunk

    O2 in bayerischer Gemeinde seit 18 Tagen gestört

  8. Elektroauto

    Tesla schafft günstigstes Model S ab

  9. Bundestagswahl 2017

    IT-Probleme verzögerten Stimmübermittlung

  10. Fortnite Battle Royale

    Entwickler von Pubg sorgt sich wegen Unreal Engine



Haben wir etwas übersehen?

E-Mail an news@golem.de


Anzeige
Olympus Tough TG5 vs. Nikon Coolpix W300: Die Schlechtwetter-Kameras
Olympus Tough TG5 vs. Nikon Coolpix W300
Die Schlechtwetter-Kameras
  1. Mobilestudio Pro 16 im Test Wacom nennt 2,2-Kilogramm-Grafiktablet "mobil"
  2. HP Z8 Workstation Mit 3 TByte RAM und 56 CPU-Kernen komplexe Bilder rendern
  3. Meeting Owl KI-Eule erkennt Teilnehmer in Meetings

VR: Was HTC, Microsoft und Oculus mit Autos zu tun haben
VR
Was HTC, Microsoft und Oculus mit Autos zu tun haben
  1. Zukunft des Autos "Unsere Elektrofahrzeuge sollen typische Porsche sein"
  2. Concept EQA Mercedes elektrifiziert die Kompaktklasse
  3. GLC F-Cell Mercedes stellt SUV mit Brennstoffzelle und Akku vor

Parkplatz-Erkennung: Bosch und Siemens scheitern mit Pilotprojekten
Parkplatz-Erkennung
Bosch und Siemens scheitern mit Pilotprojekten
  1. Community based Parking Mercedes S-Klasse liefert Daten für Boschs Parkplatzsuche

  1. Re: Selber machen

    Phreeze | 15:52

  2. Re: und die anderen 9?

    Dwalinn | 15:50

  3. Re: Verkaufen sich diese CPUs überhaupt?

    mess-with-the-best | 15:49

  4. Re: Drecks-Laden

    DetlevCM | 15:49

  5. Re: Seit 6 Monaten Win10, aber ...

    Subotai | 15:47


  1. 15:31

  2. 13:28

  3. 13:17

  4. 12:25

  5. 12:02

  6. 11:58

  7. 11:34

  8. 11:19


  1. Themen
  2. A
  3. B
  4. C
  5. D
  6. E
  7. F
  8. G
  9. H
  10. I
  11. J
  12. K
  13. L
  14. M
  15. N
  16. O
  17. P
  18. Q
  19. R
  20. S
  21. T
  22. U
  23. V
  24. W
  25. X
  26. Y
  27. Z
  28. #
 
    •  / 
    Zum Artikel