Golem.de
 
Suchen bei Golem.de
Golem.de Newsletter-Abo
Videos bei Golem.de
Chris Davidson über Symbian Chris Davidson über Symbian
Stellenmarkt

Teamleiter/in im IT-Center
DELICom DPD GmbH, Aschaffenburg

Software-Entwickler (Junior) (m/w)
D.O.M. Datenverarbeitung GmbH, Nürnberg

Senior Projektmanager (m/w) bei Healthcare Deutschland
Siemens Healthcare, Erlangen

Detailsuche
Newsletterabo
Verwandte Themen

Wissenschaft, Internet, OCR, Spam

Verwandte Artikel
Letzte Meldungen

Belkins Powerline-Adapter sollen P1901-kompatibel werden

600 GByte mit 10.000 U/min von Seagate

British Library und Microsoft liefern kostenlose E-Books

Wenn Sicherheitssoftware zu Sicherheitslücken führt

KDE SC 4.4 - Caikaku macht einen großen Schritt

Quadriga Games - ein neues deutsches Spielestudio

Zoomit: SD-Kartenleser fürs iPhone

EA macht weniger Umsatz im Weihnachtsgeschäft

Wie geht es weiter mit dem Kindle?

Samsung S5620: Handy mit kapazitivem Touchscreen und WLAN

Aperture 3 lernt GPS, erkennt Gesichter und bekommt Pinsel

Aiptek MobileCinema D25 - Projektor mit DVD und DVB-T

Optimus: Grafikkerne im Notebook automatisch umschalten

Innenministerium gibt 2 Millionen Euro für Botnetzbekämpfung

Dalvik Turbo soll Android dreimal schneller machen

Amazons S3 lernt Versionierung

Copperlicht - 3D-Engine rendert Quake 3 im Browser

EU-Kommission bekennt Farbe zu ACTA

Samsung Shark: Drei Mobiltelefone für soziale Netzwerke

Kingston profitiert von Preisanstieg bei DRAM und Flash

Infocus-Projektoren über Funk auch mit dem Mac ansteuern

Tankstellen werden zu Akkuwechselstationen

AMD verrät Details zu CPU- und GPU-Kombination Llano

Microsoft: Windows 7 hat keine Probleme mit Notebookakkus

Flash soll auf Macs bald schneller laufen als unter Windows

Speedcommander 13.10 korrigiert Programmfehler

Radeon HD 5570 - DirectX-11 auch für Kompakt-PCs

Deutsche Telekom greift Kabel Deutschland an (Update)

Gallium 3D bringt DirectX für Linux und FreeBSD

IBMs Power7 - bis zu acht Kerne, 32 Threads und 4,1 GHz

Weitere News


Haben wir etwas übersehen? Dann Mail an news@golem.de.

HOME


Networld / 29.05.2007 / 10:32 Trackback     Versenden     Druck 

reCAPTCHA: Stoppt Spam, lest Bücher

Spam-Schutz soll helfen, gescannte Texte zu digitalisieren

Wissenschaftler der Carnegie-Mellon-Universität wollen Websites mit "reCAPTCHAs" vor automatisierten Spam-Angriffen schützen und zugleich die Digitalisierung von Büchern vorantreiben. Dabei arbeiten sie mit dem Internet Archive zusammen und werden von Intel unterstützt.

So genannte CAPTCHAs werden genutzt, um zwischen Mensch und Maschine zu unterscheiden und so automatisierten Spam aus Foren und Blog-Kommentaren zu verbannen oder beim Anlegen eines neuen E-Mail-Accounts sicherzustellen, dass ein Mensch am Rechner sitzt. Verzerrte, zum Teil schwer lesbare Buchstaben müssen erkannt werden, um z.B. einen Kommentar in einem so geschützten Blog zu hinterlassen. Sind die CAPTCHAs gut gemacht, wird es für Computerprogramme schwieriger, ungewollten Werbemüll abzusetzen.

Die Idee steht auch hinter den "reCAPTCHAs", doch werden hier gleich zwei Fliegen mit einer Klappe geschlagen: Statt zufälliger Buchstabenfolgen kommt gescannter Text zum Einsatz, bei dem die Texterkennung (OCR) versagt hat. So kann recht gut sichergestellt werden, dass eine Software den Text nicht erkennen kann, zugleich aber werden die Eingaben genutzt, um gescannte Texte auf diesem Weg von Menschen erkennen zu lassen.


Die gescannten Texte stellt das Internet Archive bereit, das im Rahmen der Open Content Alliance große Buchbestände digitalisiert. Um die erfassten Texte durchsuchbar zu machen, müssen sie von einer Texterkennung erfasst werden, was aber nicht immer funktioniert. Dies sollen nun Menschen ganz nebenbei übernehmen.

Statt also zufälliger Texte sollen Menschen bei den reCAPTCHAs Texte erkennen, die Computer nicht auswerten konnten. Dazu werden immer zwei Wörter präsentiert: eines, zu dem die Software bereits die Bedeutung kennt und so feststellen kann, ob der Nutzer den Text richtig erkannt hat, ein zweites, das dem System unbekannt ist und so nebenbei vom Nutzer erkannt wird. Die einzelnen Wörter werden dabei mehreren Nutzern präsentiert, um Fehler bei der Erkennung zu minimieren, denn wenn mehrere Nutzer die gleiche Übersetzung liefern, dürfte diese wohl korrekt sein.

Die Wissenschaftler um Professor Manuel Blum schätzen, dass täglich rund 60 Millionen CAPTCHAs entschlüsselt werden, was im Schnitt jeweils rund 10 Sekunden in Anspruch nimmt. So werden rund 150.000 Stunden an Arbeit verschwendet, die sie mit ihren reCAPTCHAs nutzen wollen.

Mit Unterstützung von Intel haben sie dazu unter recaptcha.net einen kostenlosen Webdienst aufgesetzt, der es Site-Betreibern erlaubt, ihre Seiten mit reCAPTCHAs zu bestücken. Lediglich große Websites mit hohem Traffic sollen zur Kasse gebeten werden.

Eine Erweiterung der reCAPTCHAs ist bereits in Arbeit: eine Audio-Version, die dann auch Blinde und Sehbehinderte nutzen können. Sie soll Teile von Radiosendungen erfassen, bei denen die Spracherkennung versagt hat. (ji)
Kommentar-Übersicht / Kommentieren:
Re: Recaptcha besser als Captcha im Spamschutz? (ATT3, 16.08.08 08:55)
Recaptcha besser als Captcha im Spamschutz? (Aldi_Kunde, 30.10.07 14:25)
Man kann NICHT jeden Scheiß eingeben (fooasdsad, 30.05.07 01:16)
Re: Das notwendige mit dem nütlichen verbinden (sfdfdsfsd, 29.05.07 18:34)
Noch dümmer (Rapidwait, 29.05.07 16:18)
Trackback:

Captcha hilft beim Digitalisieren von Büchern: reCaptcha (teifke.de, 08.07.07 16:00)

reCaptcha und so (memmaker, 29.05.07 20:33)

Outsourcing einmal anders (blackBlog, 29.05.07 11:05)

Links zum Artikel
Verwandte Artikel

reCaptcha (.net)


Mehr zum Thema RSS ATOM
Wissenschaft 2.0 1.0
Internet 2.0 1.0
OCR 2.0 1.0
Spam 2.0 1.0
Alle News 2.0 1.0

T-Online bald mit serverseitigem Viren- und Spamschutz

Auch Microsoft will eine Büchersuche starten

Open Content Alliance will Inhalte frei zugänglich machen

Yahoos Cache-Seiten mit Verweis auf Internet Archive

Eignet sich die Datei robots.txt als Kopierschutz?


 

Audio/Video | Desktop-Applikationen | Foto | Games | Handy | Internet | Mobil | OSS | PC-Hardware | Politik/Recht | Security | Software-Entwicklung | Wirtschaft | Wissenschaft

Ticker | RSS | API | Forum | Zusatz-Dienste | Jobs | IT-Events

Home | Impressum | Werbung | Freunde

Copyright © 1997 - 2010 Golem.de. Alle Rechte vorbehalten.

 

Zum Artikel Text einblenden Text ausblenden