Abo
  • Services:

Project Naptha: Texterkennung im Browser erspart lästiges Abtippen

Mit dem Google-Chrome-Plugin Naptha können Texte aus Bilddateien kopiert werden. Das erspart mitunter viel Tipparbeit und funktioniert erstaunlich gut, wie ein Test von Golem.de zeigte. Der Text kann dabei sogar aus dem Bild entfernt werden.

Artikel veröffentlicht am ,
Project Naptha
Project Naptha (Bild: Project Naptha)

Texte in Bilddateien sind im Web ständig zu finden - mit Project Naptha können sie bequem markiert und kopiert werden. Doch bevor die optische Zeichenerkennung möglich ist, muss der Text in den Bildern erst vom Hintergrund isoliert werden, was ein Algorithmus von Microsoft erledigt.

Stellenmarkt
  1. Techem GmbH, Eschborn
  2. DRACHOLIN GmbH, Metzingen

Der Text im Bild wird einfach mit der Maus markiert und kann nach kurzer Zeit kopiert oder mittels Google Translate sogar übersetzt werden. Das ist besonders bei asiatischen Webseiten interessant, auf denen häufig aus Layoutgründen Grafiken statt richtiger Texte eingesetzt werden. Selbst aus Comics oder gar Screenshots können mit dem Plugin Texte extrahiert werden. Schräg verlaufende Schrift bis zu einem Winkel von 30 Grad wird ebenfalls erkannt.

Project Naptha ist eine Entwicklung des MIT-Studenten Kevin "antimatter" Kwok. Napta ist mehr als eine reine OCR-Funktion, denn das System funktioniert auch bei Bildern, bei denen der Text vor einem Muster abgebildet ist.

Naptha löscht auch Texte aus Bildern

Die Text-Entfernungsfunktion zeigt, dass Project Naptha den Text im Bild zunächst isoliert. Das Entfernen funktioniert ähnlich wie die Photoshop-Funktion Content-Aware Fill. Die Identifizierung von Texten wird mit der Stroke Width Transform (SWT) von Microsoft Research durchgeführt. Dieser Algorithmus identifiziert Text anhand der Eigenschaft der meisten Schriftarten, gleiche Strichbreiten zu verwenden. Ist das geschehen, wird das Extrakt zu einem Webdienst für die optische Zeichenerkennung geschickt, der mit der Engine Ocrad läuft. Wer will, kann auch Googles Tesseract-Engine nutzen. Möglich ist auch eine Übersetzung des Textes, die dann anstelle des Originaltextes im Bild erscheint. Dabei versucht der Algorithmus, die Originalschrift nachzuahmen, doch das funktioniert nicht immer.

Gute Erkennungsrate

Im Test von Golem.de konnte Naptha durchaus überzeugen. In vielen Bildern wurden die Buchstaben korrekt erkannt, wobei besonders kleine Schriften naturgemäß größere Probleme verursachen. Auch sehr groß gestaltete Texte sind ein Hindernis für das System, das aber für den Alltag ausreicht, wenn es zum Beispiel darum geht, aus Screenshots oder aus abfotografierten Texten den Inhalt zu extrahieren.

Die Google-Chrome-Extension Naptha ist derzeit kostenlos über Googles Webstore zu beziehen.



Anzeige
Spiele-Angebote
  1. 34,99€ (erscheint am 14.02.)
  2. (-80%) 7,99€
  3. 28,49€ (erscheint am 15.02.)

__destruct() 26. Apr 2014

Sorry, ich habe in meinem Post 13.04 geschrieben. Ich nutze aber 14.04 und dachte, du...

Avarion 24. Apr 2014

Danke dir. Werde ich mal probieren.

slashwalker 24. Apr 2014

Also bei mir nicht. Hab es gerade beim Denic Whois ausprobiert.

Himmerlarschund... 24. Apr 2014

Ich glaube, dieses Tool ist für Captchas nicht sonderlich sinnvoll. "Die Identifizierung...

81u3x4r 24. Apr 2014

Ah, hab das gar nicht versucht. Danke!


Folgen Sie uns
       


Galaxy S10e, Galaxy S10 und Galaxy S10 im Hands on

Samsung hat seine neue Galaxy-S10-Serie auf mehrere Bildschirmgrößen aufgeteilt. Besonders das "kleine" Galaxy S10e finden wir im Vorabtest interessant.

Galaxy S10e, Galaxy S10 und Galaxy S10 im Hands on Video aufrufen
Varjo VR-Headset im Hands on: Schärfer geht Virtual Reality kaum
Varjo VR-Headset im Hands on
Schärfer geht Virtual Reality kaum

Das VR-Headset mit dem scharfen Sichtfeld ist fertig: Das Varjo VR-1 hat ein hochauflösendes zweites Display, das ins Blickzentrum des Nutzers gespiegelt wird. Zwar sind nicht alle geplanten Funktionen rechtzeitig fertig geworden, die erreichte Bildschärfe und das Eyetracking sind aber beeindruckend - wie auch der Preis.
Ein Hands on von Tobias Költzsch

  1. Und täglich grüßt das Murmeltier Sony bringt VR-Spiel zu Kultfilm mit Bill Murray
  2. Steam Hardware Virtual Reality wächst langsam - aber stetig
  3. AntVR Stirnband soll Motion Sickness in VR verhindern

Oldtimer umrüsten: Happy End mit Elektromotor
Oldtimer umrüsten
Happy End mit Elektromotor

Verbotszonen könnten die freie Fahrt von Oldtimern einschränken. Aber auch Umweltschutzgründe und Exzentrik führen dazu, dass immer mehr Sammler ihre liebsten Fahrzeuge umrüsten.
Ein Bericht von Dirk Kunde

  1. Piëch Mark Zero Porsche-Nachfahre baut eigenen E-Sportwagen
  2. Elektroautos Sportversion des E.Go Life und Shuttle E.Go Lux
  3. Rivian Amazon investiert in Elektropickups

Digitaler Hausfriedensbruch: Bund warnt vor Verschärfung der Hackerparagrafen
Digitaler Hausfriedensbruch
Bund warnt vor Verschärfung der Hackerparagrafen

Ein Jahr Haft für das unbefugte Einschalten eines smarten Fernsehers? Unions-Politiker aus den Bundesländern überbieten sich gerade mit Forderungen, die Strafen für Hacker zu erhöhen und den Ermittlern mehr Befugnisse zu erteilen. Doch da will die Bundesregierung nicht mitmachen.
Von Friedhelm Greis

  1. Runc Sicherheitslücke ermöglicht Übernahme von Container-Host
  2. Security Metasploit 5.0 verbessert Datenbank und Automatisierungs-API
  3. Datenbank Fehler in SQLite ermöglichte Codeausführung

    •  /