Project Naptha: Texterkennung im Browser erspart lästiges Abtippen

Mit dem Google-Chrome-Plugin Naptha können Texte aus Bilddateien kopiert werden. Das erspart mitunter viel Tipparbeit und funktioniert erstaunlich gut, wie ein Test von Golem.de zeigte. Der Text kann dabei sogar aus dem Bild entfernt werden.

Artikel veröffentlicht am ,
Project Naptha
Project Naptha (Bild: Project Naptha)

Texte in Bilddateien sind im Web ständig zu finden - mit Project Naptha können sie bequem markiert und kopiert werden. Doch bevor die optische Zeichenerkennung möglich ist, muss der Text in den Bildern erst vom Hintergrund isoliert werden, was ein Algorithmus von Microsoft erledigt.

Stellenmarkt
  1. Informatiker / Informatikerin (m/w/d) im Rechenzentrum
    Helmut Schmidt Universität / Universität der Bundeswehr Hamburg, Hamburg
  2. Senior Software Entwickler / Technischer Projektleiter (w/m/d)
    EURO-LOG AG, Hallbergmoos
Detailsuche

Der Text im Bild wird einfach mit der Maus markiert und kann nach kurzer Zeit kopiert oder mittels Google Translate sogar übersetzt werden. Das ist besonders bei asiatischen Webseiten interessant, auf denen häufig aus Layoutgründen Grafiken statt richtiger Texte eingesetzt werden. Selbst aus Comics oder gar Screenshots können mit dem Plugin Texte extrahiert werden. Schräg verlaufende Schrift bis zu einem Winkel von 30 Grad wird ebenfalls erkannt.

Project Naptha ist eine Entwicklung des MIT-Studenten Kevin "antimatter" Kwok. Napta ist mehr als eine reine OCR-Funktion, denn das System funktioniert auch bei Bildern, bei denen der Text vor einem Muster abgebildet ist.

Naptha löscht auch Texte aus Bildern

Die Text-Entfernungsfunktion zeigt, dass Project Naptha den Text im Bild zunächst isoliert. Das Entfernen funktioniert ähnlich wie die Photoshop-Funktion Content-Aware Fill. Die Identifizierung von Texten wird mit der Stroke Width Transform (SWT) von Microsoft Research durchgeführt. Dieser Algorithmus identifiziert Text anhand der Eigenschaft der meisten Schriftarten, gleiche Strichbreiten zu verwenden. Ist das geschehen, wird das Extrakt zu einem Webdienst für die optische Zeichenerkennung geschickt, der mit der Engine Ocrad läuft. Wer will, kann auch Googles Tesseract-Engine nutzen. Möglich ist auch eine Übersetzung des Textes, die dann anstelle des Originaltextes im Bild erscheint. Dabei versucht der Algorithmus, die Originalschrift nachzuahmen, doch das funktioniert nicht immer.

Gute Erkennungsrate

Golem Karrierewelt
  1. Adobe Premiere Pro Grundkurs: virtueller Zwei-Tage-Workshop
    02./03.08.2022, Virtuell
  2. Elastic Stack Fundamentals – Elasticsearch, Logstash, Kibana, Beats: virtueller Drei-Tage-Workshop
    26.-28.09.2022, Virtuell
Weitere IT-Trainings

Im Test von Golem.de konnte Naptha durchaus überzeugen. In vielen Bildern wurden die Buchstaben korrekt erkannt, wobei besonders kleine Schriften naturgemäß größere Probleme verursachen. Auch sehr groß gestaltete Texte sind ein Hindernis für das System, das aber für den Alltag ausreicht, wenn es zum Beispiel darum geht, aus Screenshots oder aus abfotografierten Texten den Inhalt zu extrahieren.

Die Google-Chrome-Extension Naptha ist derzeit kostenlos über Googles Webstore zu beziehen.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


__destruct() 26. Apr 2014

Sorry, ich habe in meinem Post 13.04 geschrieben. Ich nutze aber 14.04 und dachte, du...

Avarion 24. Apr 2014

Danke dir. Werde ich mal probieren.

slashwalker 24. Apr 2014

Also bei mir nicht. Hab es gerade beim Denic Whois ausprobiert.

Himmerlarschund... 24. Apr 2014

Ich glaube, dieses Tool ist für Captchas nicht sonderlich sinnvoll. "Die Identifizierung...



Aktuell auf der Startseite von Golem.de
US-Streaming
Abonnenten immer unzufriedener mit Netflix

Wenn Netflix-Abonnenten das Abo kündigen, wird vor allem der hohe Preis sowie ein schlechtes Preis-Leistungs-Verhältnis als Grund dafür genannt.

US-Streaming: Abonnenten immer unzufriedener mit Netflix
Artikel
  1. Elektro-SUV: Drako Dragon soll Teslas Model X Plaid deutlich übertreffen
    Elektro-SUV
    Drako Dragon soll Teslas Model X Plaid deutlich übertreffen

    Das Elektroauto Drako Dragon soll mit seinen vier Motoren eine Leistung von 1.470 kW entwickeln und 320 km/h Spitze fahren.

  2. Discovery+: Neues Streamingabo in Deutschland verfügbar
    Discovery+
    Neues Streamingabo in Deutschland verfügbar

    Während etwa Netflix oder Disney werbefinanzierte Varianten ihrer Abos planen, startet Discovery+ gleich mit einem solchen Dienst.

  3. Machine Learning: Die eigene Stimme als TTS-Modell
    Machine Learning
    Die eigene Stimme als TTS-Modell

    Mit Machine Learning kann man ein lokal lauffähiges und hochwertiges TTS-Modell der eigenen Stimme herstellen. Dauert das lange? Ja. Braucht man das? Nein. Ist das absolut nerdig? Definitv!
    Eine Anleitung von Thorsten Müller

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • MSI RTX 3080 Ti Ventus 3X 12G OC 1.049€ • Alternate (u. a. Corsair Vengeance LPX 32 GB DDR4-3600 106,89€) • be quiet! Pure Rock 2 26,99€ • SanDisk microSDXC 400 GB 29€ • The Quarry + PS5-Controller 99,99€ • Samsung Galaxy Watch 3 119€ • Top-PC mit Ryzen 7 & RTX 3070 Ti 1.700€ [Werbung]
    •  /