Zum Hauptinhalt Zur Navigation

OCR

Über 17.000 Bücher mit Recaptcha transkribiert

Initiatoren ziehen nach einem Jahr positive Bilanz des Projektes. Im Frühjahr 2007 haben Wissenschaftler der Carnegie Mellon Universität reCAPTCHA ins Leben gerufen, ein System, um Bücher mit Hilfe von Spamschutzmaßnahmen zu digitalisieren. In einem Aufsatz im Wissenschaftsmagazin Science ziehen sie jetzt eine erste Bilanz des Projekts.

Multifunktionsgerät mit Fotodruckoption

HP Photosmart C4424 druckt, scannt und kopiert. Mit dem Photosmart C4424 hat HP ein neues Multifunktionsgerät vorgestellt, das für private Anwender gedacht ist, die auch Fotos ausdrucken wollen. Der Drucker arbeitet mit Tintenstrahltechnik und soll bis zu 30 Seiten pro Minute in Schwarz-Weiß und maximal 23 Seiten in Farbe ausgeben können.

Einsteiger-Multifunktionsgeräte von HP ab 60 Euro

Deskjet F2224 und F4424 kommen ab August auf den Markt. HP hat zwei neue Multifunktionsgeräte ohne Faxfunktion vorgestellt, die für den Heimanwender gedacht sind und sich durch einen niedrigen Energieverbrauch auszeichnen sollen. Die neuen HP-Deskjets F2224 und F4424 arbeiten mit Tintenstrahltechnik und erreichen eine Auflösung von hochgerechnet bis zu 4.800 x 1.200 dpi.

Epson: Einfache Multifunktionsgeräte mit Einzelpatronen

Epson SX400 mit Display für Kartendruck. Epson hat zwei neue Tintenstrahlmodelle vorgestellt, die als Multifunktionsgeräte darüber hinaus mit einem Scanner und Kopierer ausgerüstet sind. Der Stylus SX200 und der SX400 werden mit einzelnen Tintenpatronen bestückt und unterscheiden sich vornehmlich durch ein Display zur Bildvoransicht beim Druck über das Speicherkartenlaufwerk.

Fujitsu: Kompakter Einzugsscanner mit USB-Stromversorgung

ScanSnap S300M mit 8 Seiten pro Minute Leseleistung. Fujitsu bietet zahlreiche Einzugsscanner an - meist sind diese für Windows-Umgebungen gedacht. Mac-Anwender, die hoffen, mit einem Treiber die Geräte ebenfalls nutzen zu können, dürften enttäuscht sein: Fujitsus Scanner sind betriebssystemfixiert. Nun ist eine Mac-Variante des winzigen ScanSnap S300 erschienen.

Corels WordPerfect Office X4 mit PDF-Bearbeitung

Office-Software bearbeitet ODF- und Office-Open-XML-Dokumente. Corel hat seine Office-Software WordPerfect Office aktualisiert, die nun PDF-Dateien importieren kann. Zudem werden die Office-Formate OpenDocument (ODF) sowie Office Open XML vollständig unterstützt. Mit weiteren Neuerungen soll die Bearbeitung von Office-Dateien komfortabler und einfacher werden.

Handschrifterkennung für Apple iPhone und iPod touch

HWPen für chinesische und lateinische Handschriften. Ein chinesischer Entwickler hat eine Alternative für die Bildschirmtastatur entwickelt, die das Apple iPhone und den iPhone touch ziert. Die Handschriftenerkennung namens HWPen erkennt lateinische und chinesische Buchstaben.

Mailboxbotschaft per Software von Ton in Text verwandeln

Voicemail-to-Text-Service für Netzbetreiber. Nuance will Nachrichten auf Handy-Anrufbeantwortern in Text umwandeln. Über eine Spracherkennungssoftware wird der gesprochene Text auf dem Anrufbeantworter in eine SMS oder E-Mail übertragen. Der Nutzer spart sich damit die Mühe, die Nummer seiner Mailbox anzuwählen, die Botschaft abzuhören und zum Beispiel eine hinterlassene Telefonnummer zu notieren.
undefined

Hand-Textscanner schlägt bei Google nach

Dixau kostet rund 60,- Euro. Das koreanische Unternehmen Unichal hat mit dem Dixau einen kleinen Handscanner für den PC entwickelt, der einzelne Wörter einliest und nach einer Texterkennung bei Wikipedia, Google oder einer anderen Suchmaschine seine Bedeutung nachschlagen kann. Per Sprachausgabe kann auch gleich noch die korrekte Aussprache gelernt werden.
Die Golem Newsletter : Das Wichtigste für Techies und IT-Leader auf einen Blick. Jetzt abonnieren
undefined

Knipsen und verstehen: Übersetzungssoftware für Handys

2-Megapixel-Kamera ist Voraussetzung. Linguatec hat mit Shoot & Translate eine Übersetzungssoftware für Mobiltelefone vorgestellt, die das Abtippen ausländischer Wörter erspart. Der Nutzer macht ein Foto der Speisekarte, von Schildern oder anderen Texten in der fremden Sprache und die Software übersetzt die Worte.

Smartphone liest Menschen mit Leseschwäche Texte vor

Software kombiniert Text-to-Speech, Buchstabenerkennung und Tracking-Funktion. Kurzweil Technologies hat zwei Softwarelösungen für Menschen vorgestellt, die mit dem Lesen Schwierigkeiten haben. In Zusammenarbeit mit dem US-amerikanischen Blindenverband NFB (National Federation of the Blind) entstand eine Software, die sich an Blinde richtet; eine zweite Variante ist für Menschen mit Lern- und Leseschwäche konzipiert. In beiden Lösungen werden fotografierte Texte per Computerstimme vorgelesen, derzeit läuft die Software allerdings nur auf dem Symbian-Smartphone N82 von Nokia.
undefined

Lexmark bietet Farblaserdrucker-Kombi für 1000,- Euro

Multifunktionsdrucker macht im Farbdruck-Modus bis zu 20 Seiten pro Minute. Lexmark stellt mit dem Lexmark X560n und dem X560dn zwei Laserdrucker-Multifunktionsgeräte für rund 1.000,- Euro vor. Beide Modelle sind für Nutzer gedacht, die häufig in Farbe drucken und kopieren. Der einzige Unterschied zwischen den Neuvorstellungen ist eine integrierte Duplex-Einheit.
undefined

Tragbarer A4-Scanner für mobile Datenerfassung

Einzugsscanner IriScan 2 mit USB-Stromversorgung. Unterwegs müssen gelegentlich Dokumente gleich eingescannt werden, um sie z.B. an die Firma schicken zu können, oder schlichtweg, weil sie nicht mitgenommen werden können. Einen A4-Einzugsscanner, dessen Ladestation nur per USB mit Strom versorgt wird, hat Iris in zwei Varianten vorgestellt.

Google will nach Texten in Bildern suchen

Patentantrag für neue Suchtechnik. Zwei Google-Mitarbeiter wollen eine neue Suchtechnik patentieren lassen, die Texte in Bildern erkennt. Nach dem Patentantrag geht es vor allem darum, Texte auf Straßenschildern oder in Schaufenstern zu erkennen - so wie sie auf den Bildern enthalten sind, die Google im Rahmen des Projekts Street View von amerikanischen Großstadtstraßen gemacht hat.
undefined

Winziger A4-Einzugsscanner mit Duplex-Funktion von Fujitsu

Fujitsu ScanSnap S300 mit Stromversorgung über USB oder Netzteil. Fujitsu hat mit dem ScanSnap S300 einen sehr kompakten Einzugs-Dokumentenscanner vorgestellt, der A4-Vorlagen farbig und mit seiner Duplex-Funktion auch gleich von beiden Seiten aus einliest. Aus den Scans werden automatisch mit der beigelegten OCR-Software ABBYY FineReader durchsuchbare PDF-Dateien erstellt.

Scanner mit 4.800 x 9.600 dpi und Leuchttisch

Microtek ScanMaker s480 für Fotoanwendungen. Mit dem ScanMaker s480 hat Microtek einen Scanner vorgestellt, der vornehmlich für Fotos gedacht ist. Das Flachbettgerät bietet eine Auflösung von 4.800 x 9.600 dpi und ist am Gehäusedeckel mit einer Leuchttisch-Fläche zum Begutachten der Dia- und Negativfilme ausgestattet. Die darüber hinaus eingebaute Durchlicht-Scanfläche kann selbst für Mittelformat-Filme genutzt werden.
undefined

HP-Dokumentenscanner für bis zu 35 Seiten pro Minute

Mit Duplexeinheit und 100-Blatt-Einzug. HP hat zwei neue Dokumentenscanner vorgestellt, die große Mengen von Papier in hoher Geschwindigkeit einstellen können. Der Scanjet N8420 und der Scanjet N8460 unterscheiden sich fast ausschließlich durch ihre Geschwindigkeit (und natürlich ihren Preis) voneinander: Der N8460 liest bis zu 35 DIN A4-Seiten ein, der N8420 maximal 25 Stück.
undefined

Schneller Tippen: SMS-Tastatur für den PC

Cre8txt: Wortvervollständigung und Übersetzung von Abkürzungen möglich. Das britische Unternehmen Cre8txt hat eine Tastatur vorgestellt, die wie eine Handy-Tastatur aussieht, gedacht ist sie jedoch für den PC. Damit will das Unternehmen das Schnell-Tipp-Potenzial, das Jugendliche auf dem Handy entwickelt haben, auch am Rechner nutzen.

Freie Texterkennung OCropus in erster Alpha veröffentlicht

Beta-Version ist für das erste Quartal 2008 geplant. Die freie Texterkennungssoftware OCropus wurde in einer ersten Alpha-Version veröffentlicht, die einige neue Funktionen enthält. Die Software wird von der Arbeitsgruppe "Bildverstehen und Mustererkennung" am Deutschen Forschungszentrum für künstliche Intelligenz im Auftrag von Google entwickelt.
undefined

Zen Cube: Duft aus dem Drucker

Sechs verschiedene Noten sollen dicke Luft im Büro beseitigen. Der französische Elektronikkonzern Sagem hat zusammen mit dem Zerstäuberproduzenten Olfact'air und Parfümhersteller Sentaromatique den Lufterfrischer Zen Cube für seine Multifunktionsdrucker entwickelt. Der Duftzerstäuber für die Modelle der 44er- und 54er-Baureihe hat einen einfachen Zweck: Er soll das Raumklima verbessern. Jedes Mal, wenn das Gerät druckt oder ein Fax empfängt, wird zugleich über die Lüftungsschlitze auch eine Duftwolke ausgestoßen.

HP Scanjet N7710: Scanner für 35 Seiten pro Minute

Ultraschall-Erkennung von Doppeleinzügen. Der HP Scanjet N7710 ist ein Dokumentenscanner mit Einzelblattzufuhr und Duplexeinheit. Er soll für einen Bedarf von 1.500 Seitenscans pro Tag ausgelegt sein und kann nach Herstellerangaben bis zu 35 DIN-A4-Seiten pro Minute einlesen. Durch die Einberechnung der Duplex-Einheit können in einer Minute bis zu 70 Bilder (Vorder- und Rückseite) eingelesen werden.
undefined

Duplex-Farbscanner mit Blatteinzug für 100 Seiten

Scanner erstellt Dokumente mit 48 Bit Farbtiefe und 600 dpi Auflösung. Der Scanner-Hersteller Microtek bringt mit dem ArtixScan DI 4020 einen Farb-Scanner auf den Markt, der beidseitig digitalisiert. Dabei muss niemand jedes Blatt einzeln einlegen - ein automatischer Blatteinzug fasst bis zu 100 Seiten. Der Duplex-Scanner lichtet laut Hersteller bis zu 40 Seiten in Schwarz-Weiß oder 66 Grauton-Bilder pro Minute im Format DIN A4 ab.

Abbyy FineReader 9.0 mit intelligenter OCR-Engine

Verbesserte Übernahme eines bestehenden Layouts. Die OCR-Software FineReader von Abbyy liegt in der Version 9.0 vor und bringt zahlreiche Neuerungen. Mit einer neuen Technik soll nicht nur der Text und das Layout einer Vorlage korrekt erkannt werden, sondern auch die logische Struktur eines mehrseitigen Dokuments. Damit sollen sich Vorlagen deutlich zügiger und mit weniger Aufwand in ein editierbares Format bringen lassen.
undefined

12 cm hoher Laserdrucker in Klavierlackoptik

Multifunktionsgerät-Brüderchen ist mit 17 cm nur unwesentlich höher. Samsung hat auf der IFA zwei Monochrom-Laserdrucker vorgestellt. Das wäre im Grunde genommen nichts Besonderes, wenn die Geräte nicht in Gehäusen untergebracht wären, die gerade einmal 12 cm (reiner Laserdrucker) bzw. 17 cm (Multifunktionsgerät) hoch sind und in einer schwarz glänzenden Klavierlack-Optik samt bläulicher LED-Beleuchtung daherkämen.

Fujitsu ScanSnap S510: Einzugsscanner für den Bürokram

Fujitsus neuer ScanSnap S510 erweitert Bedienkonzept. Fujitsu hat mit dem ScanSnap S510 die neue Iteration seiner Büro-Scanner vorgestellt. Im Gegensatz zu Flachbett-Scannern fehlt diesen Geräten ein Auflageglas - sie ziehen die Vorlagen ein und scannen dabei Vorder- und Rückseite. Das neue Modell verbindet mit einem Knopfdruck sowohl den Erfassungsprozess als auch den Aufruf der neuen Bedienoberfläche.

Freie Formularerkennung veröffentlicht

Archivierungssoftware ArchivistaBox 2007/VIII mit Open-Source-Texterkennung. Die Schweizer Firma Archivista hat die neue Version ihrer Web-basierten Open-Source-Archivierungslösung "ArchivistaBox" veröffentlicht. Mit einer neuen Logoerkennung sollen sich Formulare einlesen lassen.

Handelsüblicher Scanner macht Blindenschrift lesbar

Programm zur Entschlüsselung des Braillecodes entwickelt. An der Fakultät "Computer & Electrical Engineering (CEE)" der Hochschule Furtwangen haben Prof. Dr. Rülling und Prof. Dr. Schmid ein Programm entwickelt, das Blindenschrift mit einem handelsüblichen Scanner für Sehende entschlüsseln kann. Der Scanner liest das Bild des Braillecodes ein, schreibt den Text in Klarschrift auf den Bildschirm, liest ihn vor oder vergleicht ihn mit einem Solltext.

reCAPTCHA: Stoppt Spam, lest Bücher

Spam-Schutz soll helfen, gescannte Texte zu digitalisieren. Wissenschaftler der Carnegie-Mellon-Universität wollen Websites mit "reCAPTCHAs" vor automatisierten Spam-Angriffen schützen und zugleich die Digitalisierung von Büchern vorantreiben. Dabei arbeiten sie mit dem Internet Archive zusammen und werden von Intel unterstützt.

OCRopus: Deutsche Forscher entwickeln freie OCRs für Google

Software basiert unter anderem auf Tesseract. Im Auftrag von Google arbeitet die Arbeitsgruppe "Bildverstehen und Mustererkennung" um Prof. Dr. Thomas Breuel am Deutschen Forschungszentrum für künstliche Intelligenz an einem neuen OCR-System. Nun wurde eine erste Vorabversion der OCRopus genannten Texterkennung veröffentlicht. Auch eine Desktop-Applikation auf Basis von OCRopus ist geplant.
undefined

Multifunktionsdrucker von Kodak mit zwei Tintentanks

Schwarz-Patrone für 9,99 Euro, Fünf-Farb-Patrone für 14,99 Euro. Kodak bringt erstmals zwei All-in-One-Drucker auf den Markt. Während der Easy Share 5300 druckt, kopiert und scannt, hat Kodak dem Easy Share 5500 auch eine Faxfunktion spendiert. Als Tintenspender dienen zwei Patronen - eine Schwarz-Patrone und eine Patrone mit fünf Farben.

Oki-Multifunktionsgeräte mit 16 Farbseiten pro Minute

Drucken mit 1.200 x 600 dpi und scannen mit 600 dpi. Oki hat drei neue A4-Farb-Multifunktionsgeräte vorgestellt, die mit einem LED-Seitendrucker ausgerüstet sind und auf recht hohe Geschwindigkeiten auch beim Farbdruck kommen. Sie basieren auf den Druckern Oki C3000 und C5000 und drucken mit maximal 1.200 x 600 dpi. Die Geräte bringen es auf 12 bzw. 20 Farb- bzw. 16 bis 20 Schwarz-Weiß-Seiten pro Minute.

Lexmark mit Tintenstrahl-Multifunktioner mit Duplex und WLAN

Lexmark X9350 vor allem für den Unternehmenseinsatz. Lexmark hat ein Multifunktionsgerät vorgestellt, das mit einem Tintenstrahldruckwerk ausgerüstet ist und neben Drucken auch das Scannen, Kopieren und Faxen bewerkstelligt. Außerdem ist es in der Lage, Seiten von vorn und hinten zu bedrucken und auch über WLAN gesteuert zu werden.
undefined

Epson Stylus DX7000F druckt Fotos in 29 Sekunden

Softwarepaket im Lieferumfang optimiert Fotos. Epson hat einen recht günstigen 4-Farb-Tintenstrahldrucker vorgestellt, der drucken, scannen, kopieren und faxen kann. Epson verspricht eine Druck- und eine Kopiergeschwindigkeit von bis zu 27 Seiten pro Minute im Entwurfsmodus, ein Foto von 10 x 15 cm braucht ca. 29 Sekunden, bis es aus dem Schacht kommt. Faxdaten in Schwarz-Weiß und in Farbe werden mit 33,6 KBit/s übertragen.

OCR-Engine FineReader für Linux und Intel-Macs

Software Development Kit auch für FreeBSD erhältlich. Abbyy bietet die FineReader-Engine 8.0 zur automatischen Texterkennung nun auch in einer Version für Linux, FreeBSD und MacOS X für Intel an. Entwickler können auf das Software Development Kit (SDK) zurückgreifen, das auch PDF-Umwandlung unterstützt und Barcodes erkennt.

Freie OCR-Software von Google

Tesseract-Software wurde von Hewlett-Packard entwickelt. Google hat die OCR-Software Tesseract als Open Source freigegeben. Die ursprünglich von Hewlett-Packard entwickelte Software ist allerdings nur eine rohe Engine, kommt also ohne Benutzeroberfläche daher. Auch fehlen ihr einige Funktionen, Google plant jedoch, Tesseract weiter zu verbessern.

Software konvertiert Bilder-PDF in durchsuchbaren Text

PDF Transformer 2.0 Pro wandelt PDF-Dokumente in Office-Dateien zurück. Abbyy bietet mit dem PDF Transformer 2.0 Pro eine Windows-Software, um Nur-Bild-PDF-Dokumente in durchsuchbare PDF-Dateien zu wandeln. Außerdem lassen sich damit PDF-Dokumente in Microsofts Office-Format konvertieren.

China: SMS mit 13.000 Schriftzeichen

Software erkennt mit dem Finger gemalte Zeichen. Motorola hat ein System entwickelt, mit dem auch Chinesen SMS tippen können. Knackpunkt: Die traditionelle chinesische Schrift hat etwa 13.000 Zeichen, die vereinfachte Version immer noch über 6.000 Schriftzeichen. Zeichen für Zeichen eintippen geht also nicht. Malen dagegen ist eine Lösung.
undefined

Einzugsscanner Fujitsu ScanSnap S500 nun auch in Deutschland

Liest jetzt 18 Seiten pro Minute ein. Fujitsu hat seinen kleinen Einzugsscanner ScanSnap S500 nun auch für Deutschland angekündigt. Das Gerät soll im Gegensatz zur Vorgängergeneration etwas schneller geworden sein und arbeitet mit einer Auflösung von 150 bis 600 dpi. Bis zu 18 Seiten in Farbe oder Schwarz-Weiß sollen pro Minute erfasst werden können.
undefined

Lexmark mit zwei neuen Laser-Multifunktionsdruckern

Direktkopie als PDF und Dokumentenmanagement-Software mit OCR-Funktion. Lexmark stellt die beiden Multifunktionssysteme Lexmark X340 und X342n vor. Mit einer Ausgabegeschwindigkeit von bis zu 25 DIN-A4-Seiten pro Minute sollen sie insbesondere umfangreiche Druck- und Kopieraufträge abarbeiten. Ebenfalls an Bord sind ein Flachbettscanner, der sowohl Farb- als auch Schwarz-Weiß-Dokumente digitalisieren kann, und ein Faxmodem mit zehn Kurzwahltasten.

Mobiltelefone und PDAs lernen lesen

Abbyy bringt OCR-Entwicklerkit für mobile Endgeräte. Unter dem allgemeinen Namen "Mobile OCR Software Development Kit (SDK)" hat Abbyy für Mobiltelefone und PDAs ein OCR-Entwicklerkit auf den Markt gebracht. Entwicklern soll damit das Programmieren von Anwendungen erleichtert werden, um etwa Visitenkarten oder andere gedruckte Informationen in digitaler Form auf den mobilen Begleiter zu bekommen.

HP-Fotoscanner lesen bis zu 18 Negative gleichzeitig ein

HP Scanjet 8300gp mit Colorimeter und IT8-Kalibrierungszielen. Mit den Scanjets 8300 und 8300gp hat HP zwei neue Scanner vorgestellt, die vor allem für Fotografen interessant sein dürften. Die Geräte können durch den integrierten Durchlichtaufsatz bis zu 18 Negative und 8 Dias gleichzeitig einscannen. Die maximale Auflösung liegt bei 4.800 dpi und die Farbtiefe bei 48 Bit.

HP: Dokumentenscanner liest 25 Seiten pro Minute

Mit USB-2.0- und optionalem SCSI-Anschluss. Der neue HP-Scanjet-8270-Flachbett-Dokumentenscanner soll eine DIN-A4-Seite in 33 Sekunden und ein Foto im Format 10 x 15 cm in 25 Sekunden einlesen können. Ein Vorschau-Scan soll nach vier Sekunden vorliegen.

OCR-Software Readiris Pro 11 mit Verbesserungen

Unternehmensvariante mit größerem Funktionsumfang. Der Softwarehersteller I.R.I.S. bietet das Texterkennungsprogramm Readiris Pro in einer neuen Version an, die verschiedene Verbesserungen bringt. Readiris Pro 11 für Windows und MacOS wird außer in einer Variante für Privatanwender auch jeweils in einer Unternehmensausführung angeboten.

Fujitsus Einzugsscanner ScanSnap wird schneller

Scanner erfasst 36 Seiten auf 18 Blättern pro Minute. Fujitsu bietet seinen Einzugsscanner ScanSnap in einer verbesserten Version an. Das Modell ScanSnap S500 soll schneller arbeiten, Dokumente auch in Word- oder Excel-Dokumente umwandeln und steckt in einem neu gestalteten Gehäuse.

Neue Duden-Korrektur für Softwarehersteller

Zusammenführung der Duden-Linguistic-Engine und Primus-SX-Engine. Zur Integration von Rechtschreibkorrektur und anderen Sprachfunktionen bietet der Duden Verlag Softwareherstellern nun die Duden-Proof-Factory 1.0 an. Außer Deutsch unterstützt das Produkt auch die Rechtschreibprüfung und Silbentrennung für Englisch, Französisch, Italienisch und Spanisch. Die Software kann plattformübergreifend genutzt werden.
undefined

Forschung: Google investiert in Handschriften-Texterkennung

Handschriftliche Tagebücher von George Washington bald bei Google? Google hat an der Dublin City University (DCU) ein Projekt ins Leben gerufen, bei dem die Forschungsgruppe Adaptive Information Cluster (AIC) mit zwei amerikanischen Unis zusammen daran arbeitet, alte Manuskripte und andere historische Dokumente durchsuchbar zu machen. Dazu muss eine Handschrifterkennung vorgenommen werden, was ungleich größere Probleme mit sich bringt, als sie sich bei ausschließlich gedruckten Buchstaben ergeben.
undefined

Samsung-Digitalkamera mit HDMI-Schnittstelle und 8 Megapixel

Fotoapparat mit 5fach-Zoom und 16:9-Modus. Samsung hat mit der Digimax L85 eine kompakte Digitalkamera vorgestellt, die als erstes Kameramodell mit einer HDMI-Schnittstelle ausgerüstet ist. Die Kamera verfügt über einen 8,1-Megapixel-Sensor und ein 5fach-Zoom-Objektiv mit einer auf das Kleinbildformat umgerechneten Brennweite von 38 bis 190 mm bei Anfangsblendenöffnungen von F2,8 bis F4,4. Der Makrobereich beginnt bei einem Zentimeter Motivabstand.