Zum Hauptinhalt Zur Navigation

Spracherkennung

undefined

Steve Wozniak: "Apple hat Nuance gekauft" (Update)

Apple-Mitbegründer Steve Wozniak hat in einem Interview behauptet, dass Apple den Softwarehersteller Nuance Communications gekauft hat. Daraufhin legte die Aktie des Entwicklers von Spracherkennungstechnologie stark zu. Doch Wozniak hat inzwischen eingeräumt, einfach Firmennamen verwechselt zu haben.
undefined

Firesay: Mit dem Browser sprechen

Eine Sprachsteuerung für Mozillas Firefox hat das Team um Firesay entwickelt. Die Erweiterung erlaubt dem Anwender, Kommandos für Websuchen oder zum Öffnen von Seiten über das Mikrofon zu geben. Maus und Tastatur werden dabei nicht benötigt. Noch steht die Technik aber ganz am Anfang.
undefined

MacSpeech Scribe: Spracherkennungssoftware für den Mac

Die Software MacSpeech Scribe von Nuance ist eine Spracherkennung für den Mac, die Tonaufzeichnungen in Text umsetzen soll. Das Programm unterstützt mehrere Sprachen und kann individuelle Sprachprofile aufbauen. So sollen die typischen Aussprachen des Anwenders auch in Fremdsprachen berücksichtigt werden.
Die Golem Newsletter : Das Wichtigste für Techies und IT-Leader auf einen Blick. Jetzt abonnieren
undefined

Roboter: Qbo, der Open-Source-Roboter

Der in Spanien entwickelte Qbo ist ein kleiner Roboter für zu Hause. Qbo basiert komplett auf Open-Source-Systemen und eignet sich deshalb auch als Forschungsroboter, etwa für Maschinensehen oder Spracherkennung und -synthese.

Zwischentöne: Software erkennt Sarkasmus

Produktbesprechungen bei Amazon sind oft voller sarkastischer oder ironischer Anspielungen, die manche Leser nicht verstehen. Drei israelische Informatiker haben ein Programm entwickelt, das Sarkasmus erkennt - und das sogar ziemlich gut.
undefined

Apple kauft Anbieter von Spracherkennungs-App Siri

Software aus der Militärforschung läuft auf iPhone und iPod touch. Apple gibt viel Geld für das kleine App-Entwicklerunternehmen Siri aus. Der Siri Personal Assistant stammt aus der Militärforschung und kann natürliche Sprache erkennen und mit Diensten im Web verbinden.
undefined

Spracherkennungshersteller Nuance kauft MacSpeech

"Wir sehen den Einfluss, den Apple gerade auf den Markt hat". Nuance Communications sieht eine wachsende Bedeutung von Apple und übernimmt MacSpeech, einen Anbieter von Spracherkennungssoftware für Macintosh-Computer. Zuvor hatte Nuance geprüft, ein eigenes Mac-Produkt zu entwickeln.

Sensory NLP-5x - Geräte leichter mit Sprache steuern

MWC2010 Chip für Produkte vom Alarmwecker bis zum Automobil-Entertainment-System. Mit dem NLP-5x-Chip von Sensory sollen beispielsweise Haushaltsgeräte, Spielzeug, Autos und Unterhaltungselektronik normale Sätze erkennen können. Obskure Sprachkommandos, die nur in einer festgelegten Reihenfolge aufgesagt werden dürfen, sollen damit Geschichte sein.
undefined

Dragon NaturallySpeaking kauft umstrittenen Konkurrenten

Spinvox erzielt unerwartet niedrigen Preis. Nuance Communications hat den Konkurrenten Spinvox für 102,5 Millionen US-Dollar übernommen, der Sprachnachrichten in Text umwandelt. Spinvox war nach einem Bericht in Bedrängnis geraten, laut dem Callcenter in Südafrika, Ägypten und auf den Philippinen die Mailboxnachrichten abhören und abtippen.

Microsoft setzt auf Sprachintegration

Bessere Sprachunterstützung bei Windows 7. Microsoft setzt bei seinen Produkten stärker auf die Steuerung per Sprache. Immer mehr Anwendungen sollen sich nicht nur mit Maus- oder Tastatureingaben, sondern auch mit Sprachbefehlen bedienen lassen.

Neue iPhone-Firmware mit Sprachsteuerung?

Hinweise auf Sprachsteuerbefehle in kommender iPhone-Firmware entdeckt. In der kommenden iPhone-Firmware wurden Hinweise auf Funktionen zur Sprachsteuerung gefunden. Derzeit ist unklar, ob diese Verbesserung von allen iPhone-Besitzern benutzt werden kann, oder ob dafür neue Geräte erforderlich sind.

Philips SpeechMike steuert Dragon NaturallySpeaking

Neues Softwaretool von Philips Speech Processing. Mit den Funktionstasten von Philips' Diktiermikrofonserie SpeechMike lässt sich mittlerweile auch die Spracherkennungssoftware Dragon NaturallySpeaking steuern. Dazu veröffentlichte Philips Speech Processing eine Software names SpeechControl.
undefined

Roboter reagiert auf Handzeichen

US-Wissenschaftler entwickeln Gestenerkennung für Roboter. Wissenschaftlern in den USA ist nach eigenen Angaben ein wichtiger Schritt für die Entwicklung autonomer Roboter gelungen: Sie haben einem Roboter beigebracht, einem Menschen auf dem Fuß zu folgen und auf Handzeichen zu reagieren.

Commute UX - Dialogsystem fürs Auto

Fahrer bedient Mobiltelefon oder Musikplayer per Spracheingabe. Auf dem Microsoft Techfest 2009 hat ein Entwickler ein Dialogsystem für das Auto vorgestellt: Per Sprachsteuerung kann der Fahrer Musik abspielen, das Handbuch des Fahrzeugs aufrufen oder sein Mobiltelefon bedienen.

Nuance kauft IBM-Sprachtechnologie

Dragon-NaturallySpeaking-Hersteller holt 175 Millionen Dollar ins Unternehmen. Das US-Softwareunternehmen Nuance Communications, bekannt für Dragon NaturallySpeaking, kauft von IBM Know-how und Patente im Bereich Spracherkennung. Großaktionär Warburg Pincus investiert zugleich 175 Millionen US-Dollar bei Nuance.

IBM: Fünf Erfindungen verändern unser Leben

Überall-Kraftwerke, Kristallkugeln und vernetzte Umkleidekabinen. Mit dem Computer sprechen und nichts mehr vergessen: IBM hat die "IBM Next Five in Five" veröffentlicht. Fünf Erfindungen, die nach Meinung des Unternehmens Leben, Arbeit und Freizeit in den kommenden fünf Jahren entscheidend verändern werden.

Der Computer weiß, mit wem Du sprichst

Wissenschaftler lesen Muster für Vokale und Sprecher aus dem Gehirn. Wissenschaftler der Universität in Maastricht haben eine Software entwickelt, die anhand der Gehirnwellen erkennt, mit wem sich ein Mensch unterhält und was er gesagt bekommt. Ihre Entdeckung könne, so die Wissenschaftler, zur Entwicklung besserer Systeme zur Erkennung von Sprache beitragen.
undefined

Dynamische Sprachsteuerung: Onlinespiel für die Wissenschaft

Internationale Forscher testen Sprachgenerierung im Internet. "Gehe jetzt links vorbei am UFO, dann geradeaus bis ins CIA-Hauptquartier": Die Steuerung des Spielers durch Sprachausgabe könnte in 3D-Welten spannend sein. Das funktioniert aber bislang nur mit Skripts einigermaßen zuverlässig. Saarbrücker Forscher arbeiten an dynamischen Systemen - und laden Spieler zum Onlineexperiment ein.

Google verbessert seine Suche nach Wörtern in Videos

Durchsucht Google Audio Indexing bald alle Youtube-Videos? Google hat seine Suche nach Wörtern in Videos verbessert und nun als Google Audio Indexing auf Google Labs veröffentlicht. Der Dienst war im Juli 2008 als Suche in Politikervideos gestartet. Es gibt Anzeichen, dass die Suchfunktion in Zukunft auch für andere Videos auf Youtube zur Verfügung steht.

Diktiersoftware Dragon NaturallySpeaking 10 ist fertig

Hersteller hat Tempo und Browsersteuerung per Sprache verbessert. Das US-Softwareunternehmen Nuance Communications stellt die neue Version seiner Windows-Spracherkennungssoftware Dragon NaturallySpeaking vor, die natürliche Sprache in Text wandelt. Mit der Versionsnummer 10 will der Hersteller die Erkennung weiter beschleunigt haben. Das konnte ein erster Test bestätigen.

Google sucht in Videos nach Wörtern

Neue Suchfunktion wandelt Politikerreden in Youtube-Videos in Texte. Rechtzeitig zum US-Wahlkampf bietet Google einen neuen Dienst an: Google Elections Video Search. Das Werkzeug beruht auf Spracherkennung und wandelt gesprochene Worte in Videos in durchsuchbare Texte um. Derzeit werden nur Politikervideos transkribiert.

BlackBerry zum Diktat - Diktiersoftware für BlackBerrys

Testversion steht kostenlos zum Download zur Verfügung. Thax Software hat eine Lösung namens "Findentity Mobile Dictate" für BlackBerry-Smartphones vorgestellt, die ein herkömmliches Diktiergerät ersetzen soll. Die Software bietet verschiedene Funktionen wie Vor- und Zurückspulen, Löschen und Überschreiben von Passagen oder das nahtlose Einfügen von Textelementen. Am PC lässt sich das abgespeicherte Diktat per Spracherkennungssoftware in eine Textdatei umwandeln.

Haustechnik hört aufs Wort

European Media Laboratory stellt auf der CeBIT Lösungen vor. Nicht nur als modischer Firlefanz, sondern durchaus auch als Hilfe für Menschen, die einen eingeschränkten Bewegungsradius haben, ist eine Spracherkennung und Steuerung von Haustechnik interessant. Natürlich ließen sich auch viele Aktionen im Haushalt sensorgesteuert erledigen, doch entspricht es eher den Lebensgewohnheiten vieler Menschen, die Dinge "selbst" in die Hand zu nehmen. Sprachtechnik für die Haussteuerung stellt das European Media Laboratory GmbH (EML) auf der CeBIT 2008 aus.

Microsoft kauft Sprachspezialist Tellme

Steve Ballmer setzt auf Sprache als Computerschnittstelle der Zukunft. Microsoft wird das auf Sprachdienste spezialisierte US-Unternehmen Tellme Networks kaufen, gaben beide Unternehmen heute bekannt. In den letzten Wochen machten wiederholt entsprechende Gerüchte die Runde.

Sicherheitsrisiko: Windows Vista hört aufs Wort

Sprachkommando-Funktion fehlen Sicherheitsabfragen. Mit Hilfe von Sprachdateien kann ein Angreifer jederzeit Zugriff auf ein Vista-System erlangen - vorausgesetzt die Sprachsteuerung von Windows Vista ist aktiviert. Dann genügt es, dem Opfer eine Audiodatei mit entsprechenden Sprachbefehlen unterzuschieben. Denn Sprachbefehle sind nicht an eine bestimmte Stimme gekoppelt und es fehlt eine Sicherheitsabfrage, um solchen Missbrauch zu verhindern.

Identifizierung per Stimme ersetzt PIN und Kennwörter

Zugriffsberechtigung am Telefon per Stimmerkennung. T-Com hat mit VoiceIdent eine Lösung zur Zugriffsberechtigung vorgestellt, die per Stimmerkennung am Telefon arbeitet. Nach dem Willen der T-Com werden damit PIN und Kennwörter für eine Anmeldung am Telefon überflüssig. Das Biometrie-Verfahren kann von Dienstleistern ab sofort eingesetzt werden, um Telefon-Banking oder den elektronischen Einkauf sicherer und komfortabler zu machen.
undefined

Projekt "Sync": Handy und MP3 im Auto per Sprache steuern

Ford will neues Bedienkonzept noch 2007 mit Neuwagen anbieten. Ein gemeinsam mit Microsoft entwickeltes Konzept zur Bedienung von Elektronik im Auto namens "Sync" will Ford mit zwölf neuen Auto-Modellen auf den Markt bringen. Sync setzt ganz auf Sprachsteuerung und soll mobile Geräte wie Handys und MP3-Player im Auto komfortabel benutzbar machen.

Microsoft will eigene Chips entwickeln

Neue Abteilungen in Redmond und dem Silicon Valley gegründet. Einem Bericht der New York Times zufolge forscht Microsoft an eigenen Chip-Designs. Diese sollen unter anderem in kommenden Versionen der Xbox zum Einsatz kommen. Der Leiter der neuen "Computer Architecture Group" ist dabei ein alter Hase in der Hardware-Entwicklung, der auch schon den Tablet PC konzipierte.

IBM und Linguatec bringen Spracherkennung Voice Pro 11

Mit USB-Sprechgarnitur und auf Basis von Sprachprofilen verbesserter Erkennung. Zur Systems 2006 soll die von IBM und Linguatec entwickelte Sprach-Erkennungssoftware Voice Pro für Windows in Version 11 auf den Markt kommen. Das neue Produkt soll die Erkennungsfähigkeit noch einmal steigern. Um möglichst viele Spracheigenheiten zu erfassen, hatte Linguatec hunderte von Personen zur Sprechprobe gebeten.

Blindenhandy von LG liest Hörbücher vor

Download über barrierefreie Webseite. LG Electronics hat ein Handy speziell für Sehbehinderte und Blinde kreiert. Die einzelnen Funktionen des LF1300 ruft der Besitzer über Sprachsteuerung auf. Außerdem liest das Schiebemodell Hörbücher vor. Das Blindenhandy wird nur gegen Vorlage eines Behindertenausweises an die Zielgruppe abgegeben.

Spracherkennungssoftware kommt ohne Trainingsphase aus

Dragon NaturallySpeaking in vier Ausbaustufen angekündigt. Die Windows-Spracherkennungssoftware Dragon NaturallySpeaking soll in der neuen Version ganz ohne Training auskommen. Damit erspart sich der Nutzer ein zeitaufwändiges Übungsprogramm, bevor die Software für Spracheingaben verwendet werden kann. Zu den bisherigen drei Ausbaustufen gesellt sich fortan eine vierte Variante speziell für Juristen hinzu.

Beta-Version von Microsofts Speech Server 2007

Neue Version soll Kostenreduktion bringen. Der für das Management von Telefonie und anderen Sprachdiensten geeignete Speech Server 2007 steht nun als Beta-Version bereit. Mit der neuen Version verspricht Microsoft eine Kostenreduktion, da sich Applikationen leichter damit entwickeln lassen. Der Speech Server 2007 unterstützt eine Vielzahl an Telefoninfrastrukturen und deckt auch VoIP über SIP ab.

Programmieren ohne Tastatur

VoiceCode-Spracherkennung für Python-Entwickler. Zukünftig sollen Programmierer auch mit zwei eingegipsten Armen noch ihrer Tätigkeit nachgehen können. Möglich macht das eine neue Open-Source-Software zur Spracherkennung, die vorerst nur mit der Programmiersprache Python funktioniert.
undefined

Plant Google Sprachsteuerung für Internetsuche?

Google erhält Patent auf Suchanfragen per Sprachkommando. Das US-Patentamt hat Google ein Patent erteilt, das beschreibt, wie Suchmaschinenanfragen per Sprachbefehl entgegengenommen und umgesetzt werden. Ob und wie das am 11. April 2006 erteilte Patent in Googles Angebote integriert wird, ist derzeit noch unklar.
undefined

Talkman - Spracherkennung für die PSP

Mikrofon als Eingabegerät für Sprach- und Übersetzungsspiel. Anlässlich der Tokyo Game Show 2005 hat Sony Computer Entertainment ein Paket aus Software und Mikrofon vorgestellt, mit dem die PlayStation Portable zur Spracherkennung fähig wird. Das Paket soll auf spielerische Art helfen, die Grundzüge verschiedener Sprachen zu lernen.