Entwickler versuchen, Computern und anderen Geräten beizubringen, gesprochene Worte zu erkennen. Das soll deren Bedienung vereinfachen: Statt Kommandos per Tastatur oder Maus einzugeben, erteilt der Nutzer gesprochene Eingaben. Texte sollen nicht mehr getippt, sondern diktiert werden. Spracherkennung ist nicht gleichzusetzen mit Stimmerkennung, also dem Verfahren, einen Menschen anhand des biometrischen Merkmals seiner Stimme zu identifizieren. Beide Verfahren ähneln sich aber.
Mit der neuen Version von Google Chrome können Anwender nicht nur per Mikrofon Suchanfragen bei Google starten, sondern erhalten auch eine gesprochene Antwort. Sogar Anschlussfragen beantwortet die Suchmaschine.


.jpg)
.jpg)


.jpg)
.jpg)
.jpg)




.jpg)







Mit der App Mindmeld entwickelt Expect Labs eine Sprachsoftware, die aktiv und in Echtzeit Unterhaltungen analysiert und dazu passende Informationen anbietet. Nach Google beteiligen sich jetzt auch Intel, Samsung und Telefónica an dem Unternehmen.
Amazon hat offenbar die App Evi gekauft. Der Kaufpreis ist noch unbestätigt, doch es gibt Belege für die Übernahme. Apple hatte die App Evi wegen zu großer Ähnlichkeit mit Siri eine Zeit lang aus dem App Store genommen.
Nuance hat für seine Windows-Spracherkennungssoftware Dragon Naturallyspeaking ein Update vorgestellt, mit dem Windows 8, Office 2013 und der Internet Explorer 10 unterstützt werden.
Sprachsteuerung zum Bearbeiten von Bildern gab es bislang nur im Film. Mit der App Pixeltone wollen Forscher die Zukunftsvision aus Bladerunner auf Smartphones und Tablets holen.
"Xbox an": Mit derartigen Worten lässt sich die nächste Konsole von Microsoft einschalten, so ein Branchenbericht. Das System soll ähnlich mit Sprache funktionieren wie Apples Siri.
US-Wissenschaftler haben einen Algorithmus entwickelt, der Stimmungen an der Stimme erkennt. Eine einfache App nutzt dies, um ein Gesicht anzuzeigen, dessen Ausdruck die Laune des Sprechers widerspiegelt.
Youtubes Untertitelung von Videos per Spracherkennung gibt es nun in zehn verschiedenen Sprachen, darunter auch Deutsch. Die Untertitel können manuell korrigiert und wieder hochgeladen werden.
Der von Honda entwickelte humanoide Roboter Hearbo versteht genau, was ein Mensch ihm sagt: Er verfügt über ein besonderes System zur akustischen Wahrnehmung, das ihm ermöglicht, vier Geräuschquellen zu unterscheiden und zu verarbeiten.
Microsoft ermöglicht es, Chinesisch zu sprechen, ohne Chinesisch zu können: Das Unternehmen hat ein System entwickelt, das gesprochene englische Sprache erkennt, sie ins Chinesische übersetzt und mit der Stimme des Sprechers ausgibt.
IDF Intel will die Entwicklung von Programmen fördern, die Sprach- und Gestensteuerung umsetzen. Dazu wird sowohl ein Wettbewerb gestartet als auch demnächst ein SDK freigegeben.
Nuance bringt mit Dragon Naturallyspeaking 12 eine neue Version seiner Spracherkennungssoftware für Windows auf den Markt. Sie soll genauer verstehen können, was der Anwender sagt, und auch mit vielen Webanwendungen wie Google Docs funktionieren.
BMW will den neuen 7er und später auch den 3er mit Dragon Drive Messaging von Nuance ausstatten. Damit können während des Fahrens E-Mails und SMS vorgelesen und diktiert werden.
Apple will per einstweiliger Verfügung ein Verkaufsverbot gegen das Samsung Galaxy S3 erwirken. Es geht unter anderem um ein Patent zur einheitlichen Suche, die auch Siri verwendet.
Es reicht aus, "Hello Dragon" zu sagen, um sich mit Dragon ID von Nuance an einem Android-Smartphone anzumelden. Die Stimme ersetzt dabei die Eingabe von Benutzernamen und Passwort.
Samsung hat nur kurz nach dem Marktstart seines aktuellen Smartphones Galaxy S3 den Quellcode für das Gerät freigegeben. Damit lassen sich der Linux-Kernel und das Android-Betriebssystem anpassen.
Samsungs Galaxy S3 ist dank seiner Quadcore-CPU schnell und das große Display lädt zum Videogucken ein. Es ist auch leicht - wegen seines Plastikgehäuses. Mit Softwarefunktionen versucht Samsung, es dem Konkurrenten Apple gleichzutun. Das klappt aber noch nicht so ganz.
In Samsungs Android-Smartphone Galaxy S3 ist eine Spracherkennung integriert, die als Konkurrent zu Apples Siri gehandelt wird. Weit gefehlt! S Voice kann nicht einmal richtig Deutsch.
Nuance bringt seine Spracherkennung, die auch für Siri verwendet wird, ins Auto: Dragon Drive setzt Sprachbefehle des Fahrers nicht nur um, sondern antwortet auch.
Die Xbox-360-Version von The Elder Scrolls V: Skyrim unterstützt bald auch Kinect-Sprachbefehle. Helden können dann Drachenschreie ins Mikrofon brüllen und noch viele weitere Aktionen mit ihrer Stimme ausführen.
Evernote hat seinen Cloud-Notizzettel-Dienst in der Android-Variante um eine Spracherkennung erweitert. Damit können Texte in das Notizbuch eingesprochen und neue Notizen erstellt werden.
Durch Skyrim laufen, sich frei umschauen und mit den eigenen Armen Schwertstreiche ausführen: Mit einer Sony-Videobrille, einem Headtracker, einem Kinect-Sensor und etwas Zusatzsoftware ist das am PC möglich.
Mercedes-Benz wird seine neue A-Klasse enger an das iPhone anbinden. Über Apples Spracherkennung und Sprachsteuerung Siri können während der Fahrt Nachrichten abgerufen, E-Mails diktiert oder Termine angelegt werden.
Samsung hat drei Fernseherserien mit einer integrierten Sprachsteuerung vorgestellt, mit denen die Zuschauer mit ihrer Stimme durch Menüs navigieren können. Eine darüber hinaus vorhandene Gestenerkennung erfasst mit einer Kamera Bewegungseingaben und die Gesichter der Zuschauer.
Nuance ermöglicht Fernsehherstellern mit Dragon TV, ihre Fernseher mit einer Sprachsteuerung auszustatten. Dragon TV könnte damit das leisten, was Siri auf dem iPhone 4S ermöglicht.
Mit Vlingo verschwindet ein weiterer Anbieter von Software zur Spracherkennung vom Markt. Die Vlingo-Technologie kam früher in Siri zum Einsatz.
LG baut, was Apple angeblich plant: eine Fernseher-Sprachsteuerung und eine Fernbedienung, mit der Gesten ausgeführt werden können. Die dazugehörige "Magic Motion Fernbedienung" soll 2012 auf den Markt kommen.
Apples sprachgesteuerter Assistent Siri soll bei Google eine rege Entwicklungstätigkeit ausgelöst haben. Google soll bald eine ähnliche Funktion namens Majel auch für Android-Smartphones bereitstellen. Die Sprachausgabe orientiert sich an der Computerstimme aus Raumschiff Enterprise (Star Trek).
Der Roboter Qbo kann sein eigenes Spiegelbild erkennen und soll sogar lernen, sich selbst von anderen Robotern der gleichen Art zu unterscheiden.
Mit der App Touchpad wird das iPhone 4S zum Diktiergerät für Windows und Mac OS X verwandelt. Siri übernimmt dabei die Spracherkennung.
Aldebaran Robotics lässt den Internethasen Nabaztag von Violet weiterleben und vertreibt dessen aktuelle Variante Karotz. Das Unternehmen war bekanntgeworden durch seinen humanoiden Roboter Nao.
Der Softwareentwickler Pete Lamonica hat mit Siri Proxy eine Software entwickelt, die es ermöglicht, Apples Sprachsteuerung um zusätzliche Funktionen zu erweitern. Lamonica zeigt, wie er das Thermostat seiner Heizung mit Siri steuert.
Amazon will seine Kindle-Tablets offenbar mit einer Sprachsteuerung ausstatten. Der Internethändler hat unbemerkt Yap gekauft, ein Startup, dessen Spracherkennungsdienste bei vielen US-Mobilfunkbetreibern liefen.
Apples Spracherkennung und -steuerung Siri funktioniert auch auf dem iPhone 4 und iPod touch 4G - allerdings nur mit installiertem iOS-5-Jailbreak und einem von Entwickler Steven Troughton-Smith ersonnenen Hack.
Nuance hat mit der Dragon Recorder App für iOS eine Lösung vorgestellt, mit der Diktate auf iPhone, iPad und iPod aufgenommen und am Rechner in Texte umgesetzt werden können, wenn der Anwender sein Mobilgerät synchronisiert. Ohne die Dragon-Spracherkennungssoftware für Windows oder Mac OS X ist das System allerdings unbrauchbar.
Ifa 2011 Ford will das mit Microsoft zusammen entwickelte Fahrzeugsystem Sync auch in europäische Modelle integrieren. Außerdem wird der Fiesta mit einem Sicherheitssystem ausgestattet, mit dem sich verschiedene Fahrzeugparameter je nach Fahrer einstellen lassen.
Qbo ist ein kleiner rollender Roboter, den das spanische Unternehmen The Corpora entwickelt hat. Er ist einerseits als Testfeld für Open-Source-Systeme und andererseits als Roboter für daheim gedacht.
Nuance hat seine Spracherkennungssoftware Dragon Naturallyspeaking neu aufgelegt. Mit Version 11.5 kann das iPhone als Diktiergerät eingesetzt werden. Die eingesprochenen Texte werden auf dem PC erkannt. Auch die Windows-Steuerung per Sprache ist vom iPhone aus möglich.
Apple hat in den USA einen Patentantrag eingereicht, der ein Verfahren beschreibt, wie das iPhone künftig für seinen Besitzer Telefonate führen kann. Der Anwender kann einen Text tippen, der dann im Gespräch angesagt wird. Auch die Umwandlung von Telefongesprächen in Text ist angedacht.
Apple will die Spracherkennungssoftware von Nuance in iOS 5 und in seinem neuen Rechenzentrum in North Carolina nutzen. Laut einem Medienbericht haben die beiden Hersteller deshalb eine enge Zusammenarbeit ausgehandelt.
Google Chrome 11 enthält eine Programmierschnittstelle, mit der gesprochene Sprache in Text umgewandelt werden kann. Die Browsererweiterung Speechify nutzt diese Funktion, um Suchmaschinen wie Google oder Bing, aber auch Hulu, Amazon und Youtube zu bedienen.
Die Suchfunktion von Googles Browser Chrome kann mit Hilfe einer Erweiterung über die Stimme des Anwenders gesteuert werden. Voice Search kann unter anderem die Google-Suche und die Wikipedia ansteuern.
Apple-Mitbegründer Steve Wozniak hat in einem Interview behauptet, dass Apple den Softwarehersteller Nuance Communications gekauft hat. Daraufhin legte die Aktie des Entwicklers von Spracherkennungstechnologie stark zu. Doch Wozniak hat inzwischen eingeräumt, einfach Firmennamen verwechselt zu haben.
Englische Wissenschaftler haben eine Gesichtserkennungssoftware für Smartphones entwickelt. Das biometrische System soll zur Authentifizierung dienen.
In Version 0.3 bietet Simon über sogenannte Sprachszenarien die Möglichkeit, Anwendungen über die Spracheingabe zu bedienen. Simon ist für körperlich beeinträchtigte Menschen gedacht, die sonst nicht in der Lage sind, einen Computer zu bedienen. Eine Worterkennung gibt es bislang nicht.
Eine Sprachsteuerung für Mozillas Firefox hat das Team um Firesay entwickelt. Die Erweiterung erlaubt dem Anwender, Kommandos für Websuchen oder zum Öffnen von Seiten über das Mikrofon zu geben. Maus und Tastatur werden dabei nicht benötigt. Noch steht die Technik aber ganz am Anfang.
Nuance hat zwei neue Apps vorgestellt, mit denen die Spracherkennung auch auf Apples iPad und iPhone funktioniert. Dragon Dictation nimmt dabei über die Mikrofone des Geräts das Diktat auf, schickt die Sounddatei zum Nuance-Server und erhält den erkannten Text zurück, der dann in andere Programme kopiert werden kann.
Rund 20 Prozent präziser soll die neue Spracherkennungssoftware Dragon NaturallySpeaking 11 von Nuance sein. Sie soll gesprochene Sprache spürbar schneller in Text umwandeln.
Die Software MacSpeech Scribe von Nuance ist eine Spracherkennung für den Mac, die Tonaufzeichnungen in Text umsetzen soll. Das Programm unterstützt mehrere Sprachen und kann individuelle Sprachprofile aufbauen. So sollen die typischen Aussprachen des Anwenders auch in Fremdsprachen berücksichtigt werden.
Canon hat in den USA einen Patentantrag für eine Sprachsteuerung von Digitalkameras gestellt. Damit würde es eine weitere Eingabemethode neben Knöpfen, Rädern und Touchscreens für Kameras geben. Der Fotograf soll sich so besser auf sein Motiv konzentrieren können.
Jeder der ein paar Ideen auf einer Serviette skizzieren kann, soll mit Prezi eindrucksvolle, nichtlinerare Präsentationen erstellen können. Mit Zoom- und Dreheffekten zeigt Prezi, wie sich ein Gesamtbild aus einzelnen Details zusammensetzt.
(Prezi)
Vom ersten bis zum letzten Zeitalter in 30 Stunden statt 30 Minuten. Age of Empires Online stellt das Prinzip der Vorgänger gründlich auf den Kopf und vermischt das Echtzeitstrategiespiel mit einer gehörigen Portion Onlinerollenspiel.
(Age Of Empires Online)
In der Europäischen Union rufen Bürgerrechtler zum Widerstand gegen das internationale Antipiraterieabkommen Acta auf. In einem Video warnen sie vor gravierenden Folgen für Privatsphäre, freie Meinungsäußerung, medizinische Versorgung und Lebensmittelversorgung von EU-Bürgern.
(Acta)
Die Fujifilm Finepix X-Pro1 verlangt in der Bedienung dem Anwender einiges ab. Ihr langsamer Autofokus strapaziert die Geduld. Und trotz aller Kritikpunkte entschädigt die Bildqualität für alle Mühen. Golem.de hat die umstrittene Systemkamera einem Praxistest unterzogen.
(Fuji X Pro 1)
Fujifilm soll zur CES 2013 in Las Vegas die Nachfolger der renommierten Digitalkameras X100 und X10 vorstellen. Beide sollen erheblich schneller scharf stellen und die richtige Fokussierung durch hervorstechende Bildbereiche anzeigen.
(Fuji X100s)
Fujifilm hat mit der X20 und der X100S die Nachfolgegeneration seiner Retrokameras vorgestellt und sie mit dem X-Trans-Sensor ausgestattet, der auch schon in den Fujifilm-Systemkameras seinen Dienst verrichtet. Neu ist sein Einsatz als 2/3 Zoll großes Modell.
(Fuji X20)
E-Mail an news@golem.de