Emotionen in Stimmen zu erkennen, ist für die Forscher von Affectiva durch die wenigen Trainigsdaten nicht leicht. Trotzdem konnten sie ein neuronales Netzwerk trainieren, das verschiedene Sprachen versteht. Das soll für viele Dinge hilfreich sein, etwa für die Erkennung psychologischer Störungen.
Facebook-Forscher arbeiten an einem Programm, das die Toneigenschaften von Sprachen lernt und Gesprochenes in andere Sprachen umwandeln kann. Erste Ergebnisse klingen schon relativ glaubwürdig. Allerdings gibt es Einschränkungen.
Nachdem Samsung seit gut zwei Jahren versucht, seinen Sprachassistenten Bixby zu etablieren, sollen die Fernseher des Herstellers laut Medienbericht künftig den Google Assistant nutzen. Denkbar ist eine Ankündigung bei der CES 2019.
Lange hat es gedauert: Samsung hat es endlich geschafft, seinen Sprachassistenten Bixby eine deutsche Spracheingabe zu verpassen. Diese klingt sehr natürlich, ist zunächst aber nur auf dem Galaxy Note 9 verfügbar.
Apple-Nutzer können ihren Volkswagen mit Siri öffnen sowie hupen, das Licht ein- und ausschalten und den Standort ermitteln lassen. Apples Sprachassistentin versteht sich derzeit aber nur mit US-Volkswagen.
Apple hat eine aktualisierte Version der Kurzbefehle-App mit iPad-Pro-Unterstützung vorgestellt, die zahlreiche Fehler der Version 2.1 behebt, darunter eine Rechenschwäche und Probleme mit dem LED-Blitz.
"Alexa, spiele Thunderstruck von AC/DC": Die Music Skill API ermöglicht Entwicklern das Erstellen von sprachgesteuerten Musikstreamingprogrammen. Die Grundlage dafür stellen AWS Lambda und die Spracherkennung von Amazons Alexa.
Sonos wollte seine Streaming-Lautsprecher eigentlich noch 2018 mit dem Google Assistant versorgen. Daraus wird jedoch nichts: Wie der Hersteller mitteilt, ist man noch nicht so weit und muss die Auslieferung des Updates in das Jahr 2019 verschieben.
Mit Amazons neuem Echo Connect kann Alexa Festnetz- und VoIP-Telefonate starten und annehmen. Die kleine Box wird mit dem heimischen Telefonanschluss verbunden und dient dann als smarte Freisprecheinrichtung.
Update Amazons Echo-Lautsprecher können aktuell bei vielen Nutzern keine Sprachkommandos annehmen - stattdessen blinkt nur ein roter Leuchtring auf und die Information ertönt, dass Alexa momentan Schwierigkeiten hat, den Nutzer zu verstehen.
Microsoft will den digitalen Assistenten Cortana fit für den Unternehmensbereich machen. Mit passenden Werkzeugen können Mitarbeiter Firmen-Apps mit der Sprache bedienen. Das könnte für Cortana die Chance zum Weiterbestehen sein.
Amazon hat den Echo Auto angekündigt. Das Zubehör, mit dem Nutzer Alexa in ihr Auto integrieren können, verfügt über acht Mikrofone und soll trotz Fahrgeräuschen zuverlässig arbeiten.
Mit Deep Speech will Mozilla ein freies System zur Spracherkennung bereitstellen. Die aktuelle Version 0.2 ist nun deutlich kleiner und ermöglicht Echtzeitanwendungen für die Spracherkennung, wie das automatische Erstellen von Untertiteln.
Autofahrer in Deutschland können künftig den Google Assistant über Android Auto verwenden. Damit lassen sich per Sprachbefehl Whatsapp-Nachrichten verschicken oder Smart-Home-Geräte bedienen.
Mit den Siri-Kurzbefehlen hat Apple der neuen iOS-Version 12 eine interessante Möglichkeit gegeben, zahlreiche Prozesse zu verzahnen und per Sprachbefehl aufrufen zu können. Die umfangreiche Konfigurations-App ist jetzt verfügbar, inklusive Begleithandbuch.
Die Ansage "Hey BMW, mir ist kalt!" soll das Auto künftig dazu veranlassen, die Heizung anzudrehen. BMW will in seinen Fahrzeugen ab 2019 einen eigenen Sprachassistenten einbauen, mit dem Nutzer kommunizieren können. Die Anbindung an andere Sprachassistenten ist geplant.
Ifa 2018 Wenn sie nicht gerade in der Sofaritze verschwunden ist, hat die Fernbedienung auf vielen Couchtischen noch einen festen Platz. Doch Experten sagen dem Gerät das Ende voraus. Ob sich damit jedoch der Streit um die Fernbedienung erledigt hat, bleibt abzuwarten.
Ifa 2018 Keine zentrale Steueranlage, nur WLAN: Medions Smarthome-System Life+ richtet sich an Einsteiger, die nicht viel basteln wollen. Zu den ersten Geräten zählen Steckdosen und LED-Streifen, aber auch Staubsaugroboter und Luftreiniger.
Im zweiten Quartal 2018 wurden deutlich mehr smarte Lautsprecher verkauft als im gleichen Quartal des Vorjahres. Google führt die Liste der Hersteller an, gefolgt von Amazon - vor einem Jahr sah das noch ganz anders aus.
Microsoft hat eine erste Vorschau für die Zusammenarbeit der beiden Sprachassistenten Cortana und Alexa vorgestellt. Die beiden Assistenten sollen jeweils auf den anderen zurückgreifen, wenn sie selbst mit einer Aufgabe überfordert sind. Zunächst funktioniert das aber nur in den USA.
Amazon will mit einer Open-Source-Version des Alexa Automotive Core (AAC) SDK oder Auto SDK Automobilherstellern helfen, den Sprachassistenten in Autos und ihre Infotainment-Systeme zu integrieren. Bisher ist Alexa in der Automobilwelt nur sporadisch vertreten.
Von 50 Millionen Alexa-Nutzern sollen nur 100.000 tatsächlich mit Amazons smartem Assistenten eingekauft haben. Überraschend ist das nicht: Viele Käufer dürften den von ihnen bestellten Artikel vorher selbst anschauen und Preise vergleichen wollen.
Google hat ein neues Video seines telefonierenden Sprachassistenten veröffentlicht. Die auf der I/O 2018 vorgestellte Funktion namens Duplex identifiziert sich jetzt eindeutig am Anfang eines Telefonats. Dadurch wirken die menschlichen Gesten irgendwie unpassend.
Dank einer neuen Funktion können Nutzer des Google Assistant bei ihren Anfragen das "OK Google" jetzt auch mal weglassen: Der Sprachassistent beherrscht nun durchgängige Unterhaltungen, die mehr einer echten Konversation ähneln - bisher allerdings nur auf Englisch.
Mit der Initiative Common Voice sammelt Mozilla frei verfügbare Sprachaufnahmen, um damit die eigene Spracherkennung Deep Speech und andere Projekte fördern zu können. Erstmals wird Common Voice nun offiziell mehrsprachig.
Mit Hilfe von zwei neuronalen Netzen will Qualcomm ein Spracherkennungssystem entwickeln, das lokal auf dem Gerät und ohne Internetanbindung funktioniert. Trotzdem soll es zu 95 Prozent genau sein. Das Ziel: Hardware zu bauen, die sich an das Verhalten der Nutzer anpasst.
Im US-Bundesstaat Kalifornien wird ein Gesetz diskutiert, das automatisierte Systeme wie Bots und KI-Assistenten zwingt, sich als Maschine auszugeben. Das soll menschlichen Gesprächspartnern helfen, könnte im Falle von Projekten wie dem Google Assistant aber auch hinderlich sein.
Es gibt weitere Details zu Google Duplex. Sobald Duplex einen Anruf durchführt, soll sich der Google Assistant als solcher identifizieren. Zudem wird der Anrufer darüber informiert, dass das Telefonat mitgeschnitten wird.
Build 2018 Der Plan, die Sprachassistenten Cortana und Alexa zu verzahnen, ist schon länger bekannt. Auf der Entwicklermesse Build zeigten Microsoft und Amazon kurz, wie das funktioniert. Allerdings gibt es weiter kaum Informationen dazu.
I/O 2018 Reservierungen und andere Nachfragen soll der Google Assistant künftig auch bei Unternehmen durchführen können, die an kein Buchungssystem angeschlossen sind. Dazu nutzt der digitale Assistent ein klassisches Medium: das Telefon.
Build 2018 Microsoft hat Visual Studio Live Share freigegeben. Das soll die Entwicklung in Teams erleichertern, die nicht unbedingt an einem Ort arbeiten.
Googles AIY Vision und Voice erinnern an Nintendo Labo. Es handelt sich um Bastelkästen aus Pappkarton und Raspberry Pi Zero WH. Doch erst der Google Assistant und Tensorflow sollen die Würfel zum Bilderkennungssystem oder zum Mini-Google-Home machen.
Adobe hat die Übernahme von Sayspring bekanntgegeben. Das in New York ansässige Startup bietet sprachbasierte Anwendungen an, die sich in virtuellen Assistenten wie Alexa und Google Assistant integrieren lassen.
Forscher bei Google haben einen Algorithmus vorgestellt, der zuverlässig verschiedene Sprachquellen in Videos trennen soll. Dabei verlässt sich das Deep-Learning-Modell nicht nur auf unterschiedliche Audiomuster, sondern bezieht auch die Mundbewegungen in die Berechnung mit ein.
Soziale Chatbots wie Xiaoice werden gerade in Asien immer beliebter. Microsoft will sie menschlicher wirken lassen. Die Herangehensweise: Latenzen zwischen Antworten sollen verkürzt werden und die Bots sollen Humor und soziale Bedürfnisse verstehen können - wie ein menschlicher Freund.
Was hat das Gegenüber gerade gesagt? Die Sprachbarriere mindert oft den Spaß an Reisen in fremde Länder. Der chinesische Internetkonzern Baidu hat ein Gerät entwickelt, das Abhilfe bietet: Es übersetzt fast simultan das gesprochene Wort, vorerst aber nur in drei Sprachen.
Eine Maschine beherrscht Chinesisch und Englisch so gut wie ein professioneller Übersetzer: Microsoft Research hat ein KI-basiertes Übersetzungssystem entwickelt - laut Microsoft ein wichtiger Fortschritt bei der Verarbeitung natürlicher Sprache.
Ein aufwendiger Werbespot für Alexa hat Amazon vor ein Problem gestellt: ungewollt ausgeführte Sprachbefehle. Nun ist bekanntgeworden, wie die Fehlsteuerung vermutlich verhindert wird. Nebenbei hat der Hersteller offenbar ein Echo-Headset vorgestellt.
Während sprachgesteuerte Assistenten boomen, sind sprachgestützte Spielzeuge fast verstummt. Ein deutsches Unternehmen zeigt, dass Spielsachen für die Spracherkennung kein Internet benötigen.
Apple hat es endlich geschafft, seinen smarten Lautsprecher Homepod fertig zu stellen: Ab dem 9. Februar 2018 soll das Gerät erhältlich sein. Allerdings kommt der Lautsprecher vorerst nur in den USA, Großbritannien und Australien in den Handel, Deutschland soll im Frühjahr folgen.
Es ist nicht Verdis Requiem in schlechter Aufnahmequalität: Forscher entwickeln eine KI, die die Sprachassistenten täuscht, indem sie Geräusche in anderen Geräuschen versteckt. In einem Video ist die Stimme zu hören, die wie ein Roboter aus der Zukunft klingt.
Entwickler können mit dem SDK für den Google Assistant nicht mehr nur Geräte in Englisch konfigurieren, sondern unter anderem auch in Deutsch. Google hat dem Software Development Kit noch weitere neue Funktionen verpasst.
"Alexa, bitte aktiviere meine stärksten Waffen": Mit solchen Sprachbefehlen können Spieler ab sofort in Destiny 2 kämpfen. Dazu verwendet das Actionspiel Alexa von Amazon, sogar ein Lautsprecher im Ghost-Design ist demnächst erhältlich - alles allerdings vorerst nicht in Deutschland.
Mit Deep Speech steht ein erstes freies Modell zur Spracherkennung von Mozilla bereit. Parallel dazu sammelt Mozilla mit Common Voice die Sprachdaten dafür und stellt diese ebenfalls frei zu Verfügung. Golem.de hat mit den Verantwortlichen der beiden Projekte gesprochen.
Apples erster Siri-Lautsprecher kommt nicht mehr in diesem Jahr auf den Markt. Apple kann die Markteinführung des Homepods nicht einhalten. Ein Verkaufsstart in Deutschland rückt damit in weite Ferne.
Mit Rust, Servo und dem Videocodec Daala hat Mozilla Infrastruktur-Experimente gepflegt, die erst Jahre später langsam produktiv genutzt werden. Für VR, Sprache und Machine Learning soll das genauso laufen. Wer braucht da schon konkrete Produktideen?
Mit der neuen Bixby-Version 2.0 will Samsung seinen Sprachassistenten für Entwickler öffnen: Ein Beta-SDK steht für ausgewählte Developer zur Verfügung. Langfristig will Samsung Bixby nicht nur auf Smartphones, sondern auch Fernseher, Kühlschränke und andere Geräte bringen.
Wie richte ich ein Bluetooth-Gerät ein? Cortana soll mit Follow Me künftig Nutzer durch das Betriebssystem führen und Anweisungen per Sprachausgabe geben können. Eine Demo davon ist zumindest auf Twitter verbreitet worden.
Wie ist das Wetter? Wo ist das nächste Burger-Restaurant? Nutzer können künftig Cortana in Skype um Hilfe fragen. Der Sprachassistent analysiert auch Chatverläufe, um automatisch Vorschläge anzubieten.