Entwickler versuchen, Computern und anderen Geräten beizubringen, gesprochene Worte zu erkennen. Das soll deren Bedienung vereinfachen: Statt Kommandos per Tastatur oder Maus einzugeben, erteilt der Nutzer gesprochene Eingaben. Texte sollen nicht mehr getippt, sondern diktiert werden. Spracherkennung ist nicht gleichzusetzen mit Stimmerkennung, also dem Verfahren, einen Menschen anhand des biometrischen Merkmals seiner Stimme zu identifizieren. Beide Verfahren ähneln sich aber.
Emotionen in Stimmen zu erkennen, ist für die Forscher von Affectiva durch die wenigen Trainigsdaten nicht leicht. Trotzdem konnten sie ein neuronales Netzwerk trainieren, das verschiedene Sprachen versteht. Das soll für viele Dinge hilfreich sein, etwa für die Erkennung psychologischer Störungen.
Facebook-Forscher arbeiten an einem Programm, das die Toneigenschaften von Sprachen lernt und Gesprochenes in andere Sprachen umwandeln kann. Erste Ergebnisse klingen schon relativ glaubwürdig. Allerdings gibt es Einschränkungen.
Nachdem Samsung seit gut zwei Jahren versucht, seinen Sprachassistenten Bixby zu etablieren, sollen die Fernseher des Herstellers laut Medienbericht künftig den Google Assistant nutzen. Denkbar ist eine Ankündigung bei der CES 2019.
Lange hat es gedauert: Samsung hat es endlich geschafft, seinen Sprachassistenten Bixby eine deutsche Spracheingabe zu verpassen. Diese klingt sehr natürlich, ist zunächst aber nur auf dem Galaxy Note 9 verfügbar.
Apple-Nutzer können ihren Volkswagen mit Siri öffnen sowie hupen, das Licht ein- und ausschalten und den Standort ermitteln lassen. Apples Sprachassistentin versteht sich derzeit aber nur mit US-Volkswagen.
Apple hat eine aktualisierte Version der Kurzbefehle-App mit iPad-Pro-Unterstützung vorgestellt, die zahlreiche Fehler der Version 2.1 behebt, darunter eine Rechenschwäche und Probleme mit dem LED-Blitz.
"Alexa, spiele Thunderstruck von AC/DC": Die Music Skill API ermöglicht Entwicklern das Erstellen von sprachgesteuerten Musikstreamingprogrammen. Die Grundlage dafür stellen AWS Lambda und die Spracherkennung von Amazons Alexa.
Sonos wollte seine Streaming-Lautsprecher eigentlich noch 2018 mit dem Google Assistant versorgen. Daraus wird jedoch nichts: Wie der Hersteller mitteilt, ist man noch nicht so weit und muss die Auslieferung des Updates in das Jahr 2019 verschieben.
Mit Amazons neuem Echo Connect kann Alexa Festnetz- und VoIP-Telefonate starten und annehmen. Die kleine Box wird mit dem heimischen Telefonanschluss verbunden und dient dann als smarte Freisprecheinrichtung.
Amazons Echo-Lautsprecher können aktuell bei vielen Nutzern keine Sprachkommandos annehmen - stattdessen blinkt nur ein roter Leuchtring auf und die Information ertönt, dass Alexa momentan Schwierigkeiten hat, den Nutzer zu verstehen.
Microsoft will den digitalen Assistenten Cortana fit für den Unternehmensbereich machen. Mit passenden Werkzeugen können Mitarbeiter Firmen-Apps mit der Sprache bedienen. Das könnte für Cortana die Chance zum Weiterbestehen sein.
Amazon hat den Echo Auto angekündigt. Das Zubehör, mit dem Nutzer Alexa in ihr Auto integrieren können, verfügt über acht Mikrofone und soll trotz Fahrgeräuschen zuverlässig arbeiten.
Mit Deep Speech will Mozilla ein freies System zur Spracherkennung bereitstellen. Die aktuelle Version 0.2 ist nun deutlich kleiner und ermöglicht Echtzeitanwendungen für die Spracherkennung, wie das automatische Erstellen von Untertiteln.
Autofahrer in Deutschland können künftig den Google Assistant über Android Auto verwenden. Damit lassen sich per Sprachbefehl Whatsapp-Nachrichten verschicken oder Smart-Home-Geräte bedienen.
Mit den Siri-Kurzbefehlen hat Apple der neuen iOS-Version 12 eine interessante Möglichkeit gegeben, zahlreiche Prozesse zu verzahnen und per Sprachbefehl aufrufen zu können. Die umfangreiche Konfigurations-App ist jetzt verfügbar, inklusive Begleithandbuch.
Die Ansage "Hey BMW, mir ist kalt!" soll das Auto künftig dazu veranlassen, die Heizung anzudrehen. BMW will in seinen Fahrzeugen ab 2019 einen eigenen Sprachassistenten einbauen, mit dem Nutzer kommunizieren können. Die Anbindung an andere Sprachassistenten ist geplant.
Ifa 2018 Wenn sie nicht gerade in der Sofaritze verschwunden ist, hat die Fernbedienung auf vielen Couchtischen noch einen festen Platz. Doch Experten sagen dem Gerät das Ende voraus. Ob sich damit jedoch der Streit um die Fernbedienung erledigt hat, bleibt abzuwarten.
Ifa 2018 Keine zentrale Steueranlage, nur WLAN: Medions Smarthome-System Life+ richtet sich an Einsteiger, die nicht viel basteln wollen. Zu den ersten Geräten zählen Steckdosen und LED-Streifen, aber auch Staubsaugroboter und Luftreiniger.
Im zweiten Quartal 2018 wurden deutlich mehr smarte Lautsprecher verkauft als im gleichen Quartal des Vorjahres. Google führt die Liste der Hersteller an, gefolgt von Amazon - vor einem Jahr sah das noch ganz anders aus.
Microsoft hat eine erste Vorschau für die Zusammenarbeit der beiden Sprachassistenten Cortana und Alexa vorgestellt. Die beiden Assistenten sollen jeweils auf den anderen zurückgreifen, wenn sie selbst mit einer Aufgabe überfordert sind. Zunächst funktioniert das aber nur in den USA.
Amazon will mit einer Open-Source-Version des Alexa Automotive Core (AAC) SDK oder Auto SDK Automobilherstellern helfen, den Sprachassistenten in Autos und ihre Infotainment-Systeme zu integrieren. Bisher ist Alexa in der Automobilwelt nur sporadisch vertreten.
Von 50 Millionen Alexa-Nutzern sollen nur 100.000 tatsächlich mit Amazons smartem Assistenten eingekauft haben. Überraschend ist das nicht: Viele Käufer dürften den von ihnen bestellten Artikel vorher selbst anschauen und Preise vergleichen wollen.
Google hat ein neues Video seines telefonierenden Sprachassistenten veröffentlicht. Die auf der I/O 2018 vorgestellte Funktion namens Duplex identifiziert sich jetzt eindeutig am Anfang eines Telefonats. Dadurch wirken die menschlichen Gesten irgendwie unpassend.
Dank einer neuen Funktion können Nutzer des Google Assistant bei ihren Anfragen das "OK Google" jetzt auch mal weglassen: Der Sprachassistent beherrscht nun durchgängige Unterhaltungen, die mehr einer echten Konversation ähneln - bisher allerdings nur auf Englisch.
Mit der Initiative Common Voice sammelt Mozilla frei verfügbare Sprachaufnahmen, um damit die eigene Spracherkennung Deep Speech und andere Projekte fördern zu können. Erstmals wird Common Voice nun offiziell mehrsprachig.
Mit Hilfe von zwei neuronalen Netzen will Qualcomm ein Spracherkennungssystem entwickeln, das lokal auf dem Gerät und ohne Internetanbindung funktioniert. Trotzdem soll es zu 95 Prozent genau sein. Das Ziel: Hardware zu bauen, die sich an das Verhalten der Nutzer anpasst.
Im US-Bundesstaat Kalifornien wird ein Gesetz diskutiert, das automatisierte Systeme wie Bots und KI-Assistenten zwingt, sich als Maschine auszugeben. Das soll menschlichen Gesprächspartnern helfen, könnte im Falle von Projekten wie dem Google Assistant aber auch hinderlich sein.
Es gibt weitere Details zu Google Duplex. Sobald Duplex einen Anruf durchführt, soll sich der Google Assistant als solcher identifizieren. Zudem wird der Anrufer darüber informiert, dass das Telefonat mitgeschnitten wird.
Build 2018 Der Plan, die Sprachassistenten Cortana und Alexa zu verzahnen, ist schon länger bekannt. Auf der Entwicklermesse Build zeigten Microsoft und Amazon kurz, wie das funktioniert. Allerdings gibt es weiter kaum Informationen dazu.
Google I/O 2018 Reservierungen und andere Nachfragen soll der Google Assistant künftig auch bei Unternehmen durchführen können, die an kein Buchungssystem angeschlossen sind. Dazu nutzt der digitale Assistent ein klassisches Medium: das Telefon.
Build 2018 Microsoft hat Visual Studio Live Share freigegeben. Das soll die Entwicklung in Teams erleichertern, die nicht unbedingt an einem Ort arbeiten.
Googles AIY Vision und Voice erinnern an Nintendo Labo. Es handelt sich um Bastelkästen aus Pappkarton und Raspberry Pi Zero WH. Doch erst der Google Assistant und Tensorflow sollen die Würfel zum Bilderkennungssystem oder zum Mini-Google-Home machen.
Adobe hat die Übernahme von Sayspring bekanntgegeben. Das in New York ansässige Startup bietet sprachbasierte Anwendungen an, die sich in virtuellen Assistenten wie Alexa und Google Assistant integrieren lassen.
Forscher bei Google haben einen Algorithmus vorgestellt, der zuverlässig verschiedene Sprachquellen in Videos trennen soll. Dabei verlässt sich das Deep-Learning-Modell nicht nur auf unterschiedliche Audiomuster, sondern bezieht auch die Mundbewegungen in die Berechnung mit ein.
Soziale Chatbots wie Xiaoice werden gerade in Asien immer beliebter. Microsoft will sie menschlicher wirken lassen. Die Herangehensweise: Latenzen zwischen Antworten sollen verkürzt werden und die Bots sollen Humor und soziale Bedürfnisse verstehen können - wie ein menschlicher Freund.
Was hat das Gegenüber gerade gesagt? Die Sprachbarriere mindert oft den Spaß an Reisen in fremde Länder. Der chinesische Internetkonzern Baidu hat ein Gerät entwickelt, das Abhilfe bietet: Es übersetzt fast simultan das gesprochene Wort, vorerst aber nur in drei Sprachen.
Eine Maschine beherrscht Chinesisch und Englisch so gut wie ein professioneller Übersetzer: Microsoft Research hat ein KI-basiertes Übersetzungssystem entwickelt - laut Microsoft ein wichtiger Fortschritt bei der Verarbeitung natürlicher Sprache.
Ein aufwendiger Werbespot für Alexa hat Amazon vor ein Problem gestellt: ungewollt ausgeführte Sprachbefehle. Nun ist bekanntgeworden, wie die Fehlsteuerung vermutlich verhindert wird. Nebenbei hat der Hersteller offenbar ein Echo-Headset vorgestellt.
Während sprachgesteuerte Assistenten boomen, sind sprachgestützte Spielzeuge fast verstummt. Ein deutsches Unternehmen zeigt, dass Spielsachen für die Spracherkennung kein Internet benötigen.
Apple hat es endlich geschafft, seinen smarten Lautsprecher Homepod fertig zu stellen: Ab dem 9. Februar 2018 soll das Gerät erhältlich sein. Allerdings kommt der Lautsprecher vorerst nur in den USA, Großbritannien und Australien in den Handel, Deutschland soll im Frühjahr folgen.
Es ist nicht Verdis Requiem in schlechter Aufnahmequalität: Forscher entwickeln eine KI, die die Sprachassistenten täuscht, indem sie Geräusche in anderen Geräuschen versteckt. In einem Video ist die Stimme zu hören, die wie ein Roboter aus der Zukunft klingt.
Entwickler können mit dem SDK für den Google Assistant nicht mehr nur Geräte in Englisch konfigurieren, sondern unter anderem auch in Deutsch. Google hat dem Software Development Kit noch weitere neue Funktionen verpasst.
"Alexa, bitte aktiviere meine stärksten Waffen": Mit solchen Sprachbefehlen können Spieler ab sofort in Destiny 2 kämpfen. Dazu verwendet das Actionspiel Alexa von Amazon, sogar ein Lautsprecher im Ghost-Design ist demnächst erhältlich - alles allerdings vorerst nicht in Deutschland.
Mit Deep Speech steht ein erstes freies Modell zur Spracherkennung von Mozilla bereit. Parallel dazu sammelt Mozilla mit Common Voice die Sprachdaten dafür und stellt diese ebenfalls frei zu Verfügung. Golem.de hat mit den Verantwortlichen der beiden Projekte gesprochen.
Von
Sebastian Grüner
Apples erster Siri-Lautsprecher kommt nicht mehr in diesem Jahr auf den Markt. Apple kann die Markteinführung des Homepods nicht einhalten. Ein Verkaufsstart in Deutschland rückt damit in weite Ferne.
Mit der neuen Bixby-Version 2.0 will Samsung seinen Sprachassistenten für Entwickler öffnen: Ein Beta-SDK steht für ausgewählte Developer zur Verfügung. Langfristig will Samsung Bixby nicht nur auf Smartphones, sondern auch Fernseher, Kühlschränke und andere Geräte bringen.
Wie richte ich ein Bluetooth-Gerät ein? Cortana soll mit Follow Me künftig Nutzer durch das Betriebssystem führen und Anweisungen per Sprachausgabe geben können. Eine Demo davon ist zumindest auf Twitter verbreitet worden.
Wie ist das Wetter? Wo ist das nächste Burger-Restaurant? Nutzer können künftig Cortana in Skype um Hilfe fragen. Der Sprachassistent analysiert auch Chatverläufe, um automatisch Vorschläge anzubieten.
Oracles neue AI Cloud Platform soll für Kunden die Tools und die Hardware zum Erstellen eigener Lernalgorithmen bereitstellen. Auch in der Mobile Cloud können interaktive Chatbots erstellt werden. Allerdings ist die Konkurrenz mit Salesforce, Microsoft und Co. relativ stark.
Einkaufen aus dem Auto heraus: Das soll mit der Alexa-Integration bald in allen neuen Mini und BMW möglich sein. Dabei steht nahezu die gesamte Palette von Zehntausenden Alexa-Skills zur Verfügung, die über das Echo-Gerät zu Hause genutzt werden kann.
Um jeweils 100 Euro hat Google im Play Store den Preis für das Android-Smartphone Nexus 4 gesenkt. Die Preise bei deutschen Onlinehändlern bleiben vorerst unverändert.
(Nexus 4)
Fujifilm hat mit der X20 und der X100S die Nachfolgegeneration seiner Retrokameras vorgestellt und sie mit dem X-Trans-Sensor ausgestattet, der auch schon in den Fujifilm-Systemkameras seinen Dienst verrichtet. Neu ist sein Einsatz als 2/3 Zoll großes Modell.
(Fuji X20)
Fujifilm soll zur CES 2013 in Las Vegas die Nachfolger der renommierten Digitalkameras X100 und X10 vorstellen. Beide sollen erheblich schneller scharf stellen und die richtige Fokussierung durch hervorstechende Bildbereiche anzeigen.
(Fuji X100s)
Die Fujifilm Finepix X-Pro1 verlangt in der Bedienung dem Anwender einiges ab. Ihr langsamer Autofokus strapaziert die Geduld. Und trotz aller Kritikpunkte entschädigt die Bildqualität für alle Mühen. Golem.de hat die umstrittene Systemkamera einem Praxistest unterzogen.
(Fuji X Pro 1)
In der Europäischen Union rufen Bürgerrechtler zum Widerstand gegen das internationale Antipiraterieabkommen Acta auf. In einem Video warnen sie vor gravierenden Folgen für Privatsphäre, freie Meinungsäußerung, medizinische Versorgung und Lebensmittelversorgung von EU-Bürgern.
(Acta)
Vom ersten bis zum letzten Zeitalter in 30 Stunden statt 30 Minuten. Age of Empires Online stellt das Prinzip der Vorgänger gründlich auf den Kopf und vermischt das Echtzeitstrategiespiel mit einer gehörigen Portion Onlinerollenspiel.
(Age Of Empires Online)
Jeder der ein paar Ideen auf einer Serviette skizzieren kann, soll mit Prezi eindrucksvolle, nichtlinerare Präsentationen erstellen können. Mit Zoom- und Dreheffekten zeigt Prezi, wie sich ein Gesamtbild aus einzelnen Details zusammensetzt.
(Prezi)
E-Mail an news@golem.de