Entwickler versuchen, Computern und anderen Geräten beizubringen, gesprochene Worte zu erkennen. Das soll deren Bedienung vereinfachen: Statt Kommandos per Tastatur oder Maus einzugeben, erteilt der Nutzer gesprochene Eingaben. Texte sollen nicht mehr getippt, sondern diktiert werden. Spracherkennung ist nicht gleichzusetzen mit Stimmerkennung, also dem Verfahren, einen Menschen anhand des biometrischen Merkmals seiner Stimme zu identifizieren. Beide Verfahren ähneln sich aber.
Motorräder sollen mit Sprachsteuerung hipper werden. Der E-Motorrad-Hersteller Energica will die Ablenkung reduzieren, erreicht wird das Gegenteil.
Ein IMHO von Andreas Donath
Das iPhone-Betriebssystem ist dann nicht mehr länger auf Apple Music als Standard-App festgelegt.
Der Browserhersteller stellt den Betrieb seines Proxys zu Sprachsteuerung ein. Damit fallen auch die Firefox-Erweiterungen dazu weg.
Künftig bedarf es einer ausdrücklichen Zustimmung der Nutzer, damit Microsoft Sprachclips nachträglich anhört.
Amazon will die Alexa-Nutzung im Auto angenehmer machen. Dabei geht es aber nicht um eine bessere Sprachsteuerung.
Schnell ein Interview transkribieren, das müsste mit KI-Systemen doch inzwischen gut machbar sein - dachten wir.
Ein Erfahrungsbericht von Sebastian Grüner
Im Jahr 2021 werden die mobile App und Drittanbieterskills für Cortana verschwinden. Ihr neues Zuhause: das Microsoft-365-Abo.
Im Auto ist die Alexa-Sprachsteuerung noch praktischer als daheim. Amazon hat bei Echo Auto die wichtigsten Einsatzzwecke im Fahrzeug bedacht.
Ein Test von Ingo Pakalski
Für alle, die den Alexa-Funktionsumfang auch während der Fahrt nutzen wollen.
Von Ingo Pakalski
Excel-Tabellen automatisieren oder Fragen in ganzen Sätzen stellen: OpenAIs erste kommerzielle API nutzt das neue GPT-3 für Texterkennung.
Die irische Datenschutzbehörde hat Fragen rund um Siri an Apple geschickt. Es gibt Vorwürfe eines früheren Whistleblowers.
Build 2020 Cognitive Services können aus Bildern nicht mehr nur Englisch-Texte extrahieren. Außerdem gibt es eine KI, die bei der Aussprache hilft.
Eine weichere und akzentuiertere Stimme - dieses Update hat Apple seinem Sprachassistenten Siri nach knapp drei Jahren zukommen lassen.
Die Spracherkennung von Mozilla soll mit der aktuellen Version schneller werden und Modelle sollen sich einfacher anpassen lassen.
Der Hersteller setzt auf den Sprachassistenten Bixby.
Die Betaversion bietet neben Plasma-Oberfläche und Apps einen Open-Source-Sprachassistenten.
Cortana könnte bald Microsoft 365 Assistant heißen. Das ist eine schlechte Idee, da dieser Name in den vielen Angeboten mit der Zahl 365 im Namen einfach untergehen würde. Microsoft sollte Cortana stattdessen einen simulierten Charakter geben, damit sie ihrem Namen gerecht wird.
Ein IMHO von Oliver Nickel
Aus Microsoft Teams heraus direkt eine E-Mail schreiben: Das wird in der neuen Version der Software möglich sein. Außerdem schaltet der Hersteller die Spracherkennung in Videokonferenzen frei, die Gesprochenes als Text anzeigt.
Microsoft wird Cortana umstrukturieren. Künftig können wohl nur noch Kunden die Sprachassistentin nutzen, die sich mit einem Microsoft-Konto an ihrem PC anmelden. Die neue Cortana wird beim Eintragen von Kalenderterminen, Tasks und bei der Bing-Suche helfen. Einige Skills verschwinden aber.
Das Speech-to-Text-Angebot Transcribe von Amazon soll künftig auch automatisiert persönliche Informationen entfernen können. Dazu gehören Namen, Kontaktdaten oder auch Bankinformationen. Kunden sollten wohl aber nicht all zu großes Vertrauen in den Dienst setzen.
Das Sprachmodell Turing-NLP von Microsoft enthält rund 17 Milliarden Parameter und dient der Spracherzeugung, etwa um auf Fragen zu antworten. Teile der dazu genutzten Technik hat Microsoft als Open Source veröffentlicht.
Die freie Spracherkennung Deep Speech von Mozilla läuft in der aktuellen Version 0.6 auch auf wenig leistungsfähigen Chips in Echtzeit. Darüber hinaus hat das Team das Modell weiter deutlich verkleinert.
Seit geraumer Zeit plagen sich einige Android-Auto-Nutzer mit einem nervigen Bug herum: Der integrierte Google Assistant versteht zwar sämtliche Spracheingaben, antwortet aber nicht. Entsprechend verpuffen manche Anfragen im Nichts, eine Lösung ist noch nicht in Sicht.
Sprachbefehle müssen nicht unbedingt per Sprache übertragen werden: Forschern ist es gelungen, smarte Lautsprecher wie Amazon Echo oder Google Home mit einem Laser aus bis zu 110 Metern Entfernung zu steuern - und so beispielsweise ein Garagentor zu öffnen.
Google hat eine neue Version seines kleinsten smarten Lautsprechers vorgestellt: Aus dem Home Mini wird der Nest Mini, der sich mit besserem Klang und besserer Hotword-Erkennung an der Wand befestigen lässt. Der Preis ist mit 60 Euro gleich geblieben.
Nach einem weltweiten Stopp möchte Apple die Sprachbefehle der Siri-Nutzer wieder auswerten - diesmal jedoch mit expliziter Zustimmung durch den Nutzer. Das gilt allerdings nur für Audioaufnahmen, die in Text umgewandelten Mitschnitte möchte Apple weiter ungefragt auswerten.
Die kürzlich angekündigten Echo-Produkte bringen Amazons Sprachassistentin Alexa auf die Straße und damit Datenschutzprobleme in die U-Bahn oder in bisher Alexa-freie Wohnzimmer. Mehrere Landesdatenschutzbeauftragte haben Golem.de erklärt, ob und wie die Geräte eingesetzt werden dürfen.
Von Moritz Tremmel
Google will den Google Assistant so überarbeiten, dass der Datenschutz der Nutzer besser geschützt wird. Zudem soll es weniger ungewollte Aktivierungen des digitalen Assistenten geben.
Unter welchen Bedingungen müssen Menschen arbeiten, die für die großen IT-Unternehmen Mitschnitte der digitalen Assistenten anhören? Darüber berichtet ein ehemaliger Mitarbeiter, der lange Unterhaltungen belauschen musste und ausbeuterische Arbeitsbedingungen unterhalb des Mindestlohns beklagt.
Nachdem Apple die Auswertung von Siri-Audiodateien zunächst nur gestoppt hatte, wurde nun allen Beschäftigten im Auswertungszentrum in Irland gekündigt - mehr als 300 Mitarbeiter sind betroffen. Apple will die Praxis allerdings weiterführen, aber unter anderen Voraussetzungen.
Wütend, krank oder traurig: Durch unsere Stimme bekommen Sprachassistenten mehr Informationen als nur den Sprachbefehl. Forschern ist es gelungen, die Emotionen aus Audioaufnahmen zu filtern - die Spracherkennung leidet allerdings darunter.
Bevor Apple die Auswertung von Siri-Sprachdateien gestoppt hat, mussten Mitarbeiter in Irland teilweise bis zu 1.000 Audio-Schnipsel pro Schicht auswerten. Meist handelte es sich nur um Sprachkommandos, manchmal waren aber auch persönliche Informationen darunter.
Wie läuft es ab, für Apple Siris Sprachaufnahmen auszuwerten? In zwei Berichten beschreiben Mitarbeiter ihren Arbeitsalltag beim Anhören von Siri-Mitschnitten.
Apple setzt weltweit die Praxis aus, Fragmente von Aufnahmen durch Siri nachträglich von Menschen auswerten zu lassen. Erst kürzlich ist bekannt geworden, dass dies nicht nur bei Amazon und Google, sondern auch bei Apple passiere.
Google-Mitarbeiter werten keine Sprachaufnahmen des Google Assistant mehr aus der EU aus. Dies erklärte das Unternehmen dem Hamburger Datenschutzbeauftragten im Rahmen eines Verwaltungsverfahrens. Das gilt allerdings nur vorübergehend.
Amazon Polly wird um Neural Text-to-Speech erweitert. Dieses soll natürlicher klingen als traditionelle Ansätze. Das System kann etwa Nachrichtenmoderatoren imitieren. Erste Audiobeispiele klingen bereits recht überzeugend, auch wenn einige Dinge die synthetische Herkunft verraten.
Google hat das erste Mal seit fünf Jahren ein großes Update für Android Auto veröffentlicht. Es gibt im Infotainment-System des Autos einen neuen Startbildschirm sowie einige Änderungen bei der Bedienung eines angebundenen Smartphones.
Mit einem Konfigurationsprofil ist es möglich, Apples Sprachassistenten Siri weiter zu nutzen, Apple aber zu untersagen, die Aufnahmen zu analysieren.
Einige Apple-Vertragsarbeiter erhalten Sprachdateien von Siri, um diese zu analysieren und den Assistenten zu verbessern. Allerdings werden laut einer internen Quelle des Guardian oft private Momente aufgenommen - beim Sex, bei Geschäften und beim Gespräch mit dem Arzt.
Google ist nicht begeistert, dass ein Mitarbeiter aufgezeichnete Google-Assistant-Gespräche von Kunden an die Presse weitergeleitet hat. Ermittlungen dazu laufen - und Google rechtfertigt und verteidigt das Vorgehen.
Amazon wird die Konkurrenz durch Sonos möglicherweise etwas zu unheimlich: Insidern zufolge soll das Unternehmen an einem Lautsprecher arbeiten, der es vom Klang mit dem Sonos One aufnehmen kann.
Jeder 500. Sprachbefehl wird von Google-Mitarbeitern ausgewertet. Ein Leak aus Belgien zeigt, dass sich darunter auch viele ungewollt aufgenommene Gespräche und Telefonanrufe befinden - mit privaten und intimen Inhalten.
Basierend auf Google Home und der Sprache Javascript bietet Google ein Software Development Kit für das heimische Smart Home in der Preview an. Das Local Home SDK funktioniert nach der Einrichtung auch ohne Cloud-Anbindung. Diese kann aber als Rückfallebene einspringen.
Der wissenschaftliche Dienst des Bundestages hat eine Einschätzung zu Amazons Sprachassistenten Alexa gegeben. Besonders für Minderjährige stelle die Spracherkennung eine Gefahr dar.
Erst wenn Kunden aufgenommene Daten manuell auswählen, werden sie gelöscht. Das bestätigt Amazon auf eine Anfrage des US-Senators John Coon. Selbst dann seien einige Ausnahmen zu beachten, in denen Alexa und Anbieter Daten weiterverarbeiten.
Seit kurzem findet sich in Microsofts Appstore eine Betaversion von Cortana als Einzeldownload. Es ist nur ein kleiner Download und wohl eine Vorbereitung zur Entbündelung des Sprachassistenten. Laut Nutzerberichten funktioniert Cortana als App noch nicht.
Google Duplex braucht oft menschliche Hilfe. Google selbst räumt ein, dass knapp die Hälfte der telefonischen Restaurant-Reservierungen nicht komplett von einer Maschine durchgeführt werden. In Tests kam die New York Times auf eine viel höhere Rate.
Bisher müssen Nutzer von Googles Sprachassistenten vorprogrammierte Abläufe manuell auslösen. So lassen sich auf die Ansage "Ab ins Bett" beispielsweise alle Lichter im Haus ausschalten. Mit der Zusammenführung von Nest und dem Google Assistant soll das bald auch automatisiert funktionieren.
Build 2019 Moderne Architektur, große Fenster, ein Zen-Garten: Microsofts Campus wirkt außen modern und aufgeräumt. Präsentationen entstehen trotzdem in einem fensterlosen Raum, in dem sich Hardware und Werkzeug stapeln. Microsoft zeigt dort auch eine ungeskriptete Version seiner Spracherkennungssoftware.
Von Oliver Nickel
Mit dem Roav Bolt bringt Anker den Google Assistant ins Auto: Das Gerät wird an eine 12-Volt-Buchse im Auto gesteckt und bietet anschließend vollen Zugriff auf die Funktionen von Googles Sprachassistenten. Gleichzeitig können zwei USB-Geräte darüber geladen werden.
Um jeweils 100 Euro hat Google im Play Store den Preis für das Android-Smartphone Nexus 4 gesenkt. Die Preise bei deutschen Onlinehändlern bleiben vorerst unverändert.
(Nexus 4)
Fujifilm hat mit der X20 und der X100S die Nachfolgegeneration seiner Retrokameras vorgestellt und sie mit dem X-Trans-Sensor ausgestattet, der auch schon in den Fujifilm-Systemkameras seinen Dienst verrichtet. Neu ist sein Einsatz als 2/3 Zoll großes Modell.
(Fuji X20)
Fujifilm soll zur CES 2013 in Las Vegas die Nachfolger der renommierten Digitalkameras X100 und X10 vorstellen. Beide sollen erheblich schneller scharf stellen und die richtige Fokussierung durch hervorstechende Bildbereiche anzeigen.
(Fuji X100s)
Die Fujifilm Finepix X-Pro1 verlangt in der Bedienung dem Anwender einiges ab. Ihr langsamer Autofokus strapaziert die Geduld. Und trotz aller Kritikpunkte entschädigt die Bildqualität für alle Mühen. Golem.de hat die umstrittene Systemkamera einem Praxistest unterzogen.
(Fuji X Pro 1)
In der Europäischen Union rufen Bürgerrechtler zum Widerstand gegen das internationale Antipiraterieabkommen Acta auf. In einem Video warnen sie vor gravierenden Folgen für Privatsphäre, freie Meinungsäußerung, medizinische Versorgung und Lebensmittelversorgung von EU-Bürgern.
(Acta)
Vom ersten bis zum letzten Zeitalter in 30 Stunden statt 30 Minuten. Age of Empires Online stellt das Prinzip der Vorgänger gründlich auf den Kopf und vermischt das Echtzeitstrategiespiel mit einer gehörigen Portion Onlinerollenspiel.
(Age Of Empires Online)
Jeder der ein paar Ideen auf einer Serviette skizzieren kann, soll mit Prezi eindrucksvolle, nichtlinerare Präsentationen erstellen können. Mit Zoom- und Dreheffekten zeigt Prezi, wie sich ein Gesamtbild aus einzelnen Details zusammensetzt.
(Prezi)
E-Mail an news@golem.de