Qualcomm: Spracherkennung auf dem Gerät kommt ohne Cloud aus
Mit Hilfe von zwei neuronalen Netzen will Qualcomm ein Spracherkennungssystem entwickeln, das lokal auf dem Gerät und ohne Internetanbindung funktioniert. Trotzdem soll es zu 95 Prozent genau sein. Das Ziel: Hardware zu bauen, die sich an das Verhalten der Nutzer anpasst.

Auf der Messe Deep Learning Summit in Boston hat Qualcomm sein Machine-Learning-System für Spracherkennung vorgestellt, das auf Endgeräten ohne Cloud-Anbindung funktioniert. Das ist insofern ungewöhnlich, als Kapazitäten dafür meist in einer wesentlich leistungsfähigeren Cloud-Infrastruktur liegen. Dort werden gesprochene Wörter anhand von Deep Learning analysiert und eine passende Antwort zurückgesendet.
Das System besteht aus zwei neuronalen Netzen, wie das IT-Magazin Venturebeat berichtet. Dazu zählt ein Recurrent Neural Network (RNN), das selbst wiederum aus einem neuronalen Netz und einem zweiten prüfenden neuronalen Netz besteht. Die zweite Komponente ist ein herkömmliches neuronales Netz.
95 Prozent Genauigkeit
Qualcomm-Forscher Chris Lott sagte auf der Messe, dass das System bisher zu 95 Prozent genau sei. Allerdings gibt er nicht an, wie viele Trainingsdaten dafür zur Verfügung standen. Es wird dazu verwendet, Wörter und Sätze der Nutzer zu verstehen und in Befehle oder Text umzuwandeln. Lott sagte gegenüber Venturebeat auch: "Es lernt aus Mustern und der Nutzung des Gerätes. Es kann sein Verhalten dem Verhalten der Besitzer anpassen". Wie genau das funktionieren soll, sagte er aber nicht. Es ist wahrscheinlich, dass Qualcomm speziell dafür ausgelegte ARM-Chips entwickelt. Der chinesische Smartphonehersteller Huawei nutzt etwa einen dedizierten KI-Chip für Berechnungen.
Die Unabhängigkeit von der Cloud und damit von einem Unternehmen, das persönliche Daten wie Stimmmuster, Fotos oder andere Daten über die Nutzer sammelt, ist mit Sicherheit ein großer Vorteil einer lokal arbeitenden KI. Ein Nachteil: Die Menge an Daten, die neuronalen Netzen zur Verfügung steht, ist limitiert, so dass diese wohl nicht so genau wie das cloudbasierte Pendant arbeiten.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
- ohne Werbung
- mit ausgeschaltetem Javascript
- mit RSS-Volltext-Feed
Ja, ich habe DeepSpeech von Mozilla ausprobiert, nur meine Wörter kann sie nicht so gut...
Das Problem dabei ist, dass die KI noch zu blöd ist.. "Hans Müller mobil anrufen...