• IT-Karriere:
  • Services:

Machine Learning: Neuronales Netzwerk erkennt Wut in der Stimme

Emotionen in Stimmen zu erkennen, ist für die Forscher von Affectiva durch die wenigen Trainigsdaten nicht leicht. Trotzdem konnten sie ein neuronales Netzwerk trainieren, das verschiedene Sprachen versteht. Das soll für viele Dinge hilfreich sein, etwa für die Erkennung psychologischer Störungen.

Artikel veröffentlicht am ,
Wut ist nicht immer so leicht zu erkennen wie beim unglaublichen Hulk.
Wut ist nicht immer so leicht zu erkennen wie beim unglaublichen Hulk. (Bild: Pixabay.com/CC0 1.0)

Wissenschaflter des Unternehmens Affectiva, einem Ableger von MIT Labs, entwickeln ein neuronales Netzwerk, das Aufregung und Wut in der Stimme erkennt. Es analysiert dazu ein eingegebenes Audiosignal auf Muster, die auf eine Emotion hinweisen. Die Reaktionszeit der Software liegt mit 1,2 Sekunden knapp über der von Menschen, schreiben die Forscher in dem wissenschaftlichen Dokument (PDF). Die Grundlage bildet Soundnet, ein neuronales Netzwerk, das sich auf das Analysieren von Audiosignalen spezialisiert.

Stellenmarkt
  1. Otto Krahn Group GmbH, Hamburg
  2. Waschbär GmbH, Freiburg (Home-Office)

Ein Problem beim Training ihres Netzwerkes ist, dass viele Daten benötigt werden und es relativ wenig Trainingsinformationen dazu gibt, die mit Emotionen bereits markiert sind. Trotzdem konnte das Team innerhalb eines Jahres etwa zwei Millionen Videos als Trainingsbeispiele nutzen. In einem zweiten Schritt haben die Forscher ihr System mit zwölf Stunden markierten audiovisuellen Daten präzisiert.

Das Ergebnis: Ihre Software erkennt Emotionen, unabhängig von der Sprache, der sie zuhört. So konnte das Programm sowohl auf englische Eingaben als auch auf Mandarin angewendet werden. Allerdings ist es dabei etwas weniger präzise. Das würde auch auf Menschen zutreffen, die eine andere Sprache und damit Kultur weniger verstehen als die eigene.

Die Forscher stellen sich viele Anwendungsbeispiele für ihr System vor. "Wut-Klassifizierung hat viele nützliche Anwendungsmöglichkeiten, einschließlich Social-Roboter, interaktive Voice-Response-Systeme (IVR), Marktforschung, Kundeneinschätzungen und Virtual oder Augmented Reality." Andere Unternehmen haben solche Systeme auch dazu genutzt, um aus der Stimmlage von US-Veteranen psychologische Krankheiten wie das posttraumatische Stresssyndrom (PTSD) zu diagnostizieren.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Anzeige
Mobile-Angebote
  1. (u. a. Apple iPhone 11 Pro Max 256GB 6,5 Zoll Super Retina XDR OLED für 929,96€)
  2. 749€
  3. (u. a. Find X2 Neo 256GB 6,5 Zoll für 439,99€, Watch 41 mm Smartwatch für 179,99€)

TarikVaineTree 13. Feb 2019

https://i.imgflip.com/1qzj38.jpg Man mag von den Prequels halten, was man will. Vor...


Folgen Sie uns
       


Viewsonic M2 - Test

Der kleine LED-Projektor eignet sich für Präsentationen und als flexibles Kino für unterwegs.

Viewsonic M2 - Test Video aufrufen
    •  /