Machine Learning: Neuronales Netzwerk erkennt Wut in der Stimme

Emotionen in Stimmen zu erkennen, ist für die Forscher von Affectiva durch die wenigen Trainigsdaten nicht leicht. Trotzdem konnten sie ein neuronales Netzwerk trainieren, das verschiedene Sprachen versteht. Das soll für viele Dinge hilfreich sein, etwa für die Erkennung psychologischer Störungen.

Artikel veröffentlicht am ,
Wut ist nicht immer so leicht zu erkennen wie beim unglaublichen Hulk.
Wut ist nicht immer so leicht zu erkennen wie beim unglaublichen Hulk. (Bild: Pixabay.com/CC0 1.0)

Wissenschaflter des Unternehmens Affectiva, einem Ableger von MIT Labs, entwickeln ein neuronales Netzwerk, das Aufregung und Wut in der Stimme erkennt. Es analysiert dazu ein eingegebenes Audiosignal auf Muster, die auf eine Emotion hinweisen. Die Reaktionszeit der Software liegt mit 1,2 Sekunden knapp über der von Menschen, schreiben die Forscher in dem wissenschaftlichen Dokument (PDF). Die Grundlage bildet Soundnet, ein neuronales Netzwerk, das sich auf das Analysieren von Audiosignalen spezialisiert.

Stellenmarkt
  1. Category Development Manager / Space Planning (w/m/d)
    dm-drogerie markt GmbH + Co. KG, Karlsruhe
  2. Senior Berater Informationssicherheit (gn)
    ESG Elektroniksystem- und Logistik-GmbH, Koblenz
Detailsuche

Ein Problem beim Training ihres Netzwerkes ist, dass viele Daten benötigt werden und es relativ wenig Trainingsinformationen dazu gibt, die mit Emotionen bereits markiert sind. Trotzdem konnte das Team innerhalb eines Jahres etwa zwei Millionen Videos als Trainingsbeispiele nutzen. In einem zweiten Schritt haben die Forscher ihr System mit zwölf Stunden markierten audiovisuellen Daten präzisiert.

Das Ergebnis: Ihre Software erkennt Emotionen, unabhängig von der Sprache, der sie zuhört. So konnte das Programm sowohl auf englische Eingaben als auch auf Mandarin angewendet werden. Allerdings ist es dabei etwas weniger präzise. Das würde auch auf Menschen zutreffen, die eine andere Sprache und damit Kultur weniger verstehen als die eigene.

Die Forscher stellen sich viele Anwendungsbeispiele für ihr System vor. "Wut-Klassifizierung hat viele nützliche Anwendungsmöglichkeiten, einschließlich Social-Roboter, interaktive Voice-Response-Systeme (IVR), Marktforschung, Kundeneinschätzungen und Virtual oder Augmented Reality." Andere Unternehmen haben solche Systeme auch dazu genutzt, um aus der Stimmlage von US-Veteranen psychologische Krankheiten wie das posttraumatische Stresssyndrom (PTSD) zu diagnostizieren.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Georg T.
Wieder Haft gegen Nichtzahler der Rundfunkgebühr

Georg T. sitzt seit 109 Tagen in Haft. Grund dafür sind 1.827 Euro Schulden für die Rundfunkgebühr - seine Haft kostet rund 18.000 Euro.

Georg T.: Wieder Haft gegen Nichtzahler der Rundfunkgebühr
Artikel
  1. MIG: Scheuers Funkloch GmbH hat erst zwei Stellen besetzt
    MIG
    Scheuers Funkloch GmbH hat erst zwei Stellen besetzt

    Der Bundesverkehrsminister scheint kein Personal für die Mobilfunkinfrastrukturgesellschaft zu finden.

  2. Square Enix: Action-Adventure mit den Guardians of the Galaxy angekündigt
    Square Enix
    Action-Adventure mit den Guardians of the Galaxy angekündigt

    E3 2021 Erinnert an Mass Effect, aber mit Humor und Groot: Square Enix will noch 2021 das Solo-Abenteuer Guardians of the Galaxy veröffentlichen.

  3. Bethesda: Starfield mit Rätseln und Doom Eternal mit 120 fps
    Bethesda
    Starfield mit Rätseln und Doom Eternal mit 120 fps

    E3 2021 Der Teaser von Starfield lädt zum Knoblen ein, Redfall bietet Blutsauger - und Doom Eternal erhält das Next-Gen-Grafikupdate.

TarikVaineTree 13. Feb 2019

https://i.imgflip.com/1qzj38.jpg Man mag von den Prequels halten, was man will. Vor...


Folgen Sie uns
       


  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Schnäppchen • Alternate (u. a. MSI Optix 27" WQHD/165 Hz 315,99€ und Fractal Design Vector RS Blackout Dark TG 116,89€) • Corsair Hydro H80i V2 RGB 73,50€ • Apple iPad 10.2 389€ • Razer Book 13 1.158,13€ • Fractal Design Define S2 Black 99,90€ • Intel i9-11900 379€ • EPOS Sennheiser GSP 600 149€ [Werbung]
    •  /