Siemens: Digitale Gesichter von der Stange

Diane verleiht Avataren Intelligenz

In Zukunft sollen Avatare den Surfer durch das Internet lotsen. Diese digitalen Gefährten können künftig etwa Hilfestellung beim Einkauf im Netz geben. Aber auch in der neuen Mobilfunkwelt des UMTS-Standards sollen Avatare interaktiven Diensten auf dem Handy-Display etwas Menschlichkeit verleihen.

Artikel veröffentlicht am ,

Der MPEG-4 Standard bietet die Möglichkeit, Multimediadaten wie Video, Audio, Fotos oder sogar dreidimensionale Bilder sehr effizient in heutigen Kommunikationsnetzen zu übertragen. Damit ist eine Voraussetzung für den breiten Einsatz von Avataren geschaffen. Bisher waren die Kunstfiguren meist Teil von nicht standardisierten Computerprogrammen, die zum Austausch zwischen Rechnern die gleiche Software erforderten. Forscher von Siemens in München haben jetzt den Standard des MPEG4-Datenformats verwendet und mehrere Avatare geschaffen.

Die Wissenschaftler tasteten die Gesichter von Testpersonen mit Laserstrahlen ab und schufen dreidimensionale Köpfe im Computer. Dazu erstellten sie aus den Daten ein digitales Drahtmodell, in dem die Hautoberfläche mit kleinen Dreiecken flächenfüllend hinterlegt ist. Zum Bewegen des künstlichen Kopfes verzerrt das Programm einige der Dreiecke an bestimmten Gitterpunkten, was Gesichtsausdrücke wie Freude, Zorn, Überraschung oder Traurigkeit ermöglicht. Die Mimik wird dann mit Sprache verknüpft. Dafür wandelt der Rechner geschriebene Silben in Laute um und erzeugt passende Lippenbewegungen. Die Köpfe im Computer können mit der Maus in alle Richtungen gedreht werden, während sie einprogrammierte Sätze sagen oder ihre Gesichtsausdrücke vorführen.

In einer Demonstration haben die Forscher auf eine interne Webseite einen weiblichen Avatar gestellt. Auf einen Mausklick liest die digitale Frau die Beschreibung von Handys oder Festnetztelefonen vor. Eine denkbare Anwendung ist auch ein Assistent für Webformulare. Der Avatar erklärt dann, welche Daten in bestimmte Felder eingetragen werden müssen. Die Wissenschaftler arbeiten derzeit daran, ihre Animationen auch direkt auf digitale Portraits anzuwenden, was einen raschen Einsatz in Handys ermöglichen würde. Dreidimensionale Gesichter erfordern nämlich zu viel Rechenkapazität und verbrauchen dadurch kostbare Akkuzeit. Die komplette Ansteuerung der Avatare wäre schon auf heutigen GSM-Handys möglich: Die Bewegungen werden mit nur 84 Gitterpunkten erzeugt; dafür reicht bereits eine Datenrate von vier Kilobit pro Sekunde.

Damit künftige Avatare nicht nur vom Anblick her menschlich wirken, sondern auch halbwegs menschlich handeln, muss das zu Grunde liegende Sprachprogramm eine gehörige Portion Computerintelligenz in sich vereinen. Forscher von Siemens haben eine Dialog-Software geschrieben, die bereits heute Buchungen im Internet oder Anrufe bei automatisierten Call-Centern bedeutend einfacher gestalten könnte. So schreckt es viele Kunden ab, wenn ihnen eine freundliche Computerstimme bei einem Serviceanruf eine lange Liste mit Optionen erzählt, die durch Drücken von Ziffern auf der Tastatur angewählt werden können. Auch auf Internetseiten ist es oft mühsam, sich durch das Angebot durchzuklicken, da selten exakt erkennbar ist, welches Produkt sich hinter dem Link verbirgt. Und bei Bestellungen muss der Kunde einem vorher festgelegten Schema folgen.

Diane ist dagegen flexibel: Der Anwender nennt dem Programm seine Wünsche, etwa: "Ich möchte am Samstagvormittag mit dem ICE nach Berlin fahren". Die Software der Münchner Wissenschaftler erkennt die genannten Parameter und fragt die fehlenden ab, bis die Angaben vollständig sind. Dadurch spielt die Reihenfolge der Eingabe keine Rolle. Das Prinzip funktioniert auch beim Aktienkauf oder bei Bankgeschäften. Andere Unternehmen haben schon ähnliche Lösungen entwickelt.

Der Clou der Siemens-Software ist aber, dass mit einem integrierten Design-Werkzeug neue Anwendungen in wenigen Stunden programmiert werden können. Möglich wird so auch eine sprachgesteuerte Wartungshilfe in Fabriken, bei der ein Mechaniker vor einer kaputten Maschine steht und sich mit Diane Informationen aus dem Handbuch auf einen Handheld-Computer holen kann.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Aktuell auf der Startseite von Golem.de
Custom Keyboard
Youtuber baut riesige Tastatur für 13.500 Euro

Die Switches haben das 64-fache Volumen und das Gehäuse ist menschenhoch: Ein Youtuber baut eine absurd große Tastatur für absurd viel Geld.

Custom Keyboard: Youtuber baut riesige Tastatur für 13.500 Euro
Artikel
  1. Super Nintendo: Fan bringt verbessertes Zelda 3 für Windows, MacOS und Linux
    Super Nintendo
    Fan bringt verbessertes Zelda 3 für Windows, MacOS und Linux

    Aus 80.000 Zeilen C-Code besteht die per Reverse Engineering generierte Version von Zelda 3. Die bringt einige Verbesserungen und 16:9.

  2. Twitter: Der blaue Haken bringt Musk nur wenig Geld
    Twitter
    Der blaue Haken bringt Musk nur wenig Geld

    Weltweit hat Twitter angeblich schon einige Hunderttausend zahlende Nutzer. Das dürfte die Finanzprobleme aber nur wenig mildern.

  3. Linux: Alte Computer zu neuem Leben erwecken
    Linux
    Alte Computer zu neuem Leben erwecken

    Computer sind schon nach wenigen Jahren Nutzungsdauer veraltet. Doch mit den schlanken Linux-Distributionen AntiX-Linux, Q4OS oder Simply Linux erleben ältere PC-Systeme einen zweiten Frühling.
    Von Erik Bärwaldt

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • DAMN-Deals: AMD CPUs zu Tiefstpreisen (u. a. R7 5800X3D 324€)• MindStar: Zotac RTX 4070 Ti 949€, XFX RX 6800 519€ • WSV-Finale bei MediaMarkt (u. a. Samsung 980 Pro 2 TB Heatsink 199,99€) • RAM im Preisrutsch • Powercolor RX 7900 XTX 1.195€ • PCGH Cyber Week nur noch kurze Zeit [Werbung]
    •  /