Abo
  • Services:

Everybody Dance Now: KI lässt Laien wie Profitänzer aussehen

Nicht nur ein Ohrwurm aus den 90ern: Everybody Dance Now ist eine KI, die Posen von Tänzern auf beliebige Menschen überträgt und daraus einen Videoclip erstellt. Die Forscher nutzen je ein neuronales Netzwerk für Gesicht und Körper. Die Ergebnisse sind vielversprechend, wenn auch nicht perfekt.

Artikel veröffentlicht am ,
Nein, diese Frau kann eigentlich nicht Ballett tanzen.
Nein, diese Frau kann eigentlich nicht Ballett tanzen. (Bild: UC Berkeley)

Forscher haben ein neuronales Netzwerk ermittelt, das Körperbewegungen einer Person imitiert und diese auf den Körper einer anderen Person überträgt. Das Projekt Everybody Dance Now zeigt dieses Verhalten durch verschiedene Tanzeinlagen. Mit dem trainierten Modell ist es demnach möglich, ungeübte Tänzer wie Ballettkünstler oder Robodancer aussehen zu lassen. Ein Youtube-Video zeigt erste interessante, wenn auch nicht perfekte Ergebnisse.

Stellenmarkt
  1. umwerk systems GmbH, Rosenheim
  2. DGUV - Deutsche gesetzliche Unfallversicherung, Sankt Augustin

Die Gründer des Projekts sind vier Forscher der Califonia University in Berkley. Sie erklären in ihrem wissenschaftlichen Dokument ihren Ansatz: Anhand von Gelenkpunkten und dem generierten Skelett können Bewegungen einer Person analysiert und auf andere Personen übertragen werden, auch wenn deren Positionen und Körperbau nicht genau übereinstimmen. Aus einem Quellvideo wird dabei Bild für Bild ein Tupel aus dem Körper der Person und des dazugehörigen Skeletts erstellt. Dieses nutzt das neuronale Netzwerk, um den Körper der Zielperson zu simulieren.

Separates neuronales Netz für das Gesicht

Dabei setzen die Forscher ein zweites neuronales Netzwerk ein, das die ausgegebenen Bilder überprüft und auf ihre Authentizität überprüft. Diese sich selbst prüfenden Generative Adversial Networks (GANs) sind eine gern genutzte Methode im Trainieren von Machine-Learning-Systemen. Um eine möglichst flüssige Bewegung zu erreichen, ist jedes generierte Bild an den Frame davor gekoppelt. Außerdem wird für die Darstellung des Gesichts ein separates GAN verwendet, welches nur Gesichtsbewegungen imitiert und diese auf das Gesicht der Zielperson aufsetzt.

Ähnliche Technik wurde bereits mit der Software Fakeapp realisiert, mit der Schauspieler in Politiker verwandelt werden. Der Ansatz, ein abstraktes Animationsskelett zu verwenden, erinnert hingegen an Googles Posenet. Wahrscheinlich nutzen die Forscher dieses Paket für ihr Projekt. Schließlich ist es im viel genutzten Tensor Flow integriert.



Anzeige
Spiele-Angebote
  1. (-15%) 16,99€
  2. 39,99€ (Release 14.11.)
  3. (-75%) 7,49€
  4. 49,95€

MickeyKay 04. Sep 2018

Nicht wirklich. Ich konstruiere mal ein Beispiel: Stell dir vor, du und dein Partner...

TarikVaineTree 29. Aug 2018

Wirklich verblüffend ...

Bouncy 28. Aug 2018

...wer von denen jetzt eigentlich wirklich tanzen kann und wer nur einen Stromschlag...

Mixermachine 28. Aug 2018

Wer es nicht kennt: https://knowyourmeme.com/memes/needs-more-jpeg?full=1

AveN 27. Aug 2018

Ich sehe da vergleichbare Fehler, die sind nur schwieriger zu erkennen, weil die...


Folgen Sie uns
       


V-Rally 4 - Golem.de live

Michael schaut sich die PC-Version von V-Rally 4 an, die in einigen Punkten deutlich besser ist als die Konsolenfassung.

V-Rally 4 - Golem.de live Video aufrufen
NGT Cargo: Der Güterzug der Zukunft fährt 400 km/h
NGT Cargo
Der Güterzug der Zukunft fährt 400 km/h

Güterzüge sind lange, laute Gebilde, die langsam durch die Lande zuckeln. Das soll sich ändern: Das DLR hat ein Konzept für einen automatisiert fahrenden Hochgeschwindigkeitsgüterzug entwickelt, der schneller ist als der schnellste ICE.
Ein Bericht von Werner Pluta


    Flexibles Smartphone: Samsung verspielt die Smartphone-Führung
    Flexibles Smartphone
    Samsung verspielt die Smartphone-Führung

    Jahrelang dominierte Samsung den Smartphone-Markt mit Innovationen, in den vergangenen Monaten verliert der südkoreanische Hersteller aber das Momentum. Krönung dieser Entwicklung ist das neue flexible Nicht-Smartphone - die Konkurrenz aus China dürfte feiern.
    Eine Analyse von Tobias Költzsch

    1. Flexibles Display Samsungs faltbares Smartphone soll im März 2019 erscheinen
    2. Samsung Linux-on-Dex startet in privater Beta
    3. Infinity Flex Samsung zeigt statt Smartphone nur faltbares Display

    Serverless Computing: Mehr Zeit für den Code
    Serverless Computing
    Mehr Zeit für den Code

    Weniger Verwaltungsaufwand und mehr Automatisierung: Viele Entwickler bauen auf fertige Komponenten aus der Cloud, um die eigenen Anwendungen aufzubauen. Beim Serverless Computing verschwinden die benötigten Server unter einer dicken Abstraktionsschicht, was mehr Zeit für den eigenen Code lässt.
    Von Valentin Höbel

    1. Kubernetes Cloud Discovery inventarisiert vergessene Cloud-Native-Apps
    2. T-Systems Deutsche Telekom will Cloud-Firmen kaufen
    3. Trotz hoher Gewinne Wieder Stellenabbau bei Microsoft

      •  /