Deep Learning: Algorithmus sagt menschliche Verhaltensweisen voraus

Umarmung oder high-five? Kuss oder Handschlag? Ein Algorithmus soll anhand eines Bildes erkennen, was darauf abgebildete Menschen als Nächstes machen. Er lernte das durch Fernsehgucken.

Artikel veröffentlicht am ,
Marcia Cross (l.) und Felicity Huffman: Was passiert als Nächstes?
Marcia Cross (l.) und Felicity Huffman: Was passiert als Nächstes? (Bild: Mark Mainz/Getty Images)

Zwei Menschen stehen sich gegenüber. Was passiert als Nächstes? Werden sie sich die Hand reichen, abklatschen, umarmen? Forscher des Massachusetts Institute of Technology (MIT) haben einen Deep-Learning-Algorithmus entwickelt, der das vorhersagen soll. Dazu haben sie ihn mit Fernsehserien gefüttert.

Handlungen vorherzusehen, bevor sie passieren, sei ein schwieriges Problem beim Computersehen, schreiben die Forscher um Carl Vondrick. Die Aufgabe sei schwierig, weil sie ein umfangreiches Wissen über die Welt erfordere. Es sei aber schwierig, das aufzuschreiben. "Wir glauben, dass ohne weiteres verfügbare, nicht gekennzeichnete Videos ein gutes Mittel sind, um sich dieses Wissen effizient anzueignen."

Algorithmus schaute 600 Stunden lang Serien

Die Forscher ließen den Algorithmus rund 600 Stunden lang bekannte Fernsehserien analysieren, darunter beispielsweise Big Bang Theory, Desperate Housewives oder The Office. Er lernte, was Händeschütteln, eine Umarmung oder ein Kuss bedeuten und wie es dazu kommt: Welche Interaktion führt dazu, dass zwei Menschen sich umarmen, welche dazu, dass sie abklatschen?

Nach dieser langen Lernphase musste der Algorithmus zeigen, was er draufhat: Die Forscher des Computer Science and Artificial Intelligence Laboratory (Csail) legten ihm ein Einzelbild aus einem Video vor, das er vorher noch nicht gesehen hatte. Daraus sollte er schließen, was als Nächstes passiert.

Der Mensch erkennt besser

Noch ist das Ergebnis nicht sehr überzeugend: In 43 Prozent, also nicht einmal der Hälfte der Fälle, lag der Algorithmus richtig. Zum Vergleich: Ein Mensch sagt eine solche Situation in 71 Prozent der Fälle richtig vorher, eine Gruppe von Menschen sogar in 85 Prozent der Fälle. Aber immerhin ist der MIT-Algorithmus besser als die Konkurrenten, deren Trefferquote bei etwa 36 Prozent liegt.

Ziel des Projekts ist, einen Algorithmus zu entwickeln, der unmittelbar bevorstehende Handlungen erkennen kann. Das soll es beispielsweise Robotern vereinfachen, sich zwischen Menschen zu bewegen und mit ihnen zu interagieren. Eine andere Anwendung wären Kameras, etwa in öffentlichen Plätzen, die erkennen, wenn ein Mensch fällt und dann den Krankenwagen alarmieren.

Vondrick will den Algorithmus auf der International Conference on Computer Vision and Pattern Recognition vorstellen, die derzeit in Las Vegas stattfindet.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


twil 28. Jun 2016

wir glauben an einen freien Willen.

omtr 28. Jun 2016

you made my day :D

ha00x7 28. Jun 2016

Dachte ich mir auch. Als dann auch noch "the big bang theory" als Serie genannt wurde...

Milber 27. Jun 2016

Als ich Prinzeumel gelesen hatte wusste ich sofort, das was jetzt kommt ist gespickt mit...



Aktuell auf der Startseite von Golem.de
Whistleblower
USA sollen intaktes außerirdisches Fluggerät besitzen

Klingt schräg, aber der Whistleblower ist ungewöhnlich glaubwürdig: Die USA sollen mehrere außerirdische Fluggeräte haben.

Whistleblower: USA sollen intaktes außerirdisches Fluggerät besitzen
Artikel
  1. Landkreis Lüneburg: Telekom pausiert Sendemastbau nach Protesten zeitweise
    Landkreis Lüneburg
    Telekom pausiert Sendemastbau nach Protesten zeitweise

    Deutsch Evern will nicht mit einer Antenne von Deutsche Funkturm versorgt werden. Die Telekom hat das Anliegen der Anwohner geprüft und baut nun weiter.

  2. Game Porting Toolkit: Wie Apple Windows-Spiele auf MacOS bringen will
    Game Porting Toolkit
    Wie Apple Windows-Spiele auf MacOS bringen will

    Wenige Stunden nach Bereitstellung der Werkzeuge laufen Diablo 4 und Cyberpunk auf MacOS. Apple zeigt, dass Ports schneller gehen könnten, als viele erwarten.
    Von Sebastian Grüner

  3. Freelancer in der IT: Schön, lukrativ, aber alles andere als easy
    Freelancer in der IT
    Schön, lukrativ, aber alles andere als easy

    Viele junge Entwickler wollen lieber Freelancer sein als angestellt. Doch das hat mehr Haken, als man denkt. Wir haben Tipps für den Einstieg.
    Ein Ratgebertext von Rene Koch

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    • Daily Deals • Samsung SSD 8TB 368,99€ • MindStar: Gigabyte RTX 4090 1.599€, Crucial 4TB 169€ • Acer Curved 31,5" WQHD 165Hz 259€ • PS5-Spiele & Zubehör bis -75% • Samsung 990 Pro 1TB (PS5) 94€ • Chromebooks bis 32% günstiger • Bis 50% auf Gaming-Produkte bei NBB • PS5 mit Spiel 549€ [Werbung]
    •  /