Original-URL des Artikels: https://www.golem.de/news/sehen-wie-menschen-netflix-bringt-maschinen-das-videogucken-bei-1606-121345.html    Veröffentlicht: 07.06.2016 12:56    Kurz-URL: https://glm.io/121345

Sehen wie Menschen

Netflix bringt Maschinen das Videogucken bei

Für eine möglichst gute Bildqualität lässt Netflix unterschiedlich codierte Videos von Maschinen überprüfen. Die Modelle dafür sind auf menschliche Wahrnehmung trainiert und die Technik stellt das Unternehmen nun auch für andere frei zur Verfügung.

"Wir sorgen uns um Videoqualität", schreibt des Videostreamingunternehmen Netflix in seinem Techblog. Mehr noch interessiere sich das Unternehmen aber dafür, die Qualität der Videos in seiner stark skalierten Infrastruktur exakt messen zu können. Für Letzteres ist mit Video Multi-Method Assessment Fusion (VMAF) ein neuer Algorithmus entstanden, dessen Implementierung mit einigen Werkzeugen und zahlreichen Testdaten nun frei zur Verfügung steht. Netflix nutzt dies, um seinen Nutzer möglichst gutaussehende Videos zeigen zu können.

Maschinen, die wie Menschen sehen

Statt sich auf die bisher üblichen und eher technischen Verfahren PSNR oder SSIM zur Beurteilung der Videoqualität zu konzentrieren, hat das Unternehmen zunächst Menschen gebeten, eine Vielzahl unterschiedlich codierter und veränderter Videos zu beurteilen. Eine Untersuchung von Netflix zeigt, dass sich die menschliche Wahrnehmung häufig von PSNR- und SSIM-Werten unterscheidet und dies auch noch abhängig vom eigentlichen Bild ist. So werden etwa Computeranimationen und klassische Fernsehserien klar voneinander abweichend bewertet.

Da die traditionellen Methoden also nicht für Netflix geeignet seien, habe sich das Unternehmen dafür entschieden, auf maschinelles Lernen zurückzugreifen. Gemeinsam mit einer Forschungsgruppe der University of Southern California habe das Unternehmen schrittweise verschiedene Metriken und Funktionen für ein Modell getestet und letztlich mehrere dieser zu VMAF zusammengefasst.

Das so entstandene Modell repräsentiere die menschliche Wahrnehmung von Videos wesentlich besser als bisher. Dazu sei das Modell mit den menschlichen Beurteilungen trainiert und anschließend an anderen Daten getestet worden. VMAF wird nun dazu genutzt, die subjektiv empfundene Qualität eines Videos vorherzusagen, um Nutzern damit ein möglichst optimales Angebot bereitstellen zu können.

Modell soll weiter ausgebaut werden

Netflix plant bereits, das Modell deutlich zu erweitern. So sollen weitere Faktoren wie die Displaygröße des Geräts beim Anschauen eines Videos ebenso wie der Abstand zum Bildschirm mit in die Beurteilung der Videoqualität aufgenommen werden. Außerdem sollen nicht nur Einzelbilder, sondern sogar ganze Szenen betrachtet werden.

Das Unternehmen stellt die verwendete Technik als VMAF Development Kit (VDK) unter der Apache-2.0-Lizenz auf Github bereit. Der rechenintensive Teil ist für größere Effizienz in C geschrieben, für den Steuerungscode wird Python genutzt. Zur Verbesserung der Technik sollen auch explizit Beiträge von externen Entwicklern aufgenommen werden.  (sg)


Verwandte Artikel:
HDMI 2.0 und Displayport: HDR bleibt Handarbeit   
(26.02.2018, https://glm.io/132884 )
Sky Go: Neue Version der Streaming-App erschienen   
(06.03.2018, https://glm.io/133144 )
Videostreaming: Netflix-App erlaubt Einstellung der Videoqualität   
(09.05.2016, https://glm.io/120776 )
Microsoft: KI-Framework kommt auf Windows-10-Endgeräte   
(08.03.2018, https://glm.io/133217 )
Bilderkennung: Roboter löst Rubik's Cube in 380 Millisekunden   
(08.03.2018, https://glm.io/133228 )

© 1997–2019 Golem.de, https://www.golem.de/