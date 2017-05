Die maschinelle Videoanalyse ist wohl derzeit eine der schwierigsten Aufgaben künstlicher Intelligenz, denn sie vereint Bild-, Sprach-, Texterkennung sowie einige weitere Funktionen, muss dabei aber auch noch einen langen Zeitraum auswerten. Rund zwei Monate nach Googles Ankündigung des Cloud Video Intelligence API stellt nun auch Microsoft mit dem Video Indexer für Azure eine Vorschau auf solch einen Dienst bereit.

Der Video Indexer funktioniert dabei wie viele andere Cloud-Dienste auch: Ist eine Datei gegeben, hier ein Video, wird diese auf unterschiedliche Merkmale hin untersucht. Die Ergebnisse können dann in Azure über eine GUI angesehen oder über ein API per JSON ausgelesen und weiterverarbeitet werden. Interessant an dem Video Indexer ist wohl vor allem die Fülle an Funktionen des Dienstes.

So können einzelne Szenen erkannt werden, Keyframes lassen sich extrahieren und das Video anhand der erkannten Objekte auch annotieren. Darüber hinaus erkennt das System Gesichter und Bewegungen, kann Gesprochenes den Sprechern zuordnen, dieses dann transkribieren und übersetzen. Selbst dargestellter Text kann einem Video entlockt werden. Darauf aufbauend ermöglicht der Azure-Dienst dann eine Sentiment-Analyse, um positive oder negative Stimmungen in dem Video zu erkennen.

Schwierige Grenzüberschreitungen

Zusammen haben all diese Funktionen sicher viele sinnvolle Anwendungsgebiete. So können etwa die Produzenten von Videos ihr Material sehr schnell nach passenden Inhalten durchsuchen und diese etwa danach auswählen, was auf eine bestimmte Zielgruppe passt. Genau das macht das Unternehmen Ooyala, das Microsoft als Referenz für seinen Dienst nennt.

Auf der Keynote der Build-Konferenz hat Microsoft aber auch eine eher beängstigende Demonstration davon gezeigt, wozu dieses System noch fähig sein könnte: etwa die Totalüberwachung von Mitarbeitern. In dem konkreten Fall zeigt das Unternehmen zwar die Verletzung einer Arbeitsschutzrichtlinie, was durchaus im Sinne der Beteiligten sein sollte. Allerdings ist diese Art der Analyse von Videodaten, zum Beispiel über eine Überwachungskamera, natürlich nicht auf legitime Anwendungsfälle beschränkt.

Microsoft-Chef Satya Nadella sagte zu dem möglichen Missbrauchspotenzial: "Es liegt an uns, dafür zu sorgen, dass einige dieser dystopischen Szenarien nicht wahr werden. Ich meine, wenn Sie darüber nachdenken, was Orwell in 1984 prophezeite, wo Technik genutzt wird, um zu überwachen, zu kontrollieren, zu diktieren. Oder was Huxley sich vorgestellt hat, was wir machen werden, um uns ohne Sinn und Zweck abzulenken. Keine dieser Zukunftsvisionen ist eine, die wir wollen".

Nachtrag vom 11. Mai 2017, 15:40 Uhr

Wir haben die Nachricht um eine Erklärung von Nadella aus der Keynote ergänzt.