Microsoft: Azure bekommt eine beeindruckend beängstigende Video-API

Der Video-Indexer der Azure-Cloud erkennt Szenen, Personen, Sprache und Stimmungen in Videos und kann sogar übersetzen. Diese hilfreichen Funktionen demonstriert Microsoft aber ausgerechnet mit Überwachungstechnik.

Artikel veröffentlicht am ,
Mit Microsofts Video Indexer wird das Überwachen sehr einfach.
Mit Microsofts Video Indexer wird das Überwachen sehr einfach. (Bild: Microsoft - Screenshot Golem.de)

Die maschinelle Videoanalyse ist wohl derzeit eine der schwierigsten Aufgaben künstlicher Intelligenz, denn sie vereint Bild-, Sprach-, Texterkennung sowie einige weitere Funktionen, muss dabei aber auch noch einen langen Zeitraum auswerten. Rund zwei Monate nach Googles Ankündigung des Cloud Video Intelligence API stellt nun auch Microsoft mit dem Video Indexer für Azure eine Vorschau auf solch einen Dienst bereit.

Der Video Indexer funktioniert dabei wie viele andere Cloud-Dienste auch: Ist eine Datei gegeben, hier ein Video, wird diese auf unterschiedliche Merkmale hin untersucht. Die Ergebnisse können dann in Azure über eine GUI angesehen oder über ein API per JSON ausgelesen und weiterverarbeitet werden. Interessant an dem Video Indexer ist wohl vor allem die Fülle an Funktionen des Dienstes.

So können einzelne Szenen erkannt werden, Keyframes lassen sich extrahieren und das Video anhand der erkannten Objekte auch annotieren. Darüber hinaus erkennt das System Gesichter und Bewegungen, kann Gesprochenes den Sprechern zuordnen, dieses dann transkribieren und übersetzen. Selbst dargestellter Text kann einem Video entlockt werden. Darauf aufbauend ermöglicht der Azure-Dienst dann eine Sentiment-Analyse, um positive oder negative Stimmungen in dem Video zu erkennen.

Schwierige Grenzüberschreitungen

Zusammen haben all diese Funktionen sicher viele sinnvolle Anwendungsgebiete. So können etwa die Produzenten von Videos ihr Material sehr schnell nach passenden Inhalten durchsuchen und diese etwa danach auswählen, was auf eine bestimmte Zielgruppe passt. Genau das macht das Unternehmen Ooyala, das Microsoft als Referenz für seinen Dienst nennt.

Auf der Keynote der Build-Konferenz hat Microsoft aber auch eine eher beängstigende Demonstration davon gezeigt, wozu dieses System noch fähig sein könnte: etwa die Totalüberwachung von Mitarbeitern. In dem konkreten Fall zeigt das Unternehmen zwar die Verletzung einer Arbeitsschutzrichtlinie, was durchaus im Sinne der Beteiligten sein sollte. Allerdings ist diese Art der Analyse von Videodaten, zum Beispiel über eine Überwachungskamera, natürlich nicht auf legitime Anwendungsfälle beschränkt.

Microsoft-Chef Satya Nadella sagte zu dem möglichen Missbrauchspotenzial: "Es liegt an uns, dafür zu sorgen, dass einige dieser dystopischen Szenarien nicht wahr werden. Ich meine, wenn Sie darüber nachdenken, was Orwell in 1984 prophezeite, wo Technik genutzt wird, um zu überwachen, zu kontrollieren, zu diktieren. Oder was Huxley sich vorgestellt hat, was wir machen werden, um uns ohne Sinn und Zweck abzulenken. Keine dieser Zukunftsvisionen ist eine, die wir wollen".

Nachtrag vom 11. Mai 2017, 15:40 Uhr

Wir haben die Nachricht um eine Erklärung von Nadella aus der Keynote ergänzt.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


Ach 12. Mai 2017

Ich weis nicht von was für einem "Bash" du da die Rede hast. Da dokumentiert Golem nur...

Suchiman 12. Mai 2017

https://channel9.msdn.com/Events/Build/2017/KEY01 startet bei Minute 30

Kasjsf38 12. Mai 2017

Korrekt. Alle Parteien sind liberal, demokratisch (dort wo der Bürger nichts zu melden...

Potrimpo 12. Mai 2017

Nein, er wollte sagen und hat es gesagt, dass die Menschheit (nicht Microsoft, nix...



Aktuell auf der Startseite von Golem.de
Magnetohydrodynamischer Antrieb
US-Militär lässt lautlosen U-Boot-Antrieb entwickeln

Bislang war magnetohydrodynamischer Antrieb der Fiktion vorbehalten. Dank Fortschritten in der Akku- und Fusionstechnik soll sich das ändern.

Magnetohydrodynamischer Antrieb: US-Militär lässt lautlosen U-Boot-Antrieb entwickeln
Artikel
  1. KI-Bildgenerator: Diese Kamera generiert, statt zu fotografieren
    KI-Bildgenerator
    Diese Kamera generiert, statt zu fotografieren

    Ein Bastler hat eine KI-Kamera ohne Objektiv gebaut. Paragraphica erzeugt Schnappschüsse mit einem Raspberry Pi und Stable Diffusion.

  2. Disney und Videostreaming: Über 100 Eigenproduktionen aus Abo von Disney+ entfernt
    Disney und Videostreaming
    Über 100 Eigenproduktionen aus Abo von Disney+ entfernt

    Eigentlich wollte Disney nur etwas mehr als 50 Eigenproduktionen aus Disney+ verschwinden lassen. Nun fehlen deutlich mehr Filme und Serien.

  3. Seekabel: Colt bietet eine europäische Verbindung in die USA
    Seekabel
    Colt bietet eine europäische Verbindung in die USA

    Colt bringt eine neue Seekabelverbindung von Europa in die USA, die stärker in europäischer Hand ist. Statt in New York landet man in New Jersey. Doch Google und Facebook sind dabei.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    • Daily Deals • Roccat bis -50% • AVM Modems & Repeater bis -36% • MindStar: 13 Grafikkarten im Sale • Logitech G Pro Wireless Maus 89€ • The A500 Mini 74,99€ • Logitech G213 Prodigy Tastatur 49,90€ • Crucial P5 Plus (PS5-komp.) 1TB 71,99€, 2TB 133,99€ [Werbung]
    •  /