Zum Hauptinhalt Zur Navigation

IBM Dif: Eine Million Bilder für gleichberechtigte Gesichtserkennung

Es ist nicht lange her, dass IBMs Gesichtserkennung schwach bei der Erkennung von Hautfarben und Geschlecht war. Der Datensatz Diversity in Faces soll das ändern. Er steht auch anderen Forschern auf Anfrage zur Verfügung.
/ Oliver Nickel
14 Kommentare News folgen (öffnet im neuen Fenster)
Mithilfe von IBMs Bildersammlung soll Gesichtserkennung Ethnien besser einordnen können. (Bild: Pixabay.com/Montage: Golem.de)
Mithilfe von IBMs Bildersammlung soll Gesichtserkennung Ethnien besser einordnen können. Bild: Pixabay.com/Montage: Golem.de

In der momentan recht kontroversen Diskussion um Gesichtserkennung hat IBM einen Datensatz(öffnet im neuen Fenster) veröffentlicht, der eine Million verschiedene Gesichter enthält. Das Set nennen die Entwickler Diversity in Faces (Dif). Es konzentriert sich auf eine ethnisch und geschlechtlich möglichst gleichmäßig verteilte Sammlung von Gesichtern verschiedenen Alters. Diese können Ersteller und Forscher von Gesichtserkennungssoftware zum Trainieren ihrer Modelle nutzen, wie IBM im Blog-Post(öffnet im neuen Fenster) schreibt.

Die Sammlung besteht aus öffentlich zugänglichen Bildern, die unter der YFCC100M-Creative-Commons-Lizenz stehen. Sie können auf Anfrage bei IBM angefordert werden. Erste eigene Tests seien positiv, berichtet das Unternehmen: "Dif schafft eine besser ausbalancierte Verteilung und eine weiterreichende Abdeckung von Gesichtern im Vergleich zu vorherigen Datensätzen" . Zudem sind sie in zehn verschiedenen und in der Wissenschaft üblichen Code-Schemata abrufbar, nach denen Software Merkmale untersucht. Diese beinhalten etwa Messwerte verschiedener Gesichtspunkte.

IBM erklärt Bilderdatensatz Diversity in Faces
IBM erklärt Bilderdatensatz Diversity in Faces (00:23)

IBM macht Fortschritte im Vergleich zu 2017

IBM fügt neben Parametern wie der Hautfarbe, dem Alter und dem Geschlecht viele verschiedene Messpunkte ein, darunter Gesichtssymmetrie, Kontraste, die Position des Gesichtes, die Länge und Breite eines Gesichtes. Es hat sich in der Vergangenheit nämlich gezeigt, dass bisherige Ansätze nicht zum gewünschten Ziel führten. Die neuen Parameter sollen die Genauigkeit einer Gesichtserkennung verbessern.

Dass vorurteilsbehaftete Gesichtserkennungsalgorithmen ein reales Problem sind, hat eine Studie des MIT gezeigt. Gerade das bereits produktiv genutzte System von Amazon hat große Schwierigkeiten bei de Identifizierung von Ethnie und Geschlecht . So werden etwa 19 Prozent der hellhäutigen Frauen für Männer gehalten. Bei dunkelhäutigen Frauen liegt die Fehlerquote gar bei 31 Prozent. Im Jahr 2017 war IBM selbst betroffen : Dessen Gesichtserkennung konnte damals ebenfalls schlecht zwischen Gesichtern unterscheiden. 2018 hatte das Unternehmen schon Verbesserungen vorgenommen. Ein entsprechender Datensatz könnte diesen Prozess noch beschleunigen.


Relevante Themen