IBM Dif: Eine Million Bilder für gleichberechtigte Gesichtserkennung
Es ist nicht lange her, dass IBMs Gesichtserkennung schwach bei der Erkennung von Hautfarben und Geschlecht war. Der Datensatz Diversity in Faces soll das ändern. Er steht auch anderen Forschern auf Anfrage zur Verfügung.

In der momentan recht kontroversen Diskussion um Gesichtserkennung hat IBM einen Datensatz veröffentlicht, der eine Million verschiedene Gesichter enthält. Das Set nennen die Entwickler Diversity in Faces (Dif). Es konzentriert sich auf eine ethnisch und geschlechtlich möglichst gleichmäßig verteilte Sammlung von Gesichtern verschiedenen Alters. Diese können Ersteller und Forscher von Gesichtserkennungssoftware zum Trainieren ihrer Modelle nutzen, wie IBM im Blog-Post schreibt.
Die Sammlung besteht aus öffentlich zugänglichen Bildern, die unter der YFCC100M-Creative-Commons-Lizenz stehen. Sie können auf Anfrage bei IBM angefordert werden. Erste eigene Tests seien positiv, berichtet das Unternehmen: "Dif schafft eine besser ausbalancierte Verteilung und eine weiterreichende Abdeckung von Gesichtern im Vergleich zu vorherigen Datensätzen". Zudem sind sie in zehn verschiedenen und in der Wissenschaft üblichen Code-Schemata abrufbar, nach denen Software Merkmale untersucht. Diese beinhalten etwa Messwerte verschiedener Gesichtspunkte.
IBM macht Fortschritte im Vergleich zu 2017
IBM fügt neben Parametern wie der Hautfarbe, dem Alter und dem Geschlecht viele verschiedene Messpunkte ein, darunter Gesichtssymmetrie, Kontraste, die Position des Gesichtes, die Länge und Breite eines Gesichtes. Es hat sich in der Vergangenheit nämlich gezeigt, dass bisherige Ansätze nicht zum gewünschten Ziel führten. Die neuen Parameter sollen die Genauigkeit einer Gesichtserkennung verbessern.
Dass vorurteilsbehaftete Gesichtserkennungsalgorithmen ein reales Problem sind, hat eine Studie des MIT gezeigt. Gerade das bereits produktiv genutzte System von Amazon hat große Schwierigkeiten bei de Identifizierung von Ethnie und Geschlecht. So werden etwa 19 Prozent der hellhäutigen Frauen für Männer gehalten. Bei dunkelhäutigen Frauen liegt die Fehlerquote gar bei 31 Prozent. Im Jahr 2017 war IBM selbst betroffen: Dessen Gesichtserkennung konnte damals ebenfalls schlecht zwischen Gesichtern unterscheiden. 2018 hatte das Unternehmen schon Verbesserungen vorgenommen. Ein entsprechender Datensatz könnte diesen Prozess noch beschleunigen.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
- ohne Werbung
- mit ausgeschaltetem Javascript
- mit RSS-Volltext-Feed
Entschuldigen Sie bitte, aber das ist Unsinn. Zunächst: Die Annotationen in der Bilder...
Problem 1: Man darf sich selbst darum kümmern, ob die Bilder, die die URL-LISTE (etwas...
Ich denke da missverstehst du absichtlich was ich geschrieben habe. Es gibt schon Gründe...
Schön, dass du das hier an dieser Stelle einfach mal los werden konntest. ...