IBM Dif: Eine Million Bilder für gleichberechtigte Gesichtserkennung

Es ist nicht lange her, dass IBMs Gesichtserkennung schwach bei der Erkennung von Hautfarben und Geschlecht war. Der Datensatz Diversity in Faces soll das ändern. Er steht auch anderen Forschern auf Anfrage zur Verfügung.

Artikel veröffentlicht am ,
Mithilfe von IBMs Bildersammlung soll Gesichtserkennung Ethnien besser einordnen können.
Mithilfe von IBMs Bildersammlung soll Gesichtserkennung Ethnien besser einordnen können. (Bild: Pixabay.com/Montage: Golem.de)

In der momentan recht kontroversen Diskussion um Gesichtserkennung hat IBM einen Datensatz veröffentlicht, der eine Million verschiedene Gesichter enthält. Das Set nennen die Entwickler Diversity in Faces (Dif). Es konzentriert sich auf eine ethnisch und geschlechtlich möglichst gleichmäßig verteilte Sammlung von Gesichtern verschiedenen Alters. Diese können Ersteller und Forscher von Gesichtserkennungssoftware zum Trainieren ihrer Modelle nutzen, wie IBM im Blog-Post schreibt.

Die Sammlung besteht aus öffentlich zugänglichen Bildern, die unter der YFCC100M-Creative-Commons-Lizenz stehen. Sie können auf Anfrage bei IBM angefordert werden. Erste eigene Tests seien positiv, berichtet das Unternehmen: "Dif schafft eine besser ausbalancierte Verteilung und eine weiterreichende Abdeckung von Gesichtern im Vergleich zu vorherigen Datensätzen". Zudem sind sie in zehn verschiedenen und in der Wissenschaft üblichen Code-Schemata abrufbar, nach denen Software Merkmale untersucht. Diese beinhalten etwa Messwerte verschiedener Gesichtspunkte.

IBM macht Fortschritte im Vergleich zu 2017

IBM fügt neben Parametern wie der Hautfarbe, dem Alter und dem Geschlecht viele verschiedene Messpunkte ein, darunter Gesichtssymmetrie, Kontraste, die Position des Gesichtes, die Länge und Breite eines Gesichtes. Es hat sich in der Vergangenheit nämlich gezeigt, dass bisherige Ansätze nicht zum gewünschten Ziel führten. Die neuen Parameter sollen die Genauigkeit einer Gesichtserkennung verbessern.

Dass vorurteilsbehaftete Gesichtserkennungsalgorithmen ein reales Problem sind, hat eine Studie des MIT gezeigt. Gerade das bereits produktiv genutzte System von Amazon hat große Schwierigkeiten bei de Identifizierung von Ethnie und Geschlecht. So werden etwa 19 Prozent der hellhäutigen Frauen für Männer gehalten. Bei dunkelhäutigen Frauen liegt die Fehlerquote gar bei 31 Prozent. Im Jahr 2017 war IBM selbst betroffen: Dessen Gesichtserkennung konnte damals ebenfalls schlecht zwischen Gesichtern unterscheiden. 2018 hatte das Unternehmen schon Verbesserungen vorgenommen. Ein entsprechender Datensatz könnte diesen Prozess noch beschleunigen.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed


m.a. 03. Feb 2019

Entschuldigen Sie bitte, aber das ist Unsinn. Zunächst: Die Annotationen in der Bilder...

m.a. 02. Feb 2019

Problem 1: Man darf sich selbst darum kümmern, ob die Bilder, die die URL-LISTE (etwas...

lastRonin 31. Jan 2019

Ich denke da missverstehst du absichtlich was ich geschrieben habe. Es gibt schon Gründe...

Seismoid 30. Jan 2019

Schön, dass du das hier an dieser Stelle einfach mal los werden konntest. ...



Aktuell auf der Startseite von Golem.de
5.000 Fahrzeuge pro Woche
Tesla steigert Giga-Berlin-Produktion und lockt mit Rabatten

Tesla hat Ende März 2023 einen wöchentlichen Ausstoß von 5.000 Fahrzeugen erreicht. Derweil sollen Sonderrabatte Kunden locken.

5.000 Fahrzeuge pro Woche: Tesla steigert Giga-Berlin-Produktion und lockt mit Rabatten
Artikel
  1. Fused Deposition Modeling: Käsekuchen in 3D aus sieben Zutaten gedruckt
    Fused Deposition Modeling
    Käsekuchen in 3D aus sieben Zutaten gedruckt

    3D-Druck in der Küche: US-Forschern ist es nach mehreren erfolglosen Versuchen gelungen, ein Stück Käsekuchen auszudrucken.

  2. Verbrennerverbot: So kann die E-Fuels-Regelung noch scheitern
    Verbrennerverbot
    So kann die E-Fuels-Regelung noch scheitern

    Zwar haben sich Regierung und EU-Kommission auf ein Verfahren zur Zulassung von E-Fuel-Autos geeinigt. Doch dieses muss noch einige Hürden überwinden.

  3. Smart-Home-Anwendung: MQTT unter Java nutzen
    Smart-Home-Anwendung
    MQTT unter Java nutzen

    Wer Daten von Sensoren oder ähnlichen Quellen von A nach B senden möchte, kann das Protokoll MQTT verwenden, dank entsprechender Bibliotheken auch einfach unter Java.
    Eine Anleitung von Florian Bottke

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    • Daily Deals • MediaMarkt-Osterangebote • 3 Spiele kaufen, 2 zahlen • Cyberport Jubiläums-Deals • Alternate: Corsair Vengeance 32 GB DDR-6000 116,89€ u. 64 GB DDR-5600 165,89€ • MindStar: AMD Ryzen 7 5800X 209€ • MSI Optix 30" WFHD/200 Hz 289€ • WD_BLACK SN850 2 TB 189€ • NBB Black Weeks [Werbung]
    •  /