Original-URL des Artikels: https://www.golem.de/news/cornonavirus-instagram-macht-datensatz-fuer-maskenerkennung-ungueltig-2005-148725.html    Veröffentlicht: 26.05.2020 16:17    Kurz-URL: https://glm.io/148725

Cornonavirus

Instagram macht Datensatz für Maskenerkennung ungültig

Eine Entwicklergruppe hatte den Datensatz für KI-Training erstellt und gute Ergebnisse erzielt - allerdings aus Selfies von Instagram.

Eine Entwicklergruppe hat einen Datensatz erstellt, der KI-Systemen bei der Erkennung von maskierten Gesichtern helfen soll. Die Quelle: Selfie-Bilder von Menschen, die sich maskiert und unmaskiert abgelichtet und dies auf Instagram hochgeladen hatten. Allerdings reagierte das soziale Netzwerk schnell und ließ die im Repository befindlichen Referenzen ablaufen. Die Datensammlung wurde laut Entwicklerangaben angelegt, "um Leuten zu helfen, kreative Lösungen für Covid-19-Probleme zu erstellen". So heißt es zumindest in der Beschreibung auf Github.

Die Sammlung besteht aus 1.205 Links zu den Bildern, welche das Entwicklerteam auf dem Portal in einer Tabelle veröffentlichte. Daher konnte Instagram diese relativ zügig ungültig machen. Das Tool kann Bilder von Menschen in drei Mengen kategorisieren: Personen mit medizinischen Masken, Personen ohne Masken und Personen mit nicht-medizinischen Gesichtsbedeckungen - etwa Schals oder selbsterstellte Masken. Vor dem Auslaufen der Links hatte das Team wohl eine Genauigkeit von 93 Prozent damit erzielen können.

Chinesisches Forschungsteam stellt Datensätze zur Verfügung

In Zeiten, in denen viele Menschen Masken im öffentlichen Leben tragen, haben es automatisierte Überwachungssysteme und Bilderkennungssoftware schwer, Menschen an ihren Gesichtern zu erkennen. Aus diesem Grund scheint es logisch, kostenlose Trainingsdaten zu sammeln und zur Verfügung zu stellen. Die Frage ist, ob dies moralisch tragbar ist, wenn einfach persönliche Daten von Menschen dafür verarbeitet werden. Instagram sieht das zumindest nicht so.

Es gibt allerdings Alternativen: etwa das chinesische Real-World Masked Face Dataset. Dieses steht ebenfalls auf Github zur Verfügung und kann für das Training von Gesichtserkennungssoftware genutzt werden. Hier wurden Bilder von Bürgern aufgenommen und zu einer Sammlung zusammengefasst.

Der Autor meint dazu

Da es sich um viele gebürtige chinesische Menschen handelt, könnte dies in europäischen und anderen Nationen eventuell etwas schwieriger werden. Anwendende sollten darauf achten, dass so trainierte Systeme keine ethnischen Vorurteile gegenüber anderen Völkern haben. Das ist ein wichtiges Thema in der KI-Forschung.

Für die einfache binäre Erkennung zwischen Menschen mit und ohne Maske könnten umfassende Datensätze allerdings hilfreich sein - egal welche Bevölkerungsgruppen sie primär repräsentieren.  (on)


Verwandte Artikel:
Mint-Allianz Wir bleiben schlau!: Wir bleiben unwissend!   
(05.04.2020, https://glm.io/147697 )
Raumfahrt: Raketen bleiben am Boden und Mitarbeiter zu Hause   
(18.03.2020, https://glm.io/147321 )
Digitale-Dienste-Gesetz: Chancen für die Kleinen - Kontrolle für die Großen   
(12.05.2020, https://glm.io/148396 )
Computer: Nvidia-KI programmiert Pacman-Klon durch Zusehen   
(23.05.2020, https://glm.io/148672 )
Quartalsbericht: Facebook kann Preisverfall bei Anzeigen ausgleichen   
(29.04.2020, https://glm.io/148183 )

© 1997–2020 Golem.de, https://www.golem.de/