Zum Hauptinhalt Zur Navigation

Cornonavirus: Instagram macht Datensatz für Maskenerkennung ungültig

Eine Entwicklergruppe hatte den Datensatz für KI-Training erstellt und gute Ergebnisse erzielt - allerdings aus Selfies von Instagram .
/ Oliver Nickel
8 Kommentare News folgen (öffnet im neuen Fenster)
Maskierte Gesichter sind für Kameras nicht immer einfach zu erkennen. (Bild: Pixabay.com)
Maskierte Gesichter sind für Kameras nicht immer einfach zu erkennen. Bild: Pixabay.com

Eine Entwicklergruppe hat einen Datensatz erstellt, der KI-Systemen bei der Erkennung von maskierten Gesichtern helfen soll. Die Quelle: Selfie-Bilder von Menschen, die sich maskiert und unmaskiert abgelichtet und dies auf Instagram hochgeladen hatten. Allerdings reagierte das soziale Netzwerk schnell und ließ die im Repository befindlichen Referenzen ablaufen. Die Datensammlung wurde laut Entwicklerangaben angelegt, "um Leuten zu helfen, kreative Lösungen für Covid-19-Probleme zu erstellen" . So heißt es zumindest in der Beschreibung auf Github(öffnet im neuen Fenster) .

Die Sammlung besteht aus 1.205 Links zu den Bildern, welche das Entwicklerteam auf dem Portal in einer Tabelle veröffentlichte. Daher konnte Instagram diese relativ zügig ungültig machen. Das Tool kann Bilder von Menschen in drei Mengen kategorisieren: Personen mit medizinischen Masken, Personen ohne Masken und Personen mit nicht-medizinischen Gesichtsbedeckungen - etwa Schals oder selbsterstellte Masken. Vor dem Auslaufen der Links hatte das Team wohl eine Genauigkeit von 93 Prozent damit erzielen können.

Chinesisches Forschungsteam stellt Datensätze zur Verfügung

In Zeiten, in denen viele Menschen Masken im öffentlichen Leben tragen, haben es automatisierte Überwachungssysteme und Bilderkennungssoftware schwer, Menschen an ihren Gesichtern zu erkennen. Aus diesem Grund scheint es logisch, kostenlose Trainingsdaten zu sammeln und zur Verfügung zu stellen. Die Frage ist, ob dies moralisch tragbar ist, wenn einfach persönliche Daten von Menschen dafür verarbeitet werden. Instagram sieht das zumindest nicht so.

Es gibt allerdings Alternativen: etwa das chinesische Real-World Masked Face Dataset(öffnet im neuen Fenster) . Dieses steht ebenfalls auf Github zur Verfügung und kann für das Training von Gesichtserkennungssoftware genutzt werden. Hier wurden Bilder von Bürgern aufgenommen und zu einer Sammlung zusammengefasst.

Der Autor meint dazu

Da es sich um viele gebürtige chinesische Menschen handelt, könnte dies in europäischen und anderen Nationen eventuell etwas schwieriger werden. Anwendende sollten darauf achten, dass so trainierte Systeme keine ethnischen Vorurteile gegenüber anderen Völkern haben. Das ist ein wichtiges Thema in der KI-Forschung.

Für die einfache binäre Erkennung zwischen Menschen mit und ohne Maske könnten umfassende Datensätze allerdings hilfreich sein - egal welche Bevölkerungsgruppen sie primär repräsentieren.


Relevante Themen