Gesichtserkennung: Deep Learning - Überwachung für alle

Die Fähigkeit, Gesichter zu erkennen, war lange dem Menschen vorbehalten. Seit Deep Learning dank GPUs den Durchbruch hatte, ist der Computer auch dazu in der Lage - und jeder kann die Technologie einsetzen.

Artikel von Siavash Sefid-Rodi veröffentlicht am
Gesichtserkennung mit Deep Learning ist komplex.
Gesichtserkennung mit Deep Learning ist komplex. (Bild: peterme/CC-BY 2.0)

Wer versucht, sich in das Thema Gesichtserkennung mittels Deep Learning einzuarbeiten, ist schnell erschlagen von der Komplexität. Man muss etwas Geduld aufbringen und recherchieren, um zu verstehen, wie aus einem Berg an Daten und einem im Grunde einfachen und lange bekannten Trainingsalgorithmus ein Stück Software entsteht, das erstaunlich gut Gesichter wiedererkennt.

Inhalt:
  1. Gesichtserkennung: Deep Learning - Überwachung für alle
  2. Das Gesicht im Heuhaufen finden
  3. DIY-Massenüberwachung mit Deep Learning?

Aber da die Machine-Learning-Community die Idee der Open-Source-Software dazu nutzt, sich gegenseitig zu beflügeln, ist auch ein praxisorientierter Einstieg möglich, der das Problem von der Anwendung her aufrollt.

Neben legitimen Anwendungen wie dem Absichern von Ressourcen mittels Biometrie gibt es auch weniger legitime - zum Beispiel das massenhafte Überwachen von Personen. Der ein oder andere erinnert sich da an Clearview AI. Diese Firma sammelt alle Gesichter, die sie finden kann, und bietet die Identifizierung von Personen an. Wir schauen uns mal an, wie so etwas funktionieren kann und probieren es selbst aus.

Wer das gerne mal auf dem eigenen Rechner machen möchte, kann sich die Software, die für diesen Artikel verwendet wurde, in diesem Github Repository anschauen.

Strukturen lernen

Stellenmarkt
  1. Teamleiter (m|w|d) Linux - Systeme
    Bertrandt AG Ehningen, Ehningen
  2. Developer SAP Sales Cloud/SAP Service Cloud (d/m/w)
    INTENSE AG, Köln, Würzburg, Saarbrücken, Leipzig
Detailsuche

Herzstück aller Deep-Learning-Anwendungen sind natürlich Daten. Und diese sind fast immer unstrukturierter Natur. Solche Daten sind zwar digitalisiert, ihr Inhalt hat aber kein vordefiniertes Format. Beispiele sind Fotos, Audioaufnahmen oder von Menschen geschriebene Texte.

Zwar enthält ein Foto viele Informationen, doch wie kann man sie automatisiert abfragen, so wie man es von Datenbanken her kennt? Wie findet man zum Beispiel aus einigen Tausend Porträtfotos diejenigen, auf denen ein bestimmtes Gesicht zu sehen ist?

Deep Learning illustriert: Eine anschauliche Einführung in Machine Vision, Natural Language Processing und Bilderzeugung für Programmierer und Datenanalysten

Eine Möglichkeit ist das sogenannte representation learning (PDF) mithilfe von neuronalen Netzen. Gemeint sind damit durch neuronale Netze gelernte Funktionen, die zu unstrukturierten Daten eine Repräsentation mit nützlicher Struktur finden.

Die Nützlichkeit entsteht durch die semantische Vergleichbarkeit der Daten. Hätte man einen Algorithmus, der zu zwei Gesichtern eine Zahl berechnet, die die Ähnlichkeit ausdrückt, hätte man ein Kriterium, um die Identität der dargestellten Personen zu bestimmen.

Um diese recht abstrakte Idee greifbar zu machen, schauen wir uns FaceNet an. Dieses neuronale Netz ordnet einem Gesicht einen Vektor zu. Ähnlich aussehende Gesichter haben Vektoren, die nahe beieinander liegen. Weniger ähnliche Gesichter haben weiter entfernt liegende Vektoren. Die Ähnlichkeit wird also durch die euklidische Distanz der Vektoren ausgedrückt. Eine solche Repräsentation nennt man auch embedding.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
Das Gesicht im Heuhaufen finden 
  1. 1
  2. 2
  3. 3
  4.  


Dreamwalker84 05. Apr 2022

Hier gibt's nicht viel zu sagen. Das Buch ist eine, auf die heutigen Bedürfnisse und...

emdotjay 05. Apr 2022

Man kann mit der Technology auch Doubles finden. Das würde manche Unternehmen die Arbeit...

Oviing 05. Apr 2022

Eigentlich braucht man sogar wie keine Hardware. Man kann sich auch bei AWS, GCC, Azure...



Aktuell auf der Startseite von Golem.de
LED-Panel und Raspberry Pi
Eine schicke Berlin-Uhr fürs Wohnzimmer

Es braucht nur ein 64x64-LED-Panel und ein bisschen C#-Programmierung, um die Berlin-Uhr auf den Raspberry Pi zu bringen.
Eine Anleitung von Michael Bröde

LED-Panel und Raspberry Pi: Eine schicke Berlin-Uhr fürs Wohnzimmer
Artikel
  1. Kryptowährungen: Pleite von Three Arrows Capital zieht Kreise
    Kryptowährungen
    Pleite von Three Arrows Capital zieht Kreise

    Nach der Liquidationsanordnung gegenüber dem Fonds Three Arrows Capital verlieren immer mehr Krypto-Broker reichlich Geld.

  2. Tomtom: Verkehrsdaten zeigen weniger Staus seit 9-Euro-Ticket
    Tomtom
    Verkehrsdaten zeigen weniger Staus seit 9-Euro-Ticket

    Pendler lassen ihr Auto dank des 9-Euro-Tickets offenbar häufiger stehen und wechseln auf den ÖPNV.

  3. Ohne Kreditrahmen: Action-Rollenspiele, die besser sind als Diablo Immortal
    Ohne Kreditrahmen
    Action-Rollenspiele, die besser sind als Diablo Immortal

    Enttäuscht von Blizzards Pay-to-Win-Diablo? Diese aktuellen Rollenspiele für Mobile und PC sind die besseren Alternativen.
    Von Rainer Sigl

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • LG UltraGear 27" WQHD 165 Hz 299€ • Switch OLED günstig wie nie: 333€ • MindStar (MSI Optix 27" WQHD 165 Hz 249€, MSI RX 6700 XT 499€) • Alternate (SSDs & RAM von Kingston) • Grafikkarten zu Toppreisen • PNY RTX 3080 12GB günstig wie nie: 929€ • Top-TVs bis 53% Rabatt [Werbung]
    •  /