Gesichtserkennung: Deep Learning - Überwachung für alle

Die Fähigkeit, Gesichter zu erkennen, war lange dem Menschen vorbehalten. Seit Deep Learning dank GPUs den Durchbruch hatte, ist der Computer auch dazu in der Lage - und jeder kann die Technologie einsetzen.

Artikel von Siavash Sefid-Rodi veröffentlicht am
Gesichtserkennung mit Deep Learning ist komplex.
Gesichtserkennung mit Deep Learning ist komplex. (Bild: peterme/CC-BY 2.0)

Wer versucht, sich in das Thema Gesichtserkennung mittels Deep Learning einzuarbeiten, ist schnell erschlagen von der Komplexität. Man muss etwas Geduld aufbringen und recherchieren, um zu verstehen, wie aus einem Berg an Daten und einem im Grunde einfachen und lange bekannten Trainingsalgorithmus ein Stück Software entsteht, das erstaunlich gut Gesichter wiedererkennt.

Inhalt:
  1. Gesichtserkennung: Deep Learning - Überwachung für alle
  2. Das Gesicht im Heuhaufen finden
  3. DIY-Massenüberwachung mit Deep Learning?

Aber da die Machine-Learning-Community die Idee der Open-Source-Software dazu nutzt, sich gegenseitig zu beflügeln, ist auch ein praxisorientierter Einstieg möglich, der das Problem von der Anwendung her aufrollt.

Neben legitimen Anwendungen wie dem Absichern von Ressourcen mittels Biometrie gibt es auch weniger legitime - zum Beispiel das massenhafte Überwachen von Personen. Der ein oder andere erinnert sich da an Clearview AI. Diese Firma sammelt alle Gesichter, die sie finden kann, und bietet die Identifizierung von Personen an. Wir schauen uns mal an, wie so etwas funktionieren kann und probieren es selbst aus.

Wer das gerne mal auf dem eigenen Rechner machen möchte, kann sich die Software, die für diesen Artikel verwendet wurde, in diesem Github Repository anschauen.

Strukturen lernen

Stellenmarkt
  1. Senior Software Developer (m/w / divers)
    Continental AG, Villingen
  2. (Medien-)Informatikerin / Kommunikationswissenschaftle- rin als IT-Verantwortliche (m/w/d) ... (m/w/d)
    Max-Planck-Gesellschaft zur Förderung der Wissenschaften e.V., München
Detailsuche

Herzstück aller Deep-Learning-Anwendungen sind natürlich Daten. Und diese sind fast immer unstrukturierter Natur. Solche Daten sind zwar digitalisiert, ihr Inhalt hat aber kein vordefiniertes Format. Beispiele sind Fotos, Audioaufnahmen oder von Menschen geschriebene Texte.

Zwar enthält ein Foto viele Informationen, doch wie kann man sie automatisiert abfragen, so wie man es von Datenbanken her kennt? Wie findet man zum Beispiel aus einigen Tausend Porträtfotos diejenigen, auf denen ein bestimmtes Gesicht zu sehen ist?

Deep Learning illustriert: Eine anschauliche Einführung in Machine Vision, Natural Language Processing und Bilderzeugung für Programmierer und Datenanalysten

Eine Möglichkeit ist das sogenannte representation learning (PDF) mithilfe von neuronalen Netzen. Gemeint sind damit durch neuronale Netze gelernte Funktionen, die zu unstrukturierten Daten eine Repräsentation mit nützlicher Struktur finden.

Die Nützlichkeit entsteht durch die semantische Vergleichbarkeit der Daten. Hätte man einen Algorithmus, der zu zwei Gesichtern eine Zahl berechnet, die die Ähnlichkeit ausdrückt, hätte man ein Kriterium, um die Identität der dargestellten Personen zu bestimmen.

Um diese recht abstrakte Idee greifbar zu machen, schauen wir uns FaceNet an. Dieses neuronale Netz ordnet einem Gesicht einen Vektor zu. Ähnlich aussehende Gesichter haben Vektoren, die nahe beieinander liegen. Weniger ähnliche Gesichter haben weiter entfernt liegende Vektoren. Die Ähnlichkeit wird also durch die euklidische Distanz der Vektoren ausgedrückt. Eine solche Repräsentation nennt man auch embedding.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
Das Gesicht im Heuhaufen finden 
  1. 1
  2. 2
  3. 3
  4.  


Dreamwalker84 05. Apr 2022 / Themenstart

Hier gibt's nicht viel zu sagen. Das Buch ist eine, auf die heutigen Bedürfnisse und...

emdotjay 05. Apr 2022 / Themenstart

Man kann mit der Technology auch Doubles finden. Das würde manche Unternehmen die Arbeit...

Oviing 05. Apr 2022 / Themenstart

Eigentlich braucht man sogar wie keine Hardware. Man kann sich auch bei AWS, GCC, Azure...

Kommentieren



Aktuell auf der Startseite von Golem.de
Prehistoric Planet
Danke, Apple, für so grandiose Dinosaurier!

Musik von Hans Zimmer, dazu David Attenborough als Sprecher: Apples Prehistoric Planet hat einen Kindheitstraum zum Leben erweckt.
Ein IMHO von Marc Sauter

Prehistoric Planet: Danke, Apple, für so grandiose Dinosaurier!
Artikel
  1. Star Wars: Cal Kestis kämpft in Jedi Survivor weiter
    Star Wars
    Cal Kestis kämpft in Jedi Survivor weiter

    EA hat offiziell den Nachfolger zu Star Wars Jedi Fallen Order angekündigt. Hauptfigur ist erneut Cal Kestis mit seinem Roboterkumpel BD-1.

  2. Fahrgastverband Pro Bahn: Wo das 9-Euro-Ticket sicher gilt
    Fahrgastverband Pro Bahn
    Wo das 9-Euro-Ticket sicher gilt

    Die Farbe der Züge ist entscheidend, was bei der Reiseplanung in der Deutsche-Bahn-App wenig nützt. Dafür laufen Fahrscheinkontrollen ins Leere.

  3. Retro Gaming: Wie man einen Emulator programmiert
    Retro Gaming
    Wie man einen Emulator programmiert

    Warum nicht mal selbst einen Emulator programmieren? Das ist lehrreich und macht Spaß - wenn er funktioniert. Wie es geht, zeigen wir am Gameboy.
    Von Johannes Hiltscher

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • PS5 evtl. bestellbar • Prime Video: Filme leihen für 0,99€ • Gigabyte RTX 3080 12GB günstig wie nie: 1.024€ • MSI Gaming-Monitor 32" 4K günstig wie nie: 999€ • Mindstar (u. a. AMD Ryzen 5 5600 179€, Palit RTX 3070 GamingPro 669€) • Days of Play (u. a. PS5-Controller 49,99€) [Werbung]
    •  /