• IT-Karriere:
  • Services:

Tiefes Lernen über mehrere Schichten

Flache neuronale Netzwerke, wie wir sie bisher betrachtet haben, weisen nur eine einzige Merkmalstransformation, also eine verdeckte Schicht auf. Wie auch viele andere Algorithmen des maschinellen Lernens transformieren sie Merkmale nur einmal in eine andere Repräsentation um. Ein Problem solch flacher Architekturen ist die Qualität der Klassifikation, da Lerner es mit nur einer einzigen Transformation schaffen müssen, die hochdimensionalen Ausgangsmerkmale auf die wichtigsten Merkmale zu generalisieren.

Stellenmarkt
  1. EnBW Energie Baden-Württemberg AG, Karlsruhe
  2. HRI IT-Services GmbH, Berlin

Oft hilft hierbei der Anwendungsentwickler oder Datenwissenschaftler mit seinem Wissen über das Anwendungsfeld, also seinem Domänenwissen, und wählt manuell möglichst repräsentative Merkmale aus. Als Eingabe dienen hier also in der Regel nicht die wenig verarbeiteten Rohdaten, sondern es werden manuell Merkmale konstruiert, die eine einfache Klassifikation möglich machen. Man spricht daher auch vom Feature-Engineering.

  • Abbildung 8 (Bild: Christian Herta)
Abbildung 8 (Bild: Christian Herta)

Abbildung 8: Prinzip der Klassifikation mit aufwendigem manuellen Feature-Engineering für Merkmale vs. Lernen von Merkmalen.

Bei komplexen Aufgabenstellungen wie der Bildanalyse kann dieser Prozess des Merkmalsdesigns auch zweistufig sein. Zuerst werden niedrige (low-level) Merkmale mit Techniken der Bildanalyse konstruiert, etwa das Finden von charakteristischen Kanten-Punkten im Bild mit Sift und die Konstruktion von Merkmalen aus solchen Punkten. Aus diesen Merkmalen werden dann zum Beispiel mit Hilfe der Methode der Clusteranalyse neue Merkmale erzeugt, die anschließend ein Klassifikator mit einer flachen Architektur verwendet.

Dieses Vorgehen ist fehlerbehaftet, erfordert viel Trial-and-Error vom Programmierer und Erfahrung in der Domäne. Ist ein Gesicht auf einem Foto abgebildet ist, so liegen beispielsweise in der Regel Kanten bei den Augen, der Nase und dem Mund vor. Jetzt kann man versuchen, aus der charakteristischen Anordnung von Augen, Nase und Mund etc. Merkmale zu konstruieren, um ein abgebildetes Gesicht zu erkennen. Des Weiteren können auch einfache statistische Größen und Verteilungen, wie etwa die der Helligkeitswerte oder Farben, helfen, Landschaftsbilder (mehr Grün) von Porträts (mehr Hautfarbe) zu unterscheiden.

Doch Bilder können so unterschiedlich sein, dass der Lerner mit seiner Einschätzung oft falsch liegt, wenn für die Klassifikation solche händisch konstruierten Merkmale verwendet werden. Damit seltener Fehleinschätzungen vorkommen, muss der Mensch dann zusätzliche Merkmale identifizieren, programmieren und dem Lerner übergeben.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
 Warum ist das Lernen neuronaler Netze so schwierig?Deep Learning ersetzt das Feature-Engineering 
  1.  
  2. 1
  3. 2
  4. 3
  5. 4
  6. 5
  7. 6
  8. 7
  9. 8
  10.  


Anzeige
Spiele-Angebote
  1. 69,99€ (Standard Edition), 116,39€ (Premium Deluxe Edition - unter anderem mit Frankfurt...
  2. 9,99€
  3. (-27%) 14,50€

kahmann 29. Okt 2015

Der Artikel hat mir gut gefallen. Nicht zuletzt auch, weil er sehr tief in die Materie...

jg (Golem.de) 15. Okt 2015

Jetzt müssten endlich auch mobil alle Bilder zu sehen sein!

natsan2k 08. Okt 2015

Schöner und interessanter Artikel.

Anonymer Nutzer 08. Okt 2015

Tatsächlich hat Siri was mit lernen zutun - oder genauer mit Training. Die verwendete...

jg (Golem.de) 07. Okt 2015

Vielen Dank für das Lob, wir freuen uns!


Folgen Sie uns
       


Windows Powertoys - Tutorial

Wir geben einen kurzen Überblick der Funktionen von Powertoys für Windows 10.

Windows Powertoys - Tutorial Video aufrufen
    •  /