• IT-Karriere:
  • Services:

Wie funktioniert das Lernen mit neuronalen Netzwerken?

Sowohl die Merkmalstransformationen als auch die Klassenentscheidung werden bei neuronalen Netzen durch die Beobachtung der Daten gelernt. Für unser Beispiel erfolgt der Lernvorgang für die Aufgabe der Klassenzuordnung von Bildern. Zuerst wird ein Bild am Eingang des neuronalen Netzes angelegt und der Ausgangswert berechnet. Aus der Differenz zwischen dem Ausgang und der gewünschten Klasse lässt sich ein Fehler(wert) berechnen.

Stellenmarkt
  1. RATIONAL Wittenheim SAS, Wittenheim (Frankreich)
  2. über eTec Consult GmbH, südlich von Stuttgart

Dieser Fehler hängt von sogenannten Gewichten der Neuronen (siehe Abbildung 1) ab, denn sie bestimmen den Ausgangswert.

  • Abbildung 1 (Bild: Christian Herta)
  • Abbildung 2 (Bild: Christian Herta)
Abbildung 1 (Bild: Christian Herta)

Abbildung 1: Ein Neuron als kleinste Recheneinheit eines neuronalen Netzes: Es wird die Summe der gewichteten Eingabewerte x1, x2, ... xn berechnet, d. h., jeder Eingabewert xi wird zuerst mit einem Gewicht wi multipliziert, bevor alle Eingabewerte aufsummiert werden.

Abbildung 2: Anschließend wird eine Aktivierungsfunktion (Schwellenwertfunktion) σ auf die gewichtete Summe angewendet. Falls die gewichtete Summe größer als der Schwellwert (hier im Beispiel 0,75) ist, liegt am Ausgang des Neurons eine 1 (aktiv) an. Falls die gewichtete Summe kleiner ist, ist das Neuron dagegen inaktiv. Der Ausgang hat dann den Wert 0. Dies ist ein Beispiel für eine harte Aktivierungsfunktion (blau). In Grün ist eine weichere Aktivierungsfunktion dargestellt.

Ein Gewicht ist sozusagen die Wertschätzung oder Wahrscheinlichkeit, die das neuronale Netzwerk der Beobachtung eines Neuronen zuordnet. Beim Lernen werden nun die Gewichte so angepasst, dass der Fehler kleiner wird, indem der Ausgangswert sich dem gewünschten Zielwert für alle Trainingsbeispiele annähert (siehe Abbildung 9).

  • Abbildung 9 (Bild: Christian Herta)
Abbildung 9 (Bild: Christian Herta)

Abbildung 9: Vereinfachte Darstellung einer Merkmalstransformation für zwei Merkmale und drei Klassen. Im ursprünglichen Merkmalsraum haben wir eine komplizierte Abbildungsfunktion der Merkmale auf die Klassen. Nach der Transformation sind die Datenpunkte der unterschiedlichen Klassen im Raum durch einfache gerade Trennlinien (im allgemeinen Hyperebenen) voneinander abgegrenzt.

Das Lernen wurde so als ein mathematisch lösbares Optimierungsproblem formuliert.

Für unser Beispiel der drei Klassen codiert man die Zielklasse mit drei Ausgangsneuronen o1, o2 und o3. Jedes Ausgangsneuron entspricht dann einer Klasse. o1 steht beispielsweise für die Landschaftsaufnahme, o2 für Porträts und o3 für die Tieraufnahmen. Wird ein Porträtfoto am Eingang angelegt, ist der Wunschzielwert der Ausgangsneuronen: o1=0; o2=1; o3=0; in Vektorform (0,1,0). Die Ausgangsneuronen des neuronalen Netzes haben typischerweise eine Aktivierungsfunktion, die Wahrscheinlichkeiten für die Klassen angeben.

Ist der Ausgang z. B. (0.3, 0.45, 0.25), so bedeutet dies, dass das neuronale Netz folgende Wahrscheinlichkeiten berechnet: 30 Prozent für die Klasse Landschaftsaufnahme, 45 Prozent für die Klasse Porträt und 25 Prozent für die Klasse Tieraufnahme.

Der Fehler ergibt sich dann aus der Differenz zwischen der Einschätzung des neuronalen Netzes für die Zielklasse zur gewünschten Zielwahrscheinlichkeit 100 Prozent. Da die Einschätzung des neuronalen Netzes für die Zielklasse Porträt 45 Prozent beträgt, ist die Differenz 100 Prozent - 45 Prozent = 55 Prozent.

Beim Lernen werden nun die Neuronengewichte so modifiziert, dass der Fehlerwert von 55 Prozent erniedrigt wird. Das heißt, dass die Wahrscheinlichkeit für die Zielklasse Porträtfoto erhöht werden soll. Beim Anlegen dieses Fotos soll sie größer als die bisherigen 45 Prozent sein. Ein wichtiger Algorithmus für diese Anpassung der Gewichte ist Backpropagation.

Dabei wird effizient berechnet, wie stark die einzelnen Neuronengewichte geändert werden müssen, um den Fehler zu reduzieren.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
 Wissen repräsentieren und generalisierenWarum ist das Lernen neuronaler Netze so schwierig? 
  1.  
  2. 1
  3. 2
  4. 3
  5. 4
  6. 5
  7. 6
  8. 7
  9. 8
  10.  


Anzeige
Top-Angebote
  1. (u. a. ASUS ROG Strix X570-I Gaming für 249€ inkl. Versand statt 272,91€ im Vergleich)
  2. (u. a. Acer C101i Mini Beamer für 145,25€ statt 169,06€ im Vergleich und Roccat-Produkte...
  3. 79,54€ (Preis wird an der Kasse angezeigt. Vergleichspreis 93,37€)
  4. (u. a. Forza Horizon 4 - Ultimate Edition für 49,99€, ARK: Survival Evolved für 10,99€, Human...

kahmann 29. Okt 2015

Der Artikel hat mir gut gefallen. Nicht zuletzt auch, weil er sehr tief in die Materie...

jg (Golem.de) 15. Okt 2015

Jetzt müssten endlich auch mobil alle Bilder zu sehen sein!

natsan2k 08. Okt 2015

Schöner und interessanter Artikel.

Anonymer Nutzer 08. Okt 2015

Tatsächlich hat Siri was mit lernen zutun - oder genauer mit Training. Die verwendete...

jg (Golem.de) 07. Okt 2015

Vielen Dank für das Lob, wir freuen uns!


Folgen Sie uns
       


Patrick Schlegels Visitenkarte spielt Musik und würfelt

Eine Visitenkarte muss nicht immer aus langweiligem Papier sein. Patrick Schlegels Visitenkarte hat einen USB-Speicher, spielt Musik und kann würfeln.

Patrick Schlegels Visitenkarte spielt Musik und würfelt Video aufrufen
Hildmann, Naidoo, Identitäre: Warum Telegram bei Rechten so beliebt ist
Hildmann, Naidoo, Identitäre
Warum Telegram bei Rechten so beliebt ist

Wer auf Telegram hetzt, den Holocaust leugnet oder Verschwörungsideologien verbreitet, muss nicht befürchten, dass seine Beiträge gelöscht werden. Auch große Gruppen fallen dort nicht unters NetzDG, die Strafverfolgung ist schwierig.
Ein Bericht von Stefan Krempl


    Programmiersprache Go: Schlanke Syntax, schneller Compiler
    Programmiersprache Go
    Schlanke Syntax, schneller Compiler

    Die objektorientierte Programmiersprache Go eignet sich vor allem zum Schreiben von Netzwerk- und Cloud-Diensten.
    Von Tim Schürmann


      Star Wars Jedi Fallen Order: Die Macht ist mit den physikalisch Animierten
      Star Wars Jedi Fallen Order
      Die Macht ist mit den physikalisch Animierten

      GDC 2020 Das Imperium stirbt korrekt simuliert: Ein Entwickler von Respawn hat das Animationssystem von Jedi Fallen Order vorgestellt.

      1. King Schöne Grafik für 249 Millionen Spieler
      2. John Romero "Haltet euren Quellcode so einfach wie möglich"
      3. Entwicklertagung Entwicklertagung GDC 2020 Summer für August angekündigt

        •  /