• IT-Karriere:
  • Services:

Hund oder Katze?

Bei Klassifizierungsaufgaben sollen Objekte bestimmten bekannten Klassen zugeordnet werden. Ein Beispiel ist Computer Vision: die Fähigkeit des Computers, visuelle Objekte zu erkennen und richtig zuzuordnen. Beispielsweise könnte man eine große Anzahl von Fotos unterschiedlicher Obstfrüchte verwenden, um dem Computer beizubringen, Obstfrüchte richtig zu klassifizieren. Dabei müssen alle Trainingsfotos schon richtig gekennzeichnet sein, das heißt, bei jedem Foto müsste der Name der Obstfrucht (Output-Variable Y: Apfel, Birne, Nektarine etc.) explizit angegeben sein.

Stellenmarkt
  1. SAmAs GmbH, deutschlandweit (Home-Office)
  2. i-SOLUTIONS Health GmbH, Bochum, Düsseldorf, Mannheim

Der Machine-Learning-Algorithmus würde die Bilder analysieren und statistische Zusammenhänge zwischen dem Namen der Obstfrucht und deren Merkmalen wie Farbe, Form und Größe suchen.

In einer Grafik, die der Softwareingenieur Kevin Binz erstellt hat, sieht man den Versuch, Hunde und Katzen anhand der zwei Input-Variablen Gewicht (auf der horizontalen Achse) und Körpergröße (auf der vertikalen Achse) zu klassifizieren. Verwendet wurde ein einfacher, linearer Klassifizierer; visualisiert mit der geraden, schwarzen Linie. Wie man erkennen kann, können viele Einzeltiere so richtig klassifiziert werden. Allerdings gibt es ein paar Hunde, die fälschlicherweise als Katzen, und ein paar Katzen, die fälschlicherweise als Hunde klassifiziert werden. Mit mehr Input-Faktoren als nur Körpergröße und Gewicht könnte man die Tiere besser klassifizieren. Man sollte sich jedoch im Klaren sein, dass Machine Learning Wahrscheinlichkeiten ausgibt. Hundertprozentig sichere Aussagen sind in den meisten Fällen nicht möglich.

Unsupervised Learning

Bei Algorithmen dieser Art sind die Trainingsdaten nicht gekennzeichnet, das heißt es gibt keine vorgegebenen Werte für die Output-Variable in den Trainingsdatensätzen. Solche Algorithmen werden hauptsächlich für Clustering-Aufgaben verwendet.

Ziel ist es, Objekte anhand ihrer Gemeinsamkeiten und Unterschiede zu Clustern zuzuordnen. Dabei gibt der Anwender die Cluster-Definitionen nicht vor, sondern überlässt diese Aufgabe dem Computer. Der Algorithmus soll entscheiden, welche Cluster er wie definiert. Jedoch kann der Anwender vorgeben, wie viele Cluster existieren sollen. Eine von dem Machine-Learning-Spezialisten Sebastian Raschka erstellte Grafik zeigt ein einfaches Beispiel von drei Clustern in einem zweidimensionalen Raum.

Ein häufiges Einsatzgebiet von Clustering-Algorithmen ist die Markt- und Konsumforschung. So könnte beispielsweise ein Unternehmen seine Kunden anhand von soziodemographischen Daten wie Alter, Geschlecht, Wohnregion, Beruf und Kaufverhalten, wie Anzahl Bestellungen und Umsätze, zu Clustern zuordnen und diese mit unterschiedlichen Werbe- und Marketingmaßnahmen ansprechen.

Ein anderes häufiges Einsatzgebiet von Unsupervised-Learning-Algorithmen ist die Suche nach Anomalitäten, das heißt das Finden von Ausreißern, die sich weit entfernt von den Zentren aller Cluster befinden. Dadurch können mögliche Messfehler eliminiert werden oder aber, falls es keine Messfehler sind, möglicherweise seltene, aber interessante Anomalitäten entdeckt werden.

Folgende Tabelle verdeutlicht die Unterschiede zwischen Klassifikation (bei Supervised Learning) und Clustering (bei Unsupervised Learning):

  • Lineare Regression
  • Vergleich von Klassifikation und Clustering
Vergleich von Klassifikation und Clustering

Reinforcement Learning

Algorithmen der Kategorie Reinforcement Learning lernen selbstständig, indem sie versuchen, Belohnungen zu maximieren beziehungsweise Strafen zu minimieren. Dahinter steckt das Prinzip von Try-and-Error, verbunden mit einer Bewertung, die "gutes" (zielführendes) Verhalten belohnt und "schlechte" Verhaltensmuster bestraft.

Eine Belohnung bedeutet hier, dass diese Verhaltensmuster in Zukunft häufiger ausprobiert werden. Bei einer Bestrafung werden die verwendeten Verhaltensmuster zukünftig seltener getestet. Der Algorithmus durchläuft eine Vielzahl von Iterationen, bei denen er bewährte Verhaltensmuster miteinander kombiniert und zufällig neue Verhaltensweisen ausprobiert. So kommt er dem Optimum Schritt für Schritt näher. Die wohl bekanntesten Vertreter dieser Kategorie sind die genetischen Algorithmen, die sich an der Evolutionstheorie von Charles Darwin orientieren.

Reinforcement Learning wird bei Minimierung- und Maximierungsaufgaben verwendet. Des Weiteren kommt es bei Lernprozessen, bei denen auf sich verändernde Umwelteinflüsse reagiert werden soll, zum Einsatz.

Beispielsweise könnte man Reinforcement Learning verwenden, damit ein Volk von Roboterameisen lernt, wie es sich optimal fortbewegen kann. Jede Roboterameise würde anfangs probieren, mit einer zufälligen Bewegungstechnik voranzukommen. Der Erfolg kann gemessen werden: die zurückgelegte Strecke pro Iteration beziehungsweise Generation, wie man in Anspielung auf die Evolutionstheorie auch sagt. In der Generation werden dann Fortbewegungstechniken, die überdurchschnittlich erfolgreich waren, auch überdurchschnittlich oft miteinander kombiniert und ihre Merkmale vererbt. Das heißt, ihre Merkmale kommen in Zukunft häufiger zum Einsatz.

Zusätzlich wird jedoch immer mit einer bestimmten Wahrscheinlichkeit ein neues, zufälliges Bewegungsmerkmal ausprobiert. Das entspricht der Mutation in der Evolution. Am Ende jeder Generation erfolgt wieder eine Bewertung. Dadurch werden die Roboterameisen im Laufe der vielen Generationen immer erfolgreicher beim Fortbewegen.

Reinforcement Learning hat hier noch den Vorteil, dass das Lernen auch sich verändernde Umweltfaktoren berücksichtigt. Wenn das Terrain sich hin und wieder ändert, weil es zum Beispiel regnet und der Boden matschig wird, wird die Evolution der Bewegungstechniken dies berücksichtigen. Deshalb konnte auch das Leben auf der Erde trotz Eiszeiten und Trockenperioden weiterbestehen: Es hat sich an die neuen Umwelteinflüsse angepasst.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
 Der Algorithmus trainiertFazit 
  1.  
  2. 1
  3. 2
  4. 3
  5. 4
  6. 5
  7.  


Anzeige
Top-Angebote
  1. 97,90€ (keine Versandkosten!)
  2. 54,99€
  3. (u. a. Sandisk Speicherprodukte, Überwachungskameras von Blink)
  4. gratis

mg1993 15. Okt 2018

Der Artikel an für sich ist sehr interessant. Ich selbst studiere Informatik und schreibe...

a user 11. Okt 2018

Nein. Die Rechenkapazität unseres Gehirns schlägt um Welten die aller existierenden...

tunnelblick 11. Okt 2018

vielen lieben dank für die ausführliche antwort!

a user 10. Okt 2018

Der Punkt ist ein anderer. Die Umsetzungen sind erst mit heutiger Technik möglich. Aber...

danh 09. Okt 2018

Theoretisch: Bilder einer Frontkamera in trainiertes neuronales Netz rein, am Ende kommen...


Folgen Sie uns
       


Radeon RX 6800 (XT) im Test mit Benchmarks

Lange hatte AMD bei Highend-Grafikkarten nichts zu melden, mit den Radeon RX 6800 (XT) kehrt die Gaming-Konkurrenz zurück.

Radeon RX 6800 (XT) im Test mit Benchmarks Video aufrufen
    •  /