Der Algorithmus trainiert

Nun wird noch ein Machine-Learning-Algorithmus benötigt. Der Einsatzzweck ist eine Regression. Wer sich nun auf seine Schulzeit besinnt, wird sich möglicherweise an die lineare Regression erinnern:

  • Lineare Regression
  • Vergleich von Klassifikation und Clustering
Lineare Regression
Stellenmarkt
  1. Leiter Escalation- und Incident-Management (m/w/d)
    ENTEGA Medianet GmbH über KEPPLER.Personalberatung, Darmstadt
  2. Inhouse Consultant Reporting (w/m/d)
    Schwarz Produktion Stiftung & Co. KG, Weißenfels
Detailsuche

Was nun vielleicht für den einen oder anderen eine Überraschung ist: die lineare Regression ist ein simpler, aber oft verwendeter, Machine-Learning-Algorithmus!

In unserem Pkw-Beispiel würde der Machine-Learning-Algorithmus für alle 75.000 Trainingsfälle die lineare Regression verwenden und nach Korrelationen zwischen den Input-Variablen Xi und der Output-Variablen Y (Preis) suchen. Der Algorithmus würde die Konstante Const und insbesondere die Gewichtungen a, b, ..., z für die Input-Variablen Xi anhand der Korrelationen aus den Trainingsdaten selbstständig finden. Das Ergebnis ist das sogenannte trainierte Modell.

Wie gut das trainierte Modell ist, wird in der Testphase ermittelt. Hierbei wird es mit den Input-Variablen der 25.000 Testfälle gefüttert. Dabei es soll für jedes der 25.000 Pkw den Preis schätzen. Daraufhin werden die 25.000 Preisschätzungen mit den zugehörigen 25.000 Ist-Preisen der Testfälle verglichen. Genauer gesagt, der oben erwähnte Korrelationskoeffizient, das sogenannte Bestimmtheitsmaß oder der Score berechnet. Alle sind Kennzahlen der klassischen Statistik.

Golem Akademie
  1. AZ-104 Microsoft Azure Administrator: virtueller Vier-Tage-Workshop
    13.–16. Dezember 2021, virtuell
  2. PowerShell Praxisworkshop: virtueller Vier-Tage-Workshop
    20.–23. Dezember 2021, virtuell
Weitere IT-Trainings

Wenn die vom trainierten Modell geschätzten Preise statistisch betrachtet nahe genug an den realen Ist-Preisen liegen, ist man mit dem trainierten Modell zufrieden. Wenn nicht, liegt es möglicherweise an schlechter Datenqualität, zu geringer Datenmenge - oder die lineare Regression ist in diesem Fall als Machine-Learning-Algorithmus keine gute Wahl, weil die Korrelationen zwischen den Input-Variablen und der Output-Variable möglicherweise nicht linear sind. Natürlich könnte man auch andere Algorithmen für die Regression verwenden, wie beispielsweise Random Forest (ein Algorithmus, der mit Entscheidungsbäumen arbeitet) oder bestimmte neuronale Netze. Welcher Algorithmus besser ist, hängt von mehreren Faktoren ab, unter anderem von

  • der Datenmenge
  • der Datenqualität
  • der Art der Korrelationen (linear, logarithmisch, polynomisch etc.) und
  • den benötigten Hardwareressourcen (Rechenleistung, RAM etc.)

In der Regel wird man mehrere Algorithmen ausprobieren und sich für den entscheiden, dessen Schätzungen mindestens "gut genug" sind, das heißt die Anforderungen erfüllen, und für den zugleich die Kosten (Hardwareressourcen) akzeptabel sind. Manchmal ist der Algorithmus mit den besten Ergebnissen leider zu langsam, das heißt, die Hardwarekosten für mehr Rechenleistung wären zu hoch oder die Dauer des Trainierens wäre zu lang. Eine Nutzen-Kosten-Analyse ist sinnvoll.

Welche Machine-Learning-Algorithmen gibt es?

Wie bereits erwähnt, gibt es eine Vielzahl von Machine-Learning-Algorithmen. Eine Übersicht hat der KI-Experte Abhinav Srivastava erstellt.

Diese Algorithmen können anhand der Art und Weise, wie sie lernen, einer dieser drei Hauptkategorien zugeordnet werden, wie Masashi Sugiyama in seinem Buch "Statistical Reinforcement Learning: Modern Machine Learning Approaches" schreibt:

  • Supervised Learning
  • Unsupervised Learning
  • Reinforcement Learning

Supervised Learning

Bei Algorithmen, die zur Kategorie Supervised Learning zählen, sind die Outputs bei den Trainingsdaten schon verfügbar. Unser Fallbeispiel mit den Autopreisen hat Trainingsdaten, bei denen der Output-Preis (Variable Y) in jedem Datensatz bekannt ist. Die Maschine lernt, indem sie die Korrelationen zwischen den Input-Variablen Xi und der Output-Variablen Y sucht. In manchen Fällen können auch mehrere Output-Variablen Yi existieren. Solche Algorithmen werden hauptsächlich für Regressionen, wie in unserem Pkw-Beispiel, und für Klassifizierungsaufgaben verwendet.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
 Was Regressionen leisten könnenHund oder Katze? 
  1.  
  2. 1
  3. 2
  4. 3
  5. 4
  6. 5
  7.  


mg1993 15. Okt 2018

Der Artikel an für sich ist sehr interessant. Ich selbst studiere Informatik und schreibe...

a user 11. Okt 2018

Nein. Die Rechenkapazität unseres Gehirns schlägt um Welten die aller existierenden...

gelöscht 11. Okt 2018

vielen lieben dank für die ausführliche antwort!

a user 10. Okt 2018

Der Punkt ist ein anderer. Die Umsetzungen sind erst mit heutiger Technik möglich. Aber...

danh 09. Okt 2018

Theoretisch: Bilder einer Frontkamera in trainiertes neuronales Netz rein, am Ende kommen...



Aktuell auf der Startseite von Golem.de
Wemax Go Pro
Mini-Projektor für Reisen strahlt 120-Zoll-Bild an die Wand

Der Wemax Go Pro setzt auf Lasertechnik von Xiaomi. Der Beamer ist klein und kompakt, soll aber ein großes Bild an die Wand strahlen können.

Wemax Go Pro: Mini-Projektor für Reisen strahlt 120-Zoll-Bild an die Wand
Artikel
  1. Snapdragon 8cx Gen 3: Geleaktes Qualcomm-SoC erreicht das Niveau von AMD und Intel
    Snapdragon 8cx Gen 3
    Geleaktes Qualcomm-SoC erreicht das Niveau von AMD und Intel

    In Geekbench wurde der Qualcomm Snapdragon 8cx Gen 3 gesichtet. Er kann sich mit Intel- und AMD-CPUs messen, mit Apples M1 aber wohl nicht.

  2. Air4: Renault 4 als Flugauto neu interpretiert
    Air4
    Renault 4 als Flugauto neu interpretiert

    Der Air4 ist Renaults Idee, wie ein fliegender Renault 4 aussehen könnte. Mit der Drohne wird das 60jährige Jubiläum des Kultautos gefeiert.

  3. MS Satoshi: Die abstruse Geschichte des Bitcoin-Kreuzfahrtschiffs
    MS Satoshi
    Die abstruse Geschichte des Bitcoin-Kreuzfahrtschiffs

    Kryptogeld-Enthusiasten kauften ein Kreuzfahrtschiff und wollten es zum schwimmenden Freiheitsparadies machen. Allerdings scheiterten sie an jeder einzelnen Stelle.
    Von Elke Wittich

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Black Friday Wochenende • LG UltraGear 34GP950G-B 999€ • SanDisk Ultra 3D 500 GB M.2 44€ • Boxsets (u. a. Game of Thrones Blu-ray 79,97€) • Samsung Galaxy S21 128GB 777€ • Premium-Laptops (u. a. Lenovo Ideapad 5 Pro 16" 829€) • MS Surface Pro7+ 888€ • Astro Gaming Headsets [Werbung]
    •  /