Was Regressionen leisten können

Manchmal werden Korrelationen auch falsch interpretiert: Bei Heranwachsenden gibt es wie beschrieben eine positive Korrelation zwischen dem Intelligenzquotienten und der Schuhgröße. Es handelt sich aber um eine sogenannte Scheinkorrelation, weil eine dritte Variable - das Alter nämlich - hier ausschlaggebend ist. Bei Heranwachsenden nimmt der IQ mit dem Alter zu.

Stellenmarkt
  1. IT-Sicherheitsbeauftragter (m/w/d)
    MVV Energy Solutions GmbH, Mannheim
  2. IT System Administrator (m/w/d)
    Gesellschaft für Grund- und Hausbesitz mbH, Heidelberg
Detailsuche

Regressionen sind mit Korrelationen nah verwandt. Während jedoch Korrelationen Zusammenhänge von Variablen beschreiben, versuchen Regressionen, anhand der Zusammenhänge den Wert einer Variablen abhängig von den anderen Variablen statistisch bestmöglich zu schätzen. Sie werden verwendet, um Prognosen beziehungsweise Schätzungen bei neuen Fällen zu machen. Korrelationen beschreiben Zusammenhänge bei bereits existierenden Fällen. Ein Beispiel ist die Anzahl von Sonnenstunden pro Tag und der sich daraus ergebende Energie-Output von Solarzellen. Eine Korrelation wäre hier: Je mehr Sonnenstunden, desto höher der Output. Das lässt sich mit einer statistischen Kennzahl, dem sogenannten Korrelationskoeffizienten, beschreiben. Eine Regression wäre es, wenn der Auftrag lautete: Schätze den Output, wenn es fünf Sonnenstunden pro Tag gäbe.

Korrelationen oder Regressionen zu finden und sie für Klassifizierungs- oder Prognosezwecke zu nutzen, ist auch Aufgabe von neuronalen Netzen, die zwar strukturell das Netz von Neuronen und Synapsen im menschlichen Gehirn nachahmen, letztlich aber ebenfalls nur mit statistischen Wahrscheinlichkeiten beziehungsweise Gewichtungsfaktoren und Aktivierungsniveaus arbeiten. Obwohl der anatomische Aufbau des menschlichen Gehirns gut bekannt ist und elektrische Ströme gemessen werden können, weiß noch niemand wirklich, wie genau Gedanken entstehen, vom Bewusstsein ganz zu schweigen.

Wenn das künstliche Netz von Neuronen und Synapsen eine Vielzahl von Schichten hat, die oft spezielle Funktionen haben, spricht man von einem Deep Learning Neural Network. Es gibt viele unterschiedliche Deep Learning Neural Networks. Und es gibt viele unterschiedliche Deep Learning Neural Networks, die für bestimmte Aufgaben optimiert sind. Für die Bilderkennung werden zum Beispiel häufig sogenannte Convolutional Neural Networks (CNNs) verwendet, die aus mindestens drei unterschiedlichen Arten von Schichten bestehen, von denen sich manche Schichten öfters abwechseln oder wiederholen. Am Ende stehen wieder Wahrscheinlichkeiten, zum Beispiel: Das fotografierte Tier ist zu 95 Prozent ein Hund, zu vier Prozent eine Katze und zu einem Prozent Sonstiges.

Golem Akademie
  1. First Response auf Security Incidents: Ein-Tages-Workshop
    4. März 2022, Virtuell
  2. Netzwerktechnik Kompaktkurs: virtueller Fünf-Tage-Workshop
    6.–10. Dezember 2021, virtuell
Weitere IT-Trainings

Machine Learning ist ein Sammelbegriff für eine große Anzahl unterschiedlicher Algorithmen. Einige dieser Algorithmen zählen zu der Kategorie der bereits erwähnten neuronalen Netze, die immer wieder in den Medien genannt werden und für bestimmte Aufgaben besonders gut geeignet sind.

Doch nicht immer braucht man komplizierte neuronale Netze und manchmal sind sie nicht die beste Wahl. Es gibt auch Algorithmen, die viele von uns schon kennen, ohne sich bewusst zu sein, dass sie zu Machine Learning gezählt werden. Sehen wir uns folgendes Beispiel an.

Fallbeispiel von Machine Learning: Preis eines Pkw schätzen

Der Preis eines Pkw hängt von sehr vielen Input-Variablen ab, wie der Marke, dem Modell, dem Kilometerstand, dem Datum der Inbetriebnahme, der Motorleistung, dem Zustand und Ausstattungsmerkmalen wie dem Autoradio, der Navigation, der Klimaanlage und der Einparkhilfe. Diese Input-Variablen werden als X1, X2, X3, … Xn bezeichnet. Es gibt nur eine Output-Variable Y: den Preis.

Wie lernt nun die Maschine?

Zunächst benötigen wir zwei Dinge: bereits existierende Daten und einen geeigneten Machine-Learning-Algorithmus.

Je mehr Daten wir haben und je besser die Datenqualität ist, desto besser kann der Computer lernen, Preise zu schätzen. Angenommen, wir haben von 100.000 unterschiedlichen Fahrzeugen all diese Input-Variablen und die zugehörigen Preise der Fahrzeuge. Diese können zum Beispiel in einer Datenbanktabelle vorliegen. Von diesen 100.000 Fällen wird ein Teil, beispielsweise 75.000 Fälle, zufällig gewählt und für das Trainieren der Maschine verwendet. Die verbleibenden 25.000 Fälle werden für das Testing aufbewahrt. Also für die Überprüfung, wie nahe die vom Machine Learning gemachten Preisschätzungen der Realität kommen.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
 Künstliche Intelligenz: Wie Computer lernenDer Algorithmus trainiert 
  1.  
  2. 1
  3. 2
  4. 3
  5. 4
  6. 5
  7.  


mg1993 15. Okt 2018

Der Artikel an für sich ist sehr interessant. Ich selbst studiere Informatik und schreibe...

a user 11. Okt 2018

Nein. Die Rechenkapazität unseres Gehirns schlägt um Welten die aller existierenden...

gelöscht 11. Okt 2018

vielen lieben dank für die ausführliche antwort!

a user 10. Okt 2018

Der Punkt ist ein anderer. Die Umsetzungen sind erst mit heutiger Technik möglich. Aber...

danh 09. Okt 2018

Theoretisch: Bilder einer Frontkamera in trainiertes neuronales Netz rein, am Ende kommen...



Aktuell auf der Startseite von Golem.de
Prozessoren
Intel lagert zehn Jahre alte Hardware in geheimem Lagerhaus

Tausende ältere CPUs und andere Hardware lagern bei Intel in einem Lagerhaus in Costa Rica. Damit lassen sich Probleme exakt nachstellen.

Prozessoren: Intel lagert zehn Jahre alte Hardware in geheimem Lagerhaus
Artikel
  1. Zu wenig Triebwerke: Musk warnt vor SpaceX-Pleite
    Zu wenig Triebwerke
    Musk warnt vor SpaceX-Pleite

    Elon Musk sieht sich der nächsten "Produktionshölle" ausgesetzt. Dieses Mal stockt die Fertigung im Raumfahrtunternehmen SpaceX.

  2. Gif-Anbieter: Meta soll zum Verkauf von Giphy gezwungen werden
    Gif-Anbieter
    Meta soll zum Verkauf von Giphy gezwungen werden

    Die Übernahme des Gif-Dienstes Giphy soll Konkurrenten von Facebook, Instagram und Co. unter Druck setzen, argumentiert die britische Kartellbehörde.

  3. Fleet: Jetbrains bringt neuen leichtgewichtigen Editor
    Fleet
    Jetbrains bringt neuen leichtgewichtigen Editor

    Die IDE-Spezialisten von Jetbrains reagieren auf den Druck durch Visual Studio Code. Zudem gibt es nun Remote-Entwicklung.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Nur noch heute: Bis zu 75% auf Switch-Spiele • AOC 31,5" Curved WQHD 165Hz 289,90€ • Gaming-Sale bei MediaMarkt • G.Skill 64GB Kit DDR4-3800 319€ • Bis zu 300€ Direktabzug: u. a. TVs, Laptops • WD MyBook HDD 18TB 329€ • Switch OLED 359,99€ • Xbox Series S 275,99€ [Werbung]
    •  /