• IT-Karriere:
  • Services:

Was Regressionen leisten können

Manchmal werden Korrelationen auch falsch interpretiert: Bei Heranwachsenden gibt es wie beschrieben eine positive Korrelation zwischen dem Intelligenzquotienten und der Schuhgröße. Es handelt sich aber um eine sogenannte Scheinkorrelation, weil eine dritte Variable - das Alter nämlich - hier ausschlaggebend ist. Bei Heranwachsenden nimmt der IQ mit dem Alter zu.

Stellenmarkt
  1. OEDIV KG, Bielefeld
  2. Vodafone GmbH, Düsseldorf

Regressionen sind mit Korrelationen nah verwandt. Während jedoch Korrelationen Zusammenhänge von Variablen beschreiben, versuchen Regressionen, anhand der Zusammenhänge den Wert einer Variablen abhängig von den anderen Variablen statistisch bestmöglich zu schätzen. Sie werden verwendet, um Prognosen beziehungsweise Schätzungen bei neuen Fällen zu machen. Korrelationen beschreiben Zusammenhänge bei bereits existierenden Fällen. Ein Beispiel ist die Anzahl von Sonnenstunden pro Tag und der sich daraus ergebende Energie-Output von Solarzellen. Eine Korrelation wäre hier: Je mehr Sonnenstunden, desto höher der Output. Das lässt sich mit einer statistischen Kennzahl, dem sogenannten Korrelationskoeffizienten, beschreiben. Eine Regression wäre es, wenn der Auftrag lautete: Schätze den Output, wenn es fünf Sonnenstunden pro Tag gäbe.

Korrelationen oder Regressionen zu finden und sie für Klassifizierungs- oder Prognosezwecke zu nutzen, ist auch Aufgabe von neuronalen Netzen, die zwar strukturell das Netz von Neuronen und Synapsen im menschlichen Gehirn nachahmen, letztlich aber ebenfalls nur mit statistischen Wahrscheinlichkeiten beziehungsweise Gewichtungsfaktoren und Aktivierungsniveaus arbeiten. Obwohl der anatomische Aufbau des menschlichen Gehirns gut bekannt ist und elektrische Ströme gemessen werden können, weiß noch niemand wirklich, wie genau Gedanken entstehen, vom Bewusstsein ganz zu schweigen.

Wenn das künstliche Netz von Neuronen und Synapsen eine Vielzahl von Schichten hat, die oft spezielle Funktionen haben, spricht man von einem Deep Learning Neural Network. Es gibt viele unterschiedliche Deep Learning Neural Networks. Und es gibt viele unterschiedliche Deep Learning Neural Networks, die für bestimmte Aufgaben optimiert sind. Für die Bilderkennung werden zum Beispiel häufig sogenannte Convolutional Neural Networks (CNNs) verwendet, die aus mindestens drei unterschiedlichen Arten von Schichten bestehen, von denen sich manche Schichten öfters abwechseln oder wiederholen. Am Ende stehen wieder Wahrscheinlichkeiten, zum Beispiel: Das fotografierte Tier ist zu 95 Prozent ein Hund, zu vier Prozent eine Katze und zu einem Prozent Sonstiges.

Machine Learning ist ein Sammelbegriff für eine große Anzahl unterschiedlicher Algorithmen. Einige dieser Algorithmen zählen zu der Kategorie der bereits erwähnten neuronalen Netze, die immer wieder in den Medien genannt werden und für bestimmte Aufgaben besonders gut geeignet sind.

Doch nicht immer braucht man komplizierte neuronale Netze und manchmal sind sie nicht die beste Wahl. Es gibt auch Algorithmen, die viele von uns schon kennen, ohne sich bewusst zu sein, dass sie zu Machine Learning gezählt werden. Sehen wir uns folgendes Beispiel an.

Fallbeispiel von Machine Learning: Preis eines Pkw schätzen

Der Preis eines Pkw hängt von sehr vielen Input-Variablen ab, wie der Marke, dem Modell, dem Kilometerstand, dem Datum der Inbetriebnahme, der Motorleistung, dem Zustand und Ausstattungsmerkmalen wie dem Autoradio, der Navigation, der Klimaanlage und der Einparkhilfe. Diese Input-Variablen werden als X1, X2, X3, … Xn bezeichnet. Es gibt nur eine Output-Variable Y: den Preis.

Wie lernt nun die Maschine?

Zunächst benötigen wir zwei Dinge: bereits existierende Daten und einen geeigneten Machine-Learning-Algorithmus.

Je mehr Daten wir haben und je besser die Datenqualität ist, desto besser kann der Computer lernen, Preise zu schätzen. Angenommen, wir haben von 100.000 unterschiedlichen Fahrzeugen all diese Input-Variablen und die zugehörigen Preise der Fahrzeuge. Diese können zum Beispiel in einer Datenbanktabelle vorliegen. Von diesen 100.000 Fällen wird ein Teil, beispielsweise 75.000 Fälle, zufällig gewählt und für das Trainieren der Maschine verwendet. Die verbleibenden 25.000 Fälle werden für das Testing aufbewahrt. Also für die Überprüfung, wie nahe die vom Machine Learning gemachten Preisschätzungen der Realität kommen.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
 Künstliche Intelligenz: Wie Computer lernenDer Algorithmus trainiert 
  1.  
  2. 1
  3. 2
  4. 3
  5. 4
  6. 5
  7.  


Anzeige
Top-Angebote
  1. (u. a. be quiet! PURE BASE 500 Window Tower-Gehäuse für 65,90€, Sandisk Extreme PRO 128GB...
  2. (u. a. Fire TV Stick (2020) mit Alexa-Sprachfernbedienung (mit TV-Steuerung) und Dolby Atmos für...
  3. 1.350€
  4. (u. a. Zotac Gaming GeForce RTX 3080 Trinity für 1.548,41€, Gigabyte GeForce RTX 3080 Eagle OC...

mg1993 15. Okt 2018

Der Artikel an für sich ist sehr interessant. Ich selbst studiere Informatik und schreibe...

a user 11. Okt 2018

Nein. Die Rechenkapazität unseres Gehirns schlägt um Welten die aller existierenden...

tunnelblick 11. Okt 2018

vielen lieben dank für die ausführliche antwort!

a user 10. Okt 2018

Der Punkt ist ein anderer. Die Umsetzungen sind erst mit heutiger Technik möglich. Aber...

danh 09. Okt 2018

Theoretisch: Bilder einer Frontkamera in trainiertes neuronales Netz rein, am Ende kommen...


Folgen Sie uns
       


    •  /