Für Fortgeschrittene: Parameter-Optimierung via Flow-Programmierung

In der Praxis sind die Herausforderungen zumeist kniffliger, weshalb man oft verschiedene Klassifikationsalgorithmen testen wird. Mit Knime ist das ziemlich einfach und genau deshalb ist es für Rapid Prototyping auch so interessant. Denn es müssen lediglich der Decision Tree Learner und der Decision Tree Predictor gegen andere Nodes ausgetauscht werden.

Stellenmarkt
  1. Solution Adoption Manager / Technical Product Owner (m/f/d) Contract Applications
    Vorwerk Services GmbH, Düsseldorf, Wuppertal
  2. Aufbau des Forschungs- und Technologiezentrums der Universität Passau zur Digitalen Sicherheit
    Universität Passau, Passau
Detailsuche

Jedoch können die meisten Klassifikationsalgorithmen auch durch eine Parametrierung verbessert werden, was selbst der recht einfache Decision Tree Learner anbietet. Nur: Woher weiß man, wie die Algorithmen parametriert werden müssen?

Der Trick ist, die 80 Prozent der Eingangsdaten noch einmal in einen echten Trainingsdatensatz und einen Validierungsdatensatz zu unterteilen. So kann die Parametrierung des Klassifikators verändert, dieser trainiert und auf den Validierungsdaten bewertet werden.

Anschließend verändert man wieder die Parametrierung und wiederholt das, bis die Performance auf den Validierungsdaten zufriedenstellend ist. Das klingt nach einer Menge Arbeit und ehrlicherweise ist es das auch.

Golem Karrierewelt
  1. Adobe Photoshop Aufbaukurs: virtueller Zwei-Tage-Workshop
    02./03.06.2022, Virtuell
  2. Microsoft 365 Security: virtueller Drei-Tage-Workshop
    29.06.-01.07.2022, Virtuell
Weitere IT-Trainings

Hier hilft Knime aber weiter. Durch einen Rechtsklick auf einen Node und die Wahl der Option Show Flow Variable Ports werden diese speziellen Ports aktiviert und erscheinen als kleine, rote Kugeln am Node. Diese Ports können ebenfalls zwischen Nodes verbunden werden.

Das Besondere ist, dass die Daten, die an diesen Ports anliegen, im Konfigurationsdialog eines Nodes referenziert werden können. So ist es möglich, die Konfiguration des Nodes dynamisch während der Workflow-Ausführung zu verändern, indem die referenzierten Daten verändert werden.

Werden nun zusätzlich noch über File > Install KNIME Extensions... die Knime Optimization Extension und die Knime Weka Data Mining Integration (3.7) Extension installiert, kann die Parameter-Optimierung komplett automatisiert werden.

Codeless Deep Learning with KNIME: Build, train, and deploy various deep neural network architectures using KNIME Analytics Platform

Dabei verändert der im Screenshot gezeigte Flow die Parametrierung über einen Hillclimber-Optimierungsalgorithmus und durchläuft eine Schleife mehrmals, bei der er jedes Mal die Trainings- und Validierungsdatensätze zufällig neu zusammenstellt, den Klassifikator mit der aktuellen Parametrierung trainiert und evaluiert.

Da die Performance zusammen mit der Parametrierung protokolliert wird, kann am Ende aus der erzeugten Übersicht einfach die beste Parametrierung ausgewählt werden.

  • Knime-Startbildschirm nach dem Programmstart (Screenshot: Andreas Meier)
  • Konfigurationsdialog des CSV Readers (Screenshot: Andreas Meier)
  • Konfiguration des Column Rename Nodes zur sinnvollen Benennung der Spalten (Screenshot: Andreas Meier)
  • Konfiguration des Color Managers zur Einfärbung der Pflanzenart-Klassen (Screenshot: Andreas Meier)
  • Die Scatter-Matrix zeigt jede Dimensionskombination, ordnet die Datenreihen entsprechend zu und färbt die Datenpunkte anhand der Label-Farbe. (Screenshot: Andreas Meier)
  • Konfiguration des Partitioning Node (Screenshot: Andreas Meier)
  • Teil-Flow, der einen Entscheidungsbaum trainiert und evaluiert (Screenshot: Andreas Meier)
  • Vorhersagegüte des Entscheidungsbaums auf den Testdaten (Screenshot: Andreas Meier)
  • Gelernter Entscheidungsbaum für das Iris flower data set (Screenshot: Andreas Meier)
  • Flow-Programmierung zur Parameter-Optimierung für einen Klassifikator (Screenshot: Andreas Meier)
Flow-Programmierung zur Parameter-Optimierung für einen Klassifikator (Screenshot: Andreas Meier)

Dieses Tutorial hat hoffentlich den Einstieg in Knime erleichtert und Lust auf mehr geweckt. Knime ist eine leistungsstarke, flexible und modulare Plattform für alles rund um Daten und ermöglicht über seinen Low-Code-Ansatz selbst Einsteigern den Aufbau von Workflows für Anwendungen aus dem Bereich Data Science und maschinelles Lernen.

Profis können über Erweiterungen, Programmierschnittstellen und die Flow-Programmierung die Limitierungen des Low-Code-Prinzips aufheben und leistungsfähige Prototypen zur Verarbeitung von Daten aufsetzen.

Andreas Meier beschäftigt sich seit über 20 Jahren mit Künstlicher Intelligenz (KI) und verantwortet heute KI-Anwendungen bei einem Automobilhersteller.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
 Klassifikator trainieren und evaluieren
  1.  
  2. 1
  3. 2
  4. 3
  5. 4


Aktuell auf der Startseite von Golem.de
Liberty Lifter
US-Militär lässt ein eigenes Ekranoplan entwickeln

In den 1960er Jahren schockten die Sowjets den Westen mit dem Kaspischen Seemonster. Die Darpa will ein eigenes, besseres Bodeneffektfahrzeug bauen.

Liberty Lifter: US-Militär lässt ein eigenes Ekranoplan entwickeln
Artikel
  1. Abo: Spielebranche streitet über Game Pass
    Abo
    Spielebranche streitet über Game Pass

    Nach Kritik von Sony gibt es mehr Stimmen aus der Spielebranche, die Game Pass problematisch finden - aber auch klares Lob für das Abo.

  2. Microsoft: Der Android-App-Store für Windows 11 kommt nach Deutschland
    Microsoft
    Der Android-App-Store für Windows 11 kommt nach Deutschland

    Build 2022 Der Microsoft Store soll noch attraktiver werden. So können Kunden ihre Apps künftig ohne lange Wartezeiten direkt veröffentlichen.

  3. Dev Box: Die schnelle und einfache Entwicklungmaschine aus der Cloud
    Dev Box
    Die schnelle und einfache Entwicklungmaschine aus der Cloud

    Build 2022Das Einrichten einzelner Rechner zur Entwicklung kann viel Aufwand machen. Mit der Dev Box aus der Cloud will Microsoft das vereinfachen.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Xbox Series X bestellbar • Samsung SSD 1TB 79€ • LG OLED TV 77" 56% günstiger: 1.099€ • Alternate (u. a. Cooler Master Curved Gaming-Monitor 34" UWQHD 144 Hz 459€) • Sony-Fernseher bis zu 47% günstiger • Cyber Week: Alle Deals freigeschaltet • Samsung schenkt 19% MwSt.[Werbung]
    •  /