Data Science: Mit Machine Learning komplizierte Zeitreihen managen

Maschinelles Lernen ist ein Buzzword, das auf vielerlei Einsatzgebiete anwendbar ist. Die grundlegende Systematik dahinter ist recht einfach erklärt: Man nehme einen gesammelten Datensatz, bereite diesen auf, bereinige ihn von Fehlern und filtere mit diversen Frameworks Muster und Zusammenhänge heraus. Aus den Verknüpfungen lässt sich ein mathematisches Modell beschreiben, das man danach auch für weitere Datenpunkte verwenden kann, um so etwa Vorhersagen zu treffen.
Die Datensätze können auf zwei Arten aufgebaut sein: als unabhängige Instanzen oder als zeitlich abhängige Instanzen innerhalb des Datensatzes. Mit der zeitlichen Komponente gibt es einige Besonderheiten, die Data Scientists beachten müssen. Auf diese Besonderheiten wird in diesem Artikel ausführlich eingegangen, um so ein Verständnis zu schaffen, wie man mit Zeitreihen im Data-Science-Kontext gut umgehen kann, um daraus einen Mehrwert für das Unternehmen zu schaffen. Denn auf Zeitreihen, also Aufzeichnungen über die Zeit, trifft man im unternehmerischen Kontext sehr häufig, unter anderem bei Produktionssensoren, Verkäufen, Wetteraufzeichnungen.