Ein Ausflug zum Online Analytical Processing (OLAP)

In der Business Intelligence ist OLAP eigentlich nebenläufig zum Data-Mining angesiedelt, folgt aber einem ähnlichen Ziel bei ähnlicher Grundlage. Bei OLAP unterscheidet man noch einmal nach der Art, in der die Daten für das System organisiert werden.

Stellenmarkt
  1. IT-Systemadministrator (m/w/d)
    GRAMMER System GmbH, Zwickau
  2. Java-Entwickler*in
    Atruvia AG, Karlsruhe, München, Münster
Detailsuche

Multidimensionales OLAP (MOLAP) organisiert die Daten in Form von einzelnen Datenpunkten, die miteinander verknüpft werden. Hier kommen die Dimensionen aus dem Data Warehouse zum Tragen und ergeben die multidimensionalen Strukturen.

Relationales OLAP (ROLAP) dagegen setzt direkt auf einer relationalen Datenbankstruktur auf, wie sie in Data Warehouses in den meisten Fällen vorliegt. Sowohl die Faktentabellen als auch die dimensionalen Tabellen werden übernommen, dazu werden Tabellen angelegt, die die aggregierten Informationen aus beiden enthalten.

Hybrid OLAP (HOLAP) enthält Anteile beider Vorgehen, also die Vorteile von MOLAP (die schnelleren Zugriffszeiten) und die Verminderung der riesigen Datenmenge, die durch das Ablegen der kompletten Datenstrukturen als einzelne und dann wieder verknüpfte Fakten entstehen würde.

Golem Akademie
  1. Masterclass: Data Science mit Pandas & Python
    22.-23. November 2021, online
  2. IT-Fachseminare der Golem Akademie
    Live-Workshops zu Schlüsselqualifikationen
  3. 1:1-Videocoaching mit Golem Shifoo
    Berufliche Herausforderungen meistern
Weitere IT-Trainings

Die Partitionierung kann vertikal oder horizontal erfolgen. Beim vertikalen Partitionieren werden die Abfragekriterien als MOLAP gespeichert, die Detaildaten dazu als ROLAP. Bei horizontalen Partitionierungen werden aktuelle Daten als MOLAP abgelegt, referenzierte ältere jedoch als ROLAP. Es findet also ein Time Slicing statt.

Echtzeittransaktionsverarbeitung und Data-Mining

Soll es ganz aktuell sein, kommt man um Echtzeit nicht herum. Analysen finden dann nicht mehr auf alten, bereits abgelegten Daten statt, wobei "alt" alles ist, was bereits vollständig abgeschlossen ist.

OLTP oder auch Echtzeittransaktionsverarbeitung findet dagegen überall da statt, wo Businessprozesse nicht als Batchverarbeitung ablaufen. Aus Sicht der IT also überall, wo Datensätze zu Transaktionen nicht einer nach dem anderen eingelesen werden, sondern mehrere Transaktionen gleichzeitig laufen und sichergestellt werden muss, dass nur komplette Transaktionen auch persistent in der Datenbank landen, damit ein Datenbestand zu jeder Zeit konsistent ist.

Von Data Mining bis Big Data: Handbuch für die industrielle Praxis

Mit Data-Mining hat das deswegen zu tun, weil Daten aus einer laufenden Transaktion noch nicht außerhalb dieser Transaktion zur Verfügung stehen, aber trotzdem schon für Auswertungen genutzt werden müssen. Im einfachsten Fall geht es darum, den Warenkorbinhalt mit bisherigen Käufen dieser Artikel abzugleichen und aus der Kombination der Artikel, die der Korb beinhaltet, abzuleiten, welche anderen Artikel noch vorgeschlagen werden könnten - oder auch, welche Artikel nicht vorgeschlagen werden sollten.

Die Technik Streaming Event Processing bietet eine Möglichkeit, Daten anzureichern und für das Data-Mining zu nutzen, auch während die eigentliche Transaktion noch läuft und nicht abgeschlossen ist. Man spricht dann von offenen Transaktionen. Streaming Event Processing wird benutzt, um Events abzuspeichern und zur Auswertung bereitzustellen, die die Verkaufsdatenbank nicht interessieren: Ein Artikel wird in den Warenkorb gelegt, aus dem Warenkorb entfernt, Artikel werden genauer angesehen, aber nicht in den Warenkorb gelegt.

Für Data-Mining sind diese Daten wichtig, vor allem, wenn sie dann auch noch mit dem eigentlichen Geschäftsprozess, dem Verkauf - oder im ungünstigeren Fall dem Abbruch - verknüpfbar sind. Man kann zum Beispiel Kunden an einen Artikel erinnern, der schon mal im Warenkorb lag, aber nicht gekauft wurde. Natürlich nicht mit der Aussage, den Kunden genau überwacht zu haben und deshalb zu wissen, dass dieser Kunde sich erst in letzter Sekunde dazu entschieden hat, den Artikel doch nicht zu kaufen. Sondern mit einer höflich formulierten Frage, ob an so einem Artikel wie genau diesem nicht vielleicht Interesse bestehen könnte.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
 Data Warehouse und Data MartsAnwendungsfall Prescriptive Analytics 
  1.  
  2. 1
  3. 2
  4. 3
  5. 4
  6.  


richtchri 24. Jan 2021

Das ist eine einfache Segmentierung von Kundenprofilen mittels weniger Datenpunkte. Kurz...

Joblow 21. Jan 2021

Haha ... jetzt habe ich doch tatsächlich Genetallotion gelesen!

silentCarl 21. Jan 2021

Der Artikel geht irgendwie im Business Intelligence aber ansonsten ist das nur mal eben...



Aktuell auf der Startseite von Golem.de
Klimaforscher
Das Konzept der Klimaneutralität ist eine gefährliche Falle

Mit der Entnahme von CO2 in den nächsten Jahrzehnten netto auf null Emissionen zu kommen, klingt nach einer guten Idee. Ist es aber nicht, sagen Klimaforscher.
Von James Dyke, Robert Watson und Wolfgang Knorr

Klimaforscher: Das Konzept der Klimaneutralität ist eine gefährliche Falle
Artikel
  1. Elektroauto: Xiaomis Autoproduktion startet Anfang 2024
    Elektroauto
    Xiaomis Autoproduktion startet Anfang 2024

    2024 sollen erste Elektrofahrzeuge von Xiaomi auf den Markt kommen - also etwas später als zunächst gedacht.

  2. M1 Pro/Max: Dieses Apple Silicon ist gigantisch
    M1 Pro/Max
    Dieses Apple Silicon ist gigantisch

    Egal ob AMD-, Intel- oder Nvidia-Hardware: Mit dem M1 Pro und dem M1 Max schickt sich Apple an, die versammelte Konkurrenz zu düpieren.
    Eine Analyse von Marc Sauter

  3. Werbeversprechen kassiert: Teslas Solarschindeln sind doch nicht so stabil
    Werbeversprechen kassiert
    Teslas Solarschindeln sind doch nicht so stabil

    Tesla hat die Website zu seinen Solarschindeln aktualisiert. Die Behauptung, dass diese dreimal stärker als Standardschindeln sind, wurde fallengelassen.

Du willst dich mit Golem.de beruflich verändern oder weiterbilden?
Zum Stellenmarkt
Zur Akademie
Zum Coaching
  • Schnäppchen, Rabatte und Top-Angebote
    Die besten Deals des Tages
    Daily Deals • Cyber Week: Bis zu 16% auf SSDs & RAM von Adata & bis zu 30% auf Alternate • 3 Spiele für 49€: PC, PS5 uvm. • Switch OLED 369,99€ • 6 Blu-rays für 40€ • MSI 27" Curved WQHD 165Hz HDR 479€ • Chromebooks zu Bestpreisen • Alternate (u. a. Team Group PCIe-4.0-SSD 1TB 152,90€) [Werbung]
    •  /