• IT-Karriere:
  • Services:

Ein Ausflug zum Online Analytical Processing (OLAP)

In der Business Intelligence ist OLAP eigentlich nebenläufig zum Data-Mining angesiedelt, folgt aber einem ähnlichen Ziel bei ähnlicher Grundlage. Bei OLAP unterscheidet man noch einmal nach der Art, in der die Daten für das System organisiert werden.

Stellenmarkt
  1. Hays AG, Bonn
  2. InnoGames GmbH, Hamburg

Multidimensionales OLAP (MOLAP) organisiert die Daten in Form von einzelnen Datenpunkten, die miteinander verknüpft werden. Hier kommen die Dimensionen aus dem Data Warehouse zum Tragen und ergeben die multidimensionalen Strukturen.

Relationales OLAP (ROLAP) dagegen setzt direkt auf einer relationalen Datenbankstruktur auf, wie sie in Data Warehouses in den meisten Fällen vorliegt. Sowohl die Faktentabellen als auch die dimensionalen Tabellen werden übernommen, dazu werden Tabellen angelegt, die die aggregierten Informationen aus beiden enthalten.

Hybrid OLAP (HOLAP) enthält Anteile beider Vorgehen, also die Vorteile von MOLAP (die schnelleren Zugriffszeiten) und die Verminderung der riesigen Datenmenge, die durch das Ablegen der kompletten Datenstrukturen als einzelne und dann wieder verknüpfte Fakten entstehen würde.

Die Partitionierung kann vertikal oder horizontal erfolgen. Beim vertikalen Partitionieren werden die Abfragekriterien als MOLAP gespeichert, die Detaildaten dazu als ROLAP. Bei horizontalen Partitionierungen werden aktuelle Daten als MOLAP abgelegt, referenzierte ältere jedoch als ROLAP. Es findet also ein Time Slicing statt.

Echtzeittransaktionsverarbeitung und Data-Mining

Soll es ganz aktuell sein, kommt man um Echtzeit nicht herum. Analysen finden dann nicht mehr auf alten, bereits abgelegten Daten statt, wobei "alt" alles ist, was bereits vollständig abgeschlossen ist.

OLTP oder auch Echtzeittransaktionsverarbeitung findet dagegen überall da statt, wo Businessprozesse nicht als Batchverarbeitung ablaufen. Aus Sicht der IT also überall, wo Datensätze zu Transaktionen nicht einer nach dem anderen eingelesen werden, sondern mehrere Transaktionen gleichzeitig laufen und sichergestellt werden muss, dass nur komplette Transaktionen auch persistent in der Datenbank landen, damit ein Datenbestand zu jeder Zeit konsistent ist.

Von Data Mining bis Big Data: Handbuch für die industrielle Praxis

Mit Data-Mining hat das deswegen zu tun, weil Daten aus einer laufenden Transaktion noch nicht außerhalb dieser Transaktion zur Verfügung stehen, aber trotzdem schon für Auswertungen genutzt werden müssen. Im einfachsten Fall geht es darum, den Warenkorbinhalt mit bisherigen Käufen dieser Artikel abzugleichen und aus der Kombination der Artikel, die der Korb beinhaltet, abzuleiten, welche anderen Artikel noch vorgeschlagen werden könnten - oder auch, welche Artikel nicht vorgeschlagen werden sollten.

Die Technik Streaming Event Processing bietet eine Möglichkeit, Daten anzureichern und für das Data-Mining zu nutzen, auch während die eigentliche Transaktion noch läuft und nicht abgeschlossen ist. Man spricht dann von offenen Transaktionen. Streaming Event Processing wird benutzt, um Events abzuspeichern und zur Auswertung bereitzustellen, die die Verkaufsdatenbank nicht interessieren: Ein Artikel wird in den Warenkorb gelegt, aus dem Warenkorb entfernt, Artikel werden genauer angesehen, aber nicht in den Warenkorb gelegt.

Für Data-Mining sind diese Daten wichtig, vor allem, wenn sie dann auch noch mit dem eigentlichen Geschäftsprozess, dem Verkauf - oder im ungünstigeren Fall dem Abbruch - verknüpfbar sind. Man kann zum Beispiel Kunden an einen Artikel erinnern, der schon mal im Warenkorb lag, aber nicht gekauft wurde. Natürlich nicht mit der Aussage, den Kunden genau überwacht zu haben und deshalb zu wissen, dass dieser Kunde sich erst in letzter Sekunde dazu entschieden hat, den Artikel doch nicht zu kaufen. Sondern mit einer höflich formulierten Frage, ob an so einem Artikel wie genau diesem nicht vielleicht Interesse bestehen könnte.

Bitte aktivieren Sie Javascript.
Oder nutzen Sie das Golem-pur-Angebot
und lesen Golem.de
  • ohne Werbung
  • mit ausgeschaltetem Javascript
  • mit RSS-Volltext-Feed
 Data Warehouse und Data MartsAnwendungsfall Prescriptive Analytics 
  1.  
  2. 1
  3. 2
  4. 3
  5. 4
  6.  


Anzeige
Top-Angebote
  1. mit Rabattcode "PKAUFEN"
  2. (u. a. Battlefield- & Star-Wars-Spiele von EA günstiger (u. a. Star Wars Battlefront 2 für 7...
  3. (u. a. Fortnite - The Last Laugh Bundle DLC (PS4 Download Code) für 19,90€, ARK: Survival...

richtchri 24. Jan 2021 / Themenstart

Das ist eine einfache Segmentierung von Kundenprofilen mittels weniger Datenpunkte. Kurz...

Joblow 21. Jan 2021 / Themenstart

Haha ... jetzt habe ich doch tatsächlich Genetallotion gelesen!

silentCarl 21. Jan 2021 / Themenstart

Der Artikel geht irgendwie im Business Intelligence aber ansonsten ist das nur mal eben...

Kommentieren


Folgen Sie uns
       


Surface Duo - Fazit

Das Surface Duo ist Microsofts erstes Smartphone seit Jahren - und ein ungewöhnliches dazu. Allerdings ist das Gerät in Deutschland viel zu teuer.

Surface Duo - Fazit Video aufrufen
    •  /