OLAP (Online Analytical Processing) beschreibt eine Anwendungsvariante von Analyse-Software, mit der Manager, Führungskräfte und Analysten Einsicht in spezifische und (untereinander) kombinierte Datensätze nehmen können und zählt neben dem Data Mining zu den analytischen Informationssystemen. Damit ergänzt OLAP das sonst sehr statische Berichtswesen innerhalb von Unternehmen durch eine interaktive, multidimensionale Analyse von internen und externen Unternehmensdaten.
Online Analytical Processing ist eine Form von mehrdimensionaler Datenauswertung, weil bei einer Anfrage durch einen Benutzer i.d.R. über mehrere Dimensionen der Daten (z.B. Zeitbezug, Ortsbezug, Themenbezug) eine Auswertung der Anfrage vorgenommen wird. Dazu muss ein Benutzer jedoch im Vorwege wissen, welche Dimensionen er für die Anfrage über ein OLAP-System auswerten möchte.
OLAP-Systeme beziehen ihre Datenbestände entweder aus einem Data Warehouse bzw. Data Mart oder aus relationalen Datenbanken von operativen Anwendungssystemen.
Inhalt
Architekturen von OLAP
OLAP wird in drei grundlegende Architekturen unterteilt:
- ROLAP (relationales OLAP)
- MOLAP (multidimensionales OLAP)
- HOLAP (hybrides OLAP)
ROLAP (relationales OLAP)
Eigenschaften:
- Datensätze werden in Relationen (Tabellen) gespeichert bzw. organisiert
- ROLAP-Systeme bauen i.d.R. auf SQL-Datenbanksystemen auf
- ROLAP-Systeme sind einfach realisierbar und skalierbar
- Generierung von ROLAP-Datenwürfeln
- Aufgrund der relationalen Struktur Performance-Nachteile gegenüber MOLAP-Systemen bei Abfragen
- Update-Aktionen sind performanter als bei MOLAP-Systemen
MOLAP (multidimensionales OLAP)
Eigenschaften:
- Datenspeicherung erfolgt in multidimensionalen Arrays
- Daten werden aus einem Data Warehouse auf einen MOLAP-Server geladen
- Abfragen und Ausgaben erfolgen über OLAP-Frontent
- Anfrage-Navigation im MOLAP-Würfel aufgrund von festgelegten Adressinformationen sehr performant
- Update-Performance beschränkt
- Begrenzte Skalierbarkeit aufgrund proprietärer Datenbanktechnologien
HOLAP (hybrides OLAP)
Das hybride OLAP ist eine Mischform aus relationalen und multidimensionalen OLAP-Systemen, bei der die Datenextraktion sowohl über Data Warehouses als auch über operative Quellsysteme in die OLAP-Server geladen wird. Je nach Konfiguration der HOLAP-Variante verschieben sich die Performance-Eigenschaften hin zu MOLAP oder ROLAP.
Bekannte OLAP Dimensionen
- Zeit bzw. zeitliche Zusammenhänge (Jahr, Quartal, Monat, Woche, Tag, Uhrzeit etc.)
- Regionenstruktur (regionale Zusammenhänge)
- Maßeinheiten (Währung, Stückzahlen)
- Themenstruktur (Thema, Branche, Interesse)
- Produktstruktur (Produktgruppen, Artikelgruppen etc.)
- Unternehmerische Kennziffern (Soll, Plan, Ist)
- Kundengruppen, Altersgruppen
Datenabfragen in OLAP
Die Abfrage von Daten läuft in OLAP vergleichbar mit einer klassischen SQL-Abfrage über relationale Datenbanken, die in Abhängigkeit vom SELECT-Statement eine definierte Ergebnismenge ausgibt.
Eine SQL-Abfrage ist jedoch abhängig von der jeweils angesprochenen Kombination aus Tupeln bzw. Tabellen. In einem OLAP-System wird lediglich die Dimension angesprochen.
Beispiel:
Dimensionen:
- Region
- Region A
- Region A1
- Region A2
- Region B
- Region B1
- Region B2
- Region A
- Monat
- Januar
- 1.
- 2.
- 3.
- …
- Februar
- 1.
- 2.
- 3.
- …
- Januar
Anfrage (OLAP):
Ergebnis = DB.Read(Umsatz, A1, Januar) ➞ Gibt den Umsatz für die Region im Januar aus.
Navigation in OLAP
Der mehrdimensionale OLAP-Würfel ist („OLAP Cube“) ist die Ausgangsbasis für die Navigation innerhalb verschiedener Dimensionen. Für die Navigation in OLAP existieren mehrere Grundoperationen:
- Dicing: Erzeug einen kleineren Würfel mit einem Teilvolumen des Ausgangswürfels durch Einschränkung der Dimensionen
- Slicing: Schneidet „Scheiben“ aus dem Datenwürfel aus
- Drill-Down / Roll-Down: Erhöht den Detailgrad von Aggregationen eines Informationsobjektes durch den Wechsel in eine tiefere Konsolidierungsebene
- Drill-Up / Roll-Up: Verringert den Detailgrad von Aggregationen eines Informationsobjektes durch den Wechsel in eine höhere Konsolidierungsebene
- Drill-Across: Betrachtet Elemente derselben Konsolidierungsebene (z.B. anderes Jahr, andere Region, anderes Produkt)
- Drill-In (Merge): Verschmilzt Konsolidierungsebenen und verringert den Detailgrad
- Pivoting: Dreht den Datenwürfel (Rotation), sodass eine andere Dimension ausgewählt wird
- Split: Teilt einen Wert nah mehreren Dimensionen auf, um die Detailtiefe zu erhöhen.