This post is also available in: Englisch

Aufrufe: 10957

Dieser Artikel ist zuerst auf dem Blog von IT-Logix erschienen

Im Beitrag Was ist Power BI Dataflow hat mein ehemaliger Arbeitskollege Alex bereits einen kleinen Überblick über diese neue Möglichkeit der Datenaufbereitung und -speicherung in Power BI gegeben. Hier auf meinem persönlichen Blog habe ich auch bereits einmal eine kleine Auslegeordnung vorgenommen.

Der heutige Beitrag dreht sich um die Frage, wie denn Anwendungsfälle Power BI Dataflows  aussehen könnten.



Willst du Power BI lernen?
Auf unseren neuen Seite Power BI Coach haben wir einen Onlinekurs zusammengestellt.


Wiederverwenden von Daten in mehreren Reports

Sicherlich habt ihr auch schon die Situation erlebt, in welcher ihr die gleichen Daten in mehreren Power BI Berichten verwendet habt. Die Daten, respektive jede Abfrage, werden innerhalb der jeweiligen Power BI Desktop Datei gespeichert und stehen für andere Berichte nicht zur Verfügung. Bis anhin musste daher die Power Query Abfrage in die verschiedenen Power BI Dateien kopiert werden. Alternativ konnte auch ein bereits im Power BI Service vorhandenes Dataset für weitere Berichte weiterverwendet werden. Die Daten sind in diesem Ansatz aber nicht erweiterbar. Diese Limitationen können mit den Power BI Dataflows umgangen werden.

Als Beispiel kann die Zeitdimension, der Kalender, dienen. Jedes Modell benötigt eine Zeitdimension und die Abfrage wird für jede Power BI Datei neu erstellt oder ein bestehender M-Code wird kopiert und eingefügt.

Am Beispiel von Kundendaten kann dies wie folgt dargestellt werden. Dieselbe Datei wird mehrmals für verschiedene Berichte wiederverwendet. In jeder Power BI Datei müssen die notwendigen Datentransformationen separat vorgenommen werden. Es ist sehr wahrscheinlich, dass es hier zu Dateninkonsistenzen kommen kann.

mehrmaliges Verwenden der gleichen Quelldaten
mehrmaliges Verwenden der gleichen Quelldaten

 

Mit den Power BI Dataflows können die Daten nun zentral gespeichert, bearbeitet und danach innerhalb eines Power BI Arbeitsbereichs zur Verfügung gestellt werden. Daher entfällt die Notwendigkeit, die Abfrage jedes Mal neu schreiben oder kopieren zu müssen und die Entwicklungszeit kann reduziert werden. So wird zentral eine Kundendimension zur Verfügung gestellt und kann über den Dataflow-Konnektor in die Power BI Datei oder gleich direkt in einen neuen Bericht im Power BI Service importiert werden.

Verwenden der Quelldaten via Dataflow in verschiedenen Berichten
Verwenden der Quelldaten via Dataflow in verschiedenen Berichten

«Zentralisierte», einheitliche und konsistente Daten

In vielen Fällen werden Daten nicht ab einem zentralen Speicherort, sondern immer wieder direkt ab der Quelle in Power BI importiert. Dieses Vorgehen kann in einem begrenzten Umfang durchaus Sinn machen. Sobald jedoch viele Berichte immer wieder auf die gleiche Quelle(n) und im schlimmsten Fall sogar gleichzeitig zugreifen, so sind die Implikationen auf das Quellsystem, sowie auf die Performance des BI-Systems nicht unerheblich. Um dies zu umgehen, wird in der Regel eine zwischengelagerte Datenspeicherung verwendet. Dies kann eine persistente Speicherung in einer zusätzlichen Datenbank oder auch ein Data Warehouse sein. Neu bieten sich zusätzlich auch die Power BI Dataflows an.

Ich verwende im Zusammenhang mit den Power BI Dataflows bewusst nicht das Wort «Data Warehouse», da für mich im Moment noch einige Bestandteile hierfür fehlen, wie zum Beispiel inkrementelles Laden in der Pro-Version (siehe dazu auch die Ausführungen in meinem Blogbeitrag). Obwohl dies mit einem Workaround erreichbar wäre – dazu werden die älteren Daten einmal in eine separate Tabelle geladen und danach vom Refresh ausgeschlossen. In der doch eher teuren Premium Variante ist inkrementelles Laden bereits realisierbar.

Aber noch gewichtiger ist die Tatsache, dass durch das Fehlen der inkrementellen Lademöglichkeit in der Pro Version bei jeder Aktualisierung die Daten in den Dataflows überschrieben werden. Somit ist auch keine Datenhistorisierung möglich. Gerade hier empfiehlt es sich, die benötigten Daten zentral in einem Data Warehouse vorzuhalten. Dadurch wird auch sichergestellt, dass alle Berichte auf den gleichen Datenstand zurückgreifen und die Berichte so auf einer einheitlichen und konsistenten Datenbasis erstellt werden.

Individuelle Datenaktualisierung

Im Power BI Service werden die Daten jeweils vollumfänglich, sprich alle Tabellen eines Datasets auf einmal, aktualisiert. Bei kleineren Datenbeständen ist dies kein grosses Thema. Jedoch ist es bei grösseren Beständen wünschenswert, dass auch die Aktualisierung zu unterschiedlichen Zeitpunkten geschieht. Sei dies, weil die Aktualisierung zu lange dauert oder weil Datenquellen nicht jeden Tag nachgeführt werden und ein täglicher Refresh daher keinen Sinn macht.

Hier bieten die Dataflows eine elegante Lösung an, indem für jeden Dataflow der Aktualisierungszeitpunkt individuell festgelegt werden kann.

Raschere Berichtsentwicklung

Einer der Hauptkritikpunkte an Business Intelligence Projekten ist der Umstand, dass die saubere Entwicklung von BI-Lösungen mitunter sehr lange dauern kann, die Benutzer aber sofort einen neuen Bericht erhalten möchten. Im Sinne einer schnellen und agilen Vorgehensweise kann der Benutzer unter Zuhilfenahme der in den Power BI Dataflows gespeicherten Daten, den benötigten Bericht selber erstellen. Später kann der Report an die IT-Abteilung übergeben werden, damit dieser in das Report-Portfolio aufgenommen werden kann.

Dieses Vorgehen entspricht einer Entwicklung vom Quadranten IV in den Quadranten II im Data Quadrant Model von Ronald Damhof (siehe dazu auch unseren Bericht in der Netzwoche). Im Quadranten IV werden Berichte systematisch und kontrolliert erstellt, wogegen im Quaranten II die Berichtserstellung eher opportunistisch und unsystematisch erfolgt.

Data Quadrant Model
Data Quadrant Model

Datenspeicherung at low cost

Die Verwendung der Dataflows setzt minimal eine Power BI Pro Lizenz voraus. Diese kostet im Moment rund CHF 10.00 pro Benutzer und Monat. Es kommen keine weiteren Kosten dazu, solange auf die Premium Funktionalitäten verzichtet werden kann (siehe weiter unten unter Einschränkungen).

Solange beim Kunden kein Data Warehouse im Einsatz ist, kann unter Umständen die Verwendung der Power BI Dataflows eine interessante Option sein. Dies ist im Einzelfall jedoch genau abzuklären.

Unified Datamart

Zurzeit arbeiten wir bei IT-Logix an einem Modell, wie Daten unter Verwendung der Dataflows zu einem Unified Datamart zusammengefasst und in einem semantischen Layer ausschliesslich mit Power BI-Komponenten bereitgestellt werden können. Hierzu werden wir zu einem späteren Zeitpunkt mehr publizieren.

Momentane Einschränkungen

Im Zeitpunkt der Erstellung dieses Beitrages können Dataflows in der Pro Version nur pro Arbeitsbereich (Workspace) erstellt werden. Dies führt dazu, dass unter Umständen in verschiedenen Workspaces unterschiedliche Datenbestände vorliegen. Die Power BI Premium Capacity kennt diese Einschränkung nicht und es kann von einem Workspace auf Dataflows in einem anderen Workspace zugegriffen werden.

Zudem kann in der Power BI Pro Version nur achtmal pro Tag eine Datenaktualisierung durchgeführt werden. Dies reicht aber in den meisten Anwendungsfällen völlig aus. Die Premium Capacity kennt auch diese Limitation nicht.

Und wie bereits erwähnt, kann in der Pro Version keine inkrementelle Datenaktualisierung angewendet werden. Auch hierfür wird eine Premium Capacity benötigt.

Einschätzung und weiteres Vorgehen

Die Power BI Dataflows sind noch sehr jung und werden laufend weiterentwickelt. Wir erachten die Möglichkeiten der Power BI Dataflows als erfolgsversprechend und werden am Thema dranbleiben und die laufenden Weiterentwicklungen auf diesem Gebiet eng weiterverfolgen.

Mehr über Power BI könnt ihr hier nachlesen.

Happy Querying!

Wenn Du mehr über Power BI lesen willst, so abonniere unseren Newsletter.


Kommentar verfassen

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre mehr darüber, wie deine Kommentardaten verarbeitet werden.

%d Bloggern gefällt das: