Speichern von Internetdateien mit Power BI Desktop

Aufrufe: 1788

Das Speichern von Internetdateien mit Power BI Desktop war bis dato nicht einfach realisierbar. Natürlich gibt es Workarounds mit Power Shell, aber nicht alle User sind damit vertraut. Power BI wird zum Glück immer weiter entwickelt und es hört nicht auf. Mit der Integration von “R” wurden die Möglichkeiten enorm erweitert. In dieser Beitragsserie könnt ihr sehen, wie eine .csv Datei aus dem Internet heruntergeladen und gespeichert werden kann.

Die Serie umfasst folgende Beiträge:
– Erster Teil – Speichern der Internet Datei mit Power BI Desktop
Zweiter Teil – dynamischer Download der Internet Datei mit Power BI Desktop



Willst du Power BI lernen?
Auf unseren neuen Seite Power BI Coach haben wir einen Onlinekurs zusammengestellt.


Teil 1 – Speichern der Datei aus dem Internet

Damit wir überhaupt auf die Möglichkeiten von “R” zurückgreifen können, muss zuerst die Umgebung von  Power BI Desktop entsprechend eingerichtet werden. Microsoft hat dazu schon einige Artikel veröffentlicht, welche ihr hier und hier findet.

Datenabrufen

Als Erstes greifen wir über “Daten abrufen” auf “R Skript” zu.

R aufrufen
R aufrufen

Im neu erschienen Dialogfeld geben wir folgenden Code ein:

Was bedeutet der Code?

Vorbemerkung:
In “R” werden Variablen mit der Zeichenfolge <- definiert.
Alle Kommentare werden am Zeilenbeginn mit # gekennzeichnet. 

URL:
“URL” definiert die gesuchte .csv Datei im Internet. Es handelt sich hier um die Liste aller in der Schweiz kotierten Unternehmungen. Die Datei ist öffentlich abrufbar.

MainDir:
Definiert das Laufwerk.

subDir:
Definiert den Hauptordner.

SubDir2:
Definiert den Unterordner.

filename:
Definiert den Namen der Datei.

Destination:
Mit “Destination” wird der Speicherort und der Name der Datei festgelegt.
Der Pfad wird aus den einzelnen, oben definierten, Bestandteilen zusammengesetzt.

dir.create:
dir.create erstellt die einzelnen Ordner, falls diese noch nicht bestehen sollten. showWarnings ist bewusst auf “FALSE” gesetzt, damit Warnmeldungen unterdrückt werden.

download.file:
Das ist der erste “R” Befehl. Wir verwenden folgende Argumente:
URL = Adresse des Quelldatei
destfile = Speicherort der Datei
method = Methode des Downloads. Wir verwenden “auto”
quiet = “TRUE” unterdrückt allfällige Meldungen, “False” nicht. Wir verwenden “FALSE”.

Die restlichen Argumente mode, cacheOK und extra werden in unserem Beispiel nicht verwendet. Wer mehr dazu lesen möchte , finden bei der ETH Zürich unter diesem Link weitere Informationen.

read.csv:
Liest die abgespeicherte Datei wieder in den Power BI Desktop ein. Wir verwenden die Argumente
file = Speicherort der Datei – hier analog oben “Destination”,
header = Hat die CSV Datei Kopfzeilen oder nicht – wir verwenden TRUE
sep = kennzeichnet das Separierungszeichen in der Datei – wir verwenden “;”

Nächste Schritte

Nach erfolgter Eingabe erscheint das Vorschaufenster. Wir klicken “MyData” an und bestätigen.

image

Power BI nimmt uns den letzten Schritt automatisch ab und wir haben eine vollständige Tabelle, die wir nach Bedarf noch formatieren können.

image

Und hier beginnt die Magie

So weit so gut. Aber das Ganze wäre ja auch über den Direktimport der csv-Datei realisierbar gewesen. Schauen wir uns daher den Ordner
“Power  BI\Securities” an. Und… voilà. Die csv-Datei ist gespeichert.

image

Aktualisiert ihr nun die Abfrage in Power BI Desktop, so ist auch die Datei wieder abgespeichert.

image

Schlussfolgerung

Mit der vorgestellten Methode ist das Speichern von Internetdateien mit Power BI Desktop jederzeit möglich. In gleicher Weise ist es möglich, sich so eine kleine Datensammlung anzulegen, Daten inkrementell zu laden und vieles andere mehr.

Was kommt als nächstes?

Im nächsten Beitrag werden wir die Methode noch weiter verbessern und gleichzeitig dynamischer machen.

Mehr Artikel über Power Query findet Ihr im Power Query Online Buch.

Happy Quering!

Kommentar verfassen

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre mehr darüber, wie deine Kommentardaten verarbeitet werden.

%d Bloggern gefällt das: