Verwenden von R im Power Query-EditorUse R in Power Query Editor

R ist eine leistungsfähige Programmiersprache, die von vielen Statistikern, Data Scientists und Data Analysts verwendet wird.The R language is a powerful programming language that many statisticians, data scientists, and data analysts use. Mit R können Sie im Power Query-Editor von Power BI Desktop folgende Aufgaben durchführen:You can use R in Power BI Desktop's Power Query Editor to:

  • Vorbereiten von DatenmodellenPrepare data models.

  • Erstellen von BerichtenCreate reports.

  • Bereinigen von Daten, Strukturieren von Daten mit modernen Methoden und Analysieren von Datasets, was auch die Vervollständigung fehlender Daten, Vorhersagen, Clustering und vieles mehr einschließtDo data cleansing, advanced data shaping, and dataset analytics, which include missing data completion, predictions, clustering, and more.

Installieren von RInstall R

Sie können R kostenlos über die Downloadseite von Revolution Open und aus dem CRAN-Repository herunterladen.You can download R for free from the Revolution R Open download page and the CRAN Repository.

Installieren von „mice“Install mice

Als Voraussetzung müssen Sie die mice-Bibliothek in Ihrer R-Umgebung herunterladen.As a prerequisite, you must install the mice library in your R environment. Ohne mice wird der Code im Beispielskript nicht richtig ausgeführt.Without mice, the sample script code won't work properly. Im mice-Paket ist eine Methode zum Umgang mit fehlenden Daten implementiert.The mice package implements a method to deal with missing data.

So installieren Sie die mice-Bibliothek:To install the mice library:

  1. Starten Sie das Programm „R. exe“ (z. B. unter C:\Programme\Microsoft\R Open\R-3.5.3\bin\R.exe).Launch the R.exe program (for example, C:\Program Files\Microsoft\R Open\R-3.5.3\bin\R.exe).

  2. Führen Sie in der R-Eingabeaufforderung den install-Befehl aus:Run the install command from the R prompt:

    install.packages('mice') 
    

Verwenden von R im Power Query-EditorUse R in Power Query Editor

Im Folgenden wird demonstriert, wie Sie R im Power Query-Editor verwenden können. Dazu nutzen Sie ein Beispieldataset, das sich in einer CSV-Datei befindet und Börsendaten enthält, und führen die folgenden Schritte aus:To demonstrate using R in Power Query Editor, we'll use an example stock market dataset contained in a .csv file and work through the following steps:

  1. Laden Sie die Datei EuStockMarkets_NA.csv herunter.Download the EuStockMarkets_NA.csv file. Merken Sie sich, wo Sie sie gespeichert haben.Remember where you save it.

  2. Laden Sie Daten in Power BI Desktop.Load the file into Power BI Desktop. Klicken Sie auf der Registerkarte Start auf Daten abrufen  > Text/CSV.From the Home tab, select Get Data > Text/CSV.

    Klicken auf „Text/CSV“

  3. Wählen Sie die Datei EuStockMarkets_NA.csv aus, und klicken Sie dann auf Öffnen.Select the EuStockMarkets_NA.csv file, and then choose Open. Die CSV-Daten werden im Dialogfeld Text/CSV file (Text/CSV-Datei) angezeigt.The CSV data is displayed in the Text/CSV file dialog box.

    Auswählen der CSV-Datei

  4. Klicken Sie auf Laden, um die Daten aus der Datei zu laden.Select Load to load the data from the file. Nachdem die Daten in Power BI geladen wurden, wird im Bereich Felder eine neue Tabelle angezeigt.After Power BI has loaded the data, the new table appears in the Fields pane.

    Daten im Bereich „Felder“

  5. Klicken Sie im Menüband Start auf Abfragen bearbeiten, um den Power Query-Editor zu öffnen.To open Power Query Editor, from the Home ribbon select Edit Queries.

    Auswählen von „Abfragen bearbeiten“

  6. Klicken Sie auf der Registerkarte Transformieren auf R-Skript ausführen.From the Transform tab, select Run R script. Der Editor R-Skript ausführen wird angezeigt.The Run R script editor appears. In den Zeilen 15 und 20 sowie in weiteren Zeilen, die nicht auf dem Screenshot zu sehen sind, fehlen Daten.Rows 15 and 20 have missing data, as do other rows you can't see in the image. Die unten aufgeführten Schritte verdeutlichen, wie R diese Zeilen automatisch vervollständigt.The following steps show how R completes those rows for you.

    Klicken auf „R-Skript ausführen“

  7. Geben Sie für dieses Beispiel den folgenden Skriptcode im Fenster R-Skript ausführen in das Feld Skript ein.For this example, enter the following script code in the Script box of the Run R script window. Ersetzen Sie <Your File Path> durch den Pfad zu EuStockMarkets_NA.csv auf Ihrem lokalen Dateisystem. Dieser könnte z. B. wie folgt aussehen: C:/Benutzer/John Doe/Dokumente/Microsoft/EuStockMarkets_NA.csv.Replace <Your File Path> with the path to EuStockMarkets_NA.csv on your local file system, for example, C:/Users/John Doe/Documents/Microsoft/EuStockMarkets_NA.csv.

       dataset <- read.csv(file="<Your File Path>/EuStockMarkets_NA.csv", header=TRUE, sep=",")
       library(mice)
       tempData <- mice(dataset,m=1,maxit=50,meth='pmm',seed=100)
       completedData <- complete(tempData,1)
       output <- dataset
       output$completedValues <- completedData$"SMI missing values"
    

    Hinweis

    Möglicherweise müssen Sie eine Variable mit dem Namen output überschreiben, damit das neue Dataset mit den angewendeten Filtern ordnungsgemäß erstellt wird.You might need to overwrite a variable named output to properly create the new dataset with the filters applied.

  8. Wählen Sie OK aus.Select OK. Im Power Query-Editor wird dann ein Hinweis zum Datenschutz angezeigt.Power Query Editor displays a warning about data privacy.

    Datenschutzwarnung

  9. Klicken Sie neben der Warnung auf Fortsetzen.Inside the warning message, select Continue. Legen Sie im angezeigten Dialogfeld Datenschutzebenen für alle Datenquellen für R-Skripts Öffentlich fest, damit sie im Power BI-Dienst ordnungsgemäß funktionieren.In the Privacy levels dialog box that appears, set all data sources to Public for the R scripts to work properly in the Power BI service.

    Dialogfeld „Datenschutzebenen“

    Weitere Informationen zu den Datenschutzeinstellungen und deren Bedeutung finden Sie unter Power BI Desktop – Datenschutzebenen.For more information about privacy settings and their implications, see Power BI Desktop privacy levels.

  10. Klicken Sie auf Erstellen, um das Skript auszuführen.Select Save to run the script.

Im Bereich Felder wird eine neue Spalte mit dem Namen completedValues angezeigt.Notice a new column in the Fields pane called completedValues. In dieser Spalte fehlen einige Datenelemente, z. B. in Zeile 15 und 18.This column has a few missing data elements, such as on row 15 and 18. Im nächsten Abschnitt sehen Sie, wie dies von R behandelt wird.Take a look at how R handles that in the next section.

Mit einigen wenigen Zeilen R-Skript konnte der Power Query-Editor die fehlenden Werte anhand eines Vorhersagemodells einfügen.With just five lines of R script, Power Query Editor filled in the missing values with a predictive model.

Erstellen von Visuals aus Daten in R-SkriptsCreate visuals from R script data

Sie können nun ein Visual erstellen, um zu zeigen, wie der R-Skriptcode zusammen mit der mice-Bibliothek die fehlenden Werte vervollständigt.We can now create a visual to see how the R script code with the mice library completes the missing values.

R-Skript-Visual

Sie können die vollständigen Visuals in einer Power BI Desktop-Datei im PBIX-Format speichern und das Datenmodell sowie die zugehörigen R-Skripts im Power BI-Dienst verwenden.You can save all completed visuals in one Power BI Desktop .pbix file and use the data model and its R scripts in the Power BI service.

Hinweis

Sie können eine PBIX-Datei herunterladen, in der diese Schritte bereits ausgeführt wurden.You can download a .pbix file with all these steps completed.

Nachdem Sie die PBIX-Datei in den Power BI-Dienst hochgeladen haben, müssen Sie zusätzliche Schritte ausführen, um die Aktualisierung der Dienstdaten und die aktualisierten Visuals zu aktivieren:After you've uploaded the .pbix file to the Power BI service, you need to take additional steps to enable service data refresh and updated visuals:

  • Aktivieren der geplanten Aktualisierung für das Dataset: Weitere Informationen zur Verwendung des R-Skripts zum Aktivieren der geplanten Aktualisierung für die Arbeitsmappe, die Ihr Dataset enthält, finden Sie im Artikel Konfigurieren von geplanten Aktualisierungen.Enable scheduled refresh for the dataset: To enable scheduled refresh for the workbook containing your dataset with R scripts, see Configuring scheduled refresh. Dieser Artikel enthält außerdem Informationen zu persönlichen Gateways.This article also includes information about personal gateways.

  • Installieren des persönlichen Gateways: Auf dem Computer, auf dem sich die Datei und R befinden, muss ein persönliches Gateway installiert sein.Install a personal gateway: You need a personal gateway installed on the machine where the file and R are located. Der Power BI-Dienst greift auf diese Arbeitsmappe zu und rendert alle aktualisierten Visuals neu.The Power BI service accesses that workbook and re-renders any updated visuals. Weitere Informationen finden Sie im Artikel Verwenden persönlicher Gateways in Power BI.For more information, see Use personal gateways in Power BI.

EinschränkungenLimitations

Für Abfragen, die im Power Query-Editor erstellte R-Skripts enthalten, gelten einige Einschränkungen:There are some limitations to queries that include R scripts created in Power Query Editor:

  • Für alle R-Datenquellen muss die Einstellung Öffentlich festgelegt werden.All R data source settings must be set to Public. Dasselbe gilt auch für alle anderen Schritte einer Abfrage im Power Query-Editor.All other steps in a Power Query Editor query must also be public.

    Klicken Sie in Power BI Desktop auf Datei  > Optionen und Einstellungen  > Datenquelleneinstellungen.To get to the data source settings, in Power BI Desktop, select File > Options and settings > Data source settings.

    Auswählen der Option „Datenquelleneinstellungen“

    Wählen Sie im Dialogfeld Datenquelleneinstellungen eine oder mehrere Datenquellen aus, und klicken Sie dann auf Berechtigungen bearbeiten.In the Data source settings dialog box, select one or more data sources, and then select Edit Permissions. Legen Sie für Datenschutzebene die Einstellung Öffentlich fest.Set the Privacy Level to Public.

    Dialogfeld „Datenquelleneinstellungen“

  • Wenn Sie geplante Aktualisierungen der R-Visuals oder des Datasets zulassen möchten, müssen Sie geplante Aktualisierungen aktivieren. Auf dem Computer, auf dem sich die Arbeitsmappe und die R-Installation befinden, muss außerdem ein persönliches Gateway installiert sein.To schedule refresh of your R visuals or dataset, enable scheduled refresh and install a personal gateway on the computer containing the workbook and R.

Für R und benutzerdefinierte Abfragen gibt es viele verschiedene Verwendungsmöglichkeiten.There are all sorts of things you can do with R and custom queries. Analysieren Sie Ihre Daten, und stellen Sie sie in genau der Form dar, die für Sie am geeignetsten ist.Explore and shape your data just the way you want it to appear.

Nächste SchritteNext Steps