Tutorial: Erstellen eines Machine Learning-Modells in Power BITutorial: Build a Machine Learning model in Power BI

In diesem Tutorialartikel verwenden Sie Automatisiertes maschinelles Lernen zum Erstellen und Anwenden eines binären Vorhersagemodells in Power BI.In this tutorial article, you use Automated Machine Learning to create and apply a binary prediction model in Power BI. Das Tutorial enthält Anleitungen zum Erstellen eines Power BI-Dataflows und zum Verwenden der im Dataflow definierten Entitäten, um ein Machine Learning-Modell direkt in Power BI zu trainieren und zu überprüfen.The tutorial includes guidance for creating a Power BI dataflow, and using the entities defined in the dataflow to train and validate a machine learning model directly in Power BI. Wir verwenden dieses Modell dann zur Bewertung neuer Daten, um Vorhersagen zu generieren.We then use that model for scoring new data to generate predictions.

Zunächst erstellen Sie ein Machine Learning-Modell für die binäre Vorhersage der Kaufabsichten von Onlinekunden auf Basis eines Satzes ihrer Onlinesitzungsattribute.First, you'll create a Binary Prediction machine learning model, to predict the purchase intent of online shoppers based on a set of their online session attributes. Für diese Übung wird ein Benchmark-Machine Learning-Dataset verwendet.A benchmark machine learning dataset is used for this exercise. Sobald ein Modell trainiert ist, generiert Power BI automatisch einen Überprüfungsbericht, in dem die Modellergebnisse erläutert werden.Once a model is trained, Power BI will automatically generate a validation report explaining the model results. Sie können dann den Überprüfungsbericht auswerten und das Modell zur Bewertung auf die Daten anwenden.You can then review the validation report and apply the model to your data for scoring.

Dieses Tutorial umfasst folgende Schritte:This tutorial consists of following steps:

  • Erstellen eines Dataflows mit den EingabedatenCreate a dataflow with the input data
  • Erstellen und Trainieren eines Machine Learning-ModellsCreate and train a machine learning model
  • Auswerten des ModellüberprüfungsberichtsReview the model validation report
  • Anwenden des Modells auf eine DataflowentitätApply the model to a dataflow entity
  • Verwenden der bewerteten Ausgabe des Modells in einem Power BI-BerichtUsing the scored output from the model in a Power BI report

Erstellen eines Dataflows mit den EingabedatenCreate a dataflow with the input data

Der erste Teil dieses Tutorials besteht darin, einen Dataflow mit Eingabedaten zu erstellen.The first part of this tutorial is to create a dataflow with input data. Dieser Vorgang erfordert einige Schritte, wie in den folgenden Abschnitten beschrieben, beginnend mit dem Erfassen der Daten.That process takes a few steps, as shown in the following sections, beginning with getting data.

Daten abrufenGet data

Der erste Schritt beim Erstellen eines Dataflows besteht darin, dass Sie Ihre Datenquellen bereithalten.The first step in creating a dataflow is to have your data sources ready. In unserem Fall verwenden wir ein Machine Learning-Dataset aus einer Reihe von Onlinesitzungen, wobei es in einigen davon zum Kauf kam.In our case, we use a machine learning dataset from a set of online sessions, some of which culminated in a purchase. Das Dataset enthält eine Reihe von Attributen zu diesen Sitzungen, die wir zum Trainieren unseres Modells verwenden.The dataset contains a set of attributes about these sessions, which we'll use for training our model.

Sie können das Dataset von der UC Irvine-Website herunterladen.You can download the dataset from the UC Irvine website. Auch dies steht für den Zweck dieses Tutorials über den folgenden Link zur Verfügung: online_shoppers_intention.csv.We also have this available, for the purpose of this tutorial, from the following link: online_shoppers_intention.csv.

Erstellen der EntitätenCreate the entities

Melden Sie sich beim Power BI-Dienst an, und navigieren Sie zu einem Arbeitsbereich in Ihrer Kapazität, in dem KI aktiviert ist, um die Entitäten in Ihrem Dataflow zu erstellen.To create the entities in your dataflow, sign into the Power BI service and navigate to a workspace on your capacity that has AI enabled.

Wenn Sie noch keinen Arbeitsbereich haben, können Sie einen erstellen, indem Sie im Power BI-Dienst im Navigationsbereichsmenü Arbeitsbereiche und im dann angezeigten Bereich am unteren Rand Arbeitsbereich erstellen auswählen.If you don't already have a workspace, you can create one by selecting Workspaces in the nav pane menu in the Power BI service, and select Create workspace at the bottom of the panel that appears. Daraufhin wird rechts ein Bereich zur Eingabe der Details des Arbeitsbereichs geöffnet.This opens a panel on the right to enter the workspace details. Geben Sie einen Namen für den Arbeitsbereich ein, und wählen Sie Erweitert aus.Enter a workspace name and select Advanced. Bestätigen Sie mithilfe des Optionsfelds „Dedizierte Kapazität“, dass der Arbeitsbereich dedizierte Kapazität verwendet und einer Instanz mit Kapazität zugewiesen ist, für die die KI-Vorschau aktiviert ist.Confirm that the workspace uses Dedicated Capacity using the radio button, and that it's assigned to a capacity instance that has the AI preview turned on. Klicken Sie auf Speichern.Then select Save.

Arbeitsbereich erstellen

Sobald der Arbeitsbereich erstellt ist, können Sie unten rechts im Begrüßungsbildschirm Überspringen auswählen, wie in der folgenden Abbildung gezeigt.Once the workspace is created, you can select Skip in the bottom right of the Welcome screen, as shown in the following image.

Überspringen, wenn Sie über einen Arbeitsbereich verfügen

Wählen Sie die Schaltfläche Erstellen oben rechts im Arbeitsbereich und dann die Schaltfläche Dataflow aus.Select the Create button at the top right of the workspace, and then select Dataflow.

Erstellen des Dataflows

Wählen Sie Neue Entitäten hinzufügen aus.Select Add new entities. Damit wird ein Power Query -Editor im Browser gestartet.This launches a Power Query editor in the browser.

Hinzufügen einer neuen Entität

Wählen Sie Text-/CSV-Datei als Datenquelle aus, wie in der folgenden Abbildung dargestellt.Select Text/CSV File as a data source, shown in the following image.

Ausgewählte Text-/CSV-Datei

Fügen Sie auf der Seite Mit einer Datenquelle verbinden , die als Nächstes angezeigt wird, den folgenden Link zur Datei online_shoppers_intention.csv in das Feld Dateipfad oder URL ein, und wählen Sie dann Weiter aus.In the Connect to a data source page that appears next, paste the following link to the online_shoppers_intention.csv into the File path or URL box, and then select Next.

https://raw.githubusercontent.com/santoshc1/PowerBI-AI-samples/master/Tutorial_AutomatedML/online_shoppers_intention.csv

Dateipfad

Der Power Query-Editor zeigt eine Vorschau der Daten aus der CSV-Datei an.The Power Query Editor shows a preview of the data from the CSV file. Sie können die Abfrage in einen benutzerfreundlicheren Namen umbenennen, indem Sie den Wert im Feld „Name“ im rechten Bereich ändern.You can rename the query to a friendlier name by changing the value in the Name box found in the right pane. Beispielsweise könnten Sie den Abfragenamen in Onlinebesucher ändern.For example, you could change the Query name to Online Visitors.

Ändern in einen benutzerfreundlichen Namen

Power Query leitet automatisch den Spaltentyp ab.Power Query automatically infers the type of columns. Sie können den Spaltentyp ändern, indem Sie auf das Symbol „Attributtyp“ am oberen Rand der Spaltenüberschrift klicken.You can change the column type by clicking on the attribute type icon at the top of the column header. In diesem Beispiel ändern wir den Typ der Spalte „Revenue“ (Umsatz) in „TRUE/FALSE“.In this example, we change the type of the Revenue column to True/False.

Ändern des Datentyps

Wählen Sie die Schaltfläche Speichern und schließen aus, um den Power Query-Editor zu schließen.Select the Save & close button to close Power Query Editor. Geben Sie einen Namen für den Dataflow an, und wählen Sie dann wie in der folgenden Abbildung veranschaulicht im Dialogfeld die Option Speichern aus.Provide a name for the dataflow, and then select Save on the dialog, as shown in the following image.

Speichern des Dataflows

Erstellen und Trainieren eines Machine Learning-ModellsCreate and train a machine learning model

Wählen Sie zum Hinzufügen eines Machine Learning-Modells die Schaltfläche ML-Modell anwenden in der Liste Aktionen für die Basisentität aus, die die Trainingsdaten und Bezeichnungsinformationen enthält, und wählen Sie dann Machine Learning-Modell hinzufügen aus.To add a machine learning model, Select the Apply ML model button in the Actions list for the base entity that contains your training data and label information, and then select Add a machine learning model.

Machine Learning-Modell hinzufügen

Der erste Schritt beim Erstellen unseres Machine Learning-Modells besteht darin, die Verlaufsdaten zu identifizieren, einschließlich des Ergebnisfelds, das Sie vorhersagen möchten.The first step for creating our machine learning model is to identify the historical data including the outcome field that you want to predict. Das Modell wird erstellt, indem es aus diesen Daten lernt.The model will be created by learning from this data.

Im Fall des Datasets, das wir verwenden, ist dies das Feld Revenue.In the case of the dataset we're using, this is the Revenue field. Wählen Sie Revenue (Umsatz) als Wert für „Ergebnisfeld“ aus, und wählen Sie dann Weiter aus.Select Revenue as the 'Outcome field' value and then select Next.

Auswählen von Verlaufsdaten

Als Nächstes müssen wir den Typ des zu erstellenden Machine Learning-Modells auswählen.Next, we must select the type of machine learning model to create. Power BI analysiert die Werte im Ergebnisfeld, das Sie identifiziert haben, und schlägt die Machine Learning-Modelltypen vor, die erstellt werden können, um dieses Feld vorherzusagen.Power BI analyzes the values in the outcome field that you've identified and suggests the types of machine learning models that can be created to predict that field.

Da wir in diesem Fall ein binäres Ergebnis vorhersagen, nämlich ob ein Benutzer einen Einkauf durchführt oder nicht, wird die binäre Vorhersage empfohlen.In this case since we're predicting a binary outcome of whether a user will make a purchase or not, Binary Prediction is recommended. Da wir daran interessiert sind, Benutzer vorherzusagen, die einen Kauf tätigen werden, wählen Sie „TRUE“ als Umsatzergebnis aus, an dem Sie am meisten interessiert sind.Since we are interested in predicting users who will make a purchase, select True as the Revenue outcome that you're most interested in. Zusätzlich können Sie benutzerfreundliche Bezeichnungen für die Ergebnisse angeben, die im automatisch generierten Bericht verwendet werden, der die Ergebnisse der Modellüberprüfung zusammenfasst.Additionally, you can provide friendly labels for the outcomes to be used in the automatically generated report that will summarize the results of the model validation. Wählen Sie dann „Weiter“ aus.Then select Next.

Ausgewählte binäre Vorhersage

Als Nächstes führt Power BI eine vorläufige Überprüfung einer Stichprobe der Daten durch und schlägt die Eingaben vor, die genauere Vorhersagen liefern können.Next, Power BI does a preliminary scan of a sample of your data and suggests the inputs that may produce more accurate predictions. Wenn Power BI kein Feld empfiehlt, wird daneben eine Erklärung angezeigt.If Power BI doesn't recommend a field, an explanation would be provided next to it. Sie haben die Möglichkeit, die Auswahl so zu ändern, dass nur die Felder einbezogen werden, die vom Modell untersucht werden sollen. Alternativ können Sie auch alle Felder auswählen, indem Sie das Kontrollkästchen neben dem Entitätsnamen aktivieren.You have the option to change the selections to include only the fields you want the model to study, or you can select all the fields by selecting the checkbox next to the entity name. Wählen Sie Weiter aus, um die Eingaben zu akzeptieren.Select Next to accept the inputs.

Auswählen von „Weiter“

Im letzten Schritt müssen wir unserem Modell einen Namen geben.In the final step, we must provide a name for our model. Nennen Sie das Modell Vorhersage der Kaufabsicht.Name the model Purchase Intent Prediction. Sie können entscheiden, ob Sie die Trainingszeit verkürzen möchten, um schnelle Ergebnisse zu erzielen, oder ob Sie die Trainingszeit verlängern möchten, um das beste Modell zu erhalten.You can choose to reduce the training time to see quick results or increase the amount of time spent in training to get the best model. Wählen Sie dann Speichern und trainieren aus, um mit dem Training des Modells zu beginnen.Then select Save and train to start training the model.

Speichern des Modells

Der Trainingsprozess beginnt mit der Stichprobenentnahme und Normalisierung ihrer Verlaufsdaten sowie dem Aufteilen Ihres Datasets in zwei neue Entitäten Purchase Intent Prediction Training Data (Trainingsdaten für Kaufabsichtsvorhersage) und Purchase Intent Prediction Testing Data (Testdaten für Kaufabsichtsvorhersage).The training process will begin by sampling and normalizing your historical data and splitting your dataset into two new entities Purchase Intent Prediction Training Data and Purchase Intent Prediction Testing Data.

Abhängig von der Größe des Datasets kann der Trainingsprozess einige Minuten bis zu der im vorherigen Bildschirm ausgewählten Trainingszeit dauern.Depending on the size of the dataset, the training process can take anywhere from a few minutes to the training time selected at the previous screen. An diesem Punkt können Sie das Modell auf der Registerkarte Machine Learning-Modelle des Dataflows sehen.At this point, you can see the model in the Machine learning models tab of the dataflow. Der Status „Bereit“ zeigt an, dass das Modell in eine Warteschlange eingereiht wurde oder gerade trainiert wird.The Ready status indicates that the model has been queued for training or is under training.

Sie können über den Status des Dataflows feststellen, ob das Modell trainiert und überprüft wird.You can confirm that the model is being trained and validated through the status of the dataflow. Dieser wird als laufende Datenaktualisierung auf der Registerkarte Dataflows des Arbeitsbereichs angezeigt.This appears as a data refresh in progress in the Dataflows tab of the workspace.

Bereit zum Training

Sobald das Modelltraining abgeschlossen ist, wird für den Dataflow eine aktualisierte Aktualisierungszeit angezeigt.Once the model training is completed, the dataflow displays an updated refresh time. Sie können überprüfen, ob das Modell trainiert ist, indem Sie zur Registerkarte Machine Learning-Modelle im Dataflow navigieren.You can confirm that the model is trained, by navigating to the Machine learning models tab in the dataflow. Für das von Ihnen erstellte Modell sollte der Status Trainiert angezeigt werden, und die Zeitangabe Zuletzt trainiert sollte jetzt aktualisiert sein.The model you created should show status as Trained and the Last Trained time should now be updated.

Zuletzt trainiert

Auswerten des ModellüberprüfungsberichtsReview the model validation report

Wählen Sie in der Registerkarte „Machine Learning-Modelle“ die Schaltfläche „Trainingsbericht anzeigen“ in der Spalte „Aktionen“ für das Modell aus, um den Modellüberprüfungsbericht auszuwerten.To review the model validation report, in the Machine learning models tab, select the View training report button in the Actions column for the model. In diesem Bericht wird beschrieben, wie das Machine Learning-Modell wahrscheinlich durchgeführt wird.This report describes how your machine learning model is likely to perform.

Wählen Sie auf der Seite Modellleistung des Berichts top predictors (wichtigste Vorhersagen) aus, um die wichtigsten Vorhersagen für das Modell anzuzeigen.In the Model Performance page of the report, select See top predictors to view the top predictors for your model. Sie können eine der Vorhersagen auswählen, um zu sehen, wie die Ergebnisverteilung mit dieser Vorhersage verknüpft ist.You can select one of the predictors to see how the outcome distribution is associated with that predictor.

Modellleistung

Sie können den Wahrscheinlichkeitsschwellenwert -Slicer auf der Seite „Modellleistung“ verwenden, um seine Auswirkung auf die Genauigkeit und den Abruf des Modells zu untersuchen.You can use the Probability Threshold slicer on the Model Performance page to examine its influence on the Precision and Recall for the model.

Wahrscheinlichkeitsschwellenwert

Die anderen Seiten des Berichts beschreiben die statistischen Leistungsmetriken für das Modell.The other pages of the report describe the statistical performance metrics for the model.

Der Bericht enthält auch eine Seite mit Trainingsdetails, die die verschiedenen ausgeführten Iterationen beschreibt, wie Features aus den Eingaben extrahiert und welche Hyperparameter für das endgültige Modell verwendet wurden.The report also includes a Training Details page that describes the different iterations that were run, how features were extracted from the inputs, and the hyperparameters for the final model used.

Anwenden des Modells auf eine DataflowentitätApply the model to a dataflow entity

Wählen Sie oben im Bericht die Schaltfläche Modell anwenden aus, um dieses Modell aufzurufen.Select the Apply model button at the top of the report to invoke this model. Im Dialogfeld Anwenden können Sie die Zielentität angeben, die die Quelldaten enthält, auf die das Modell angewendet werden soll.In the Apply dialog, you can specify the target entity that has the source data to which the model should be applied.

Modell anwenden

Nach Aufforderung müssen Sie den Dataflow Aktualisieren , um eine Vorschau der Ergebnisse Ihres Modells anzuzeigen.When prompted, you must Refresh the dataflow to preview the results of your model.

Die Anwendung des Modells erzeugt zwei neue Entitäten mit dem Suffix erweiterter und Erklärungen zu erweitertem .Applying the model will create two new entities, with the suffix enriched <model_name> and enriched <model_name> explanations. In diesem Fall wird durch das Anwenden des Modells auf die Onlinebesucher -Entität Online Visitors enriched Purchase Intent Prediction (erweiterte Vorhersage der Kaufabsicht von Onlinebesuchern) erstellt, die die vorhergesagte Ausgabe des Modells einschließt, und Online Visitors enriched Purchase Intent Prediction explanations (Erklärungen der erweiterten Vorhersagen der Kaufabsicht von Onlinebesuchern), die die wichtigsten datensatzspezifischen Einflussfaktoren für die Vorhersage enthalten.In our case, applying the model to the Online Visitors entity will create Online Visitors enriched Purchase Intent Prediction which includes the predicted output from the model, and Online Visitors enriched Purchase Intent Prediction explanations which contains top record-specific influencers for the prediction.

Wenn Sie ein binäres Vorhersagemodell anwenden, werden vier Spalten mit dem vorhergesagten Ergebnis, der Wahrscheinlichkeitsbewertung, den wichtigsten datensatzspezifischen Einflussfaktoren für die Vorhersage und dem Erklärungsindex hinzugefügt, wobei jeweils der angegebene Spaltenname vorangestellt wird.Applying a Binary Prediction model adds four columns with predicted outcome, probability score, the top record-specific influencers for the prediction, and explanation index each prefixed with the column name specified.

Drei Ergebnisspalten

Sobald die Dataflowaktualisierung abgeschlossen ist, können Sie die Online Visitors enriched Purchase Intent Prediction -Entität (erweiterte Vorhersage der Kaufabsicht von Onlinebesuchern) auswählen, um die Ergebnisse anzuzeigen.Once the dataflow refresh is completed, you can select the Online Visitors enriched Purchase Intent Prediction entity to view the results.

Anzeigen der Ergebnisse

Sie können auch ein beliebiges AutoML-Modell im Arbeitsbereich direkt aus dem Power Query-Editor im Dataflow aufrufen.You can also invoke any AutoML model in the workspace, directly from the Power Query Editor in your dataflow. Um auf die AutoML-Modelle zuzugreifen, klicken Sie auf die Schaltfläche „Bearbeiten“ für die Entität, die Sie mit Erkenntnissen aus Ihrem AutoML-Modell anreichern möchten, wie in der folgenden Abbildung dargestellt.To access the AutoML models, select the Edit button for the entity that you want to enrich with insights from your AutoML model, as shown in the following image.

Bearbeiten der Entität

Mit Auswahl der Schaltfläche Bearbeiten wird der Power Query-Editor für die Entitäten in Ihrem Dataflow geöffnet.Selecting the Edit button opens the Power Query Editor for the entities in your dataflow. Klicken Sie im Menüband auf die Schaltfläche „KI Insights“.Select the AI Insights button in the ribbon.

KI Insights

Wählen Sie im Menü des Navigationsbereichs den Ordner „Power BI-Machine Learning-Modelle“ aus.Select the Power BI Machine Learning Models folder from the nav pane menu. Alle AutoML-Modelle, auf die Sie Zugriff haben, werden hier als Power Query-Funktionen aufgelistet.All the AutoML models to which you have access are listed here as Power Query functions. Darüber hinaus werden die Eingabeparameter für das AutoML-Modell automatisch als Parameter der entsprechenden Power Query-Funktion zugeordnet.Also, the input parameters for the AutoML model are automatically mapped as parameters of the corresponding Power Query function. Beachten Sie, dass Parameter nur dann automatisch zugeordnet werden, wenn der Name und der Datentyp des Parameters übereinstimmen.Note that automatic mapping of parameters happens only if the name and data type of the parameter is the same.

Um ein AutoML-Modell aufzurufen, können Sie beliebige Spalten der ausgewählten Entität als Eingabe aus der Dropdownliste angeben.To invoke an AutoML model, you can specify any of the selected entity's columns as an input from the drop-down. Sie können auch einen konstanten Wert angeben, der als Eingabe verwendet werden soll, indem Sie das Spaltensymbol auf der linken Seite des Eingabedialogfelds umschalten.You can also specify a constant value to be used as an input by toggling the column icon to the left of the input dialog.

PQO-Funktionsbrowser

Klicken Sie auf „Anwenden“, um die Vorschau der Ausgabe des AutoML-Modells als neue Spalte in der Entitätstabelle anzuzeigen.Select Apply to view the preview of the AutoML model's output as a new columns in the entity table. Sie sehen den Modellaufruf auch als angewendeten Schritt für die Abfrage.You will also see the model invocation as an applied step for the query.

Anzeigen der Ergebnisse

Nach dem Speichern Ihres Dataflows wird das Modell automatisch aufgerufen, wenn der Dataflow aktualisiert wird, um etwaige neue oder aktualisierte Zeilen in der Entitätentabelle zu berücksichtigen.Once you save your dataflow, the model is automatically invoked when the dataflow is refreshed, for any new or updated rows in the entity table.

Verwenden der bewerteten Ausgabe des Modells in einem Power BI-BerichtUsing the scored output from the model in a Power BI report

Wenn Sie die bewertete Ausgabe Ihres Machine Learning-Modells verwenden möchten, können Sie mit dem Dataflows-Connector eine Verbindung mit Ihrem Dataflow über den Power BI-Desktop herstellen.To use the scored output from your machine learning model you can connect to your dataflow from the Power BI desktop, using the Dataflows connector. Mit der Online Visitors enriched Purchase Intent Prediction -Entität (erweiterte Vorhersage der Kaufabsicht von Onlinebesuchern) können Sie jetzt die Vorhersagen aus dem Modell in Power BI-Berichte einbinden.The Online Visitors enriched Purchase Intent Prediction entity can now be used to incorporate the predictions from your model in Power BI reports.

Nächste SchritteNext steps

In diesem Tutorial haben Sie mithilfe der folgenden Schritte ein binäres Vorhersagemodell in Power BI erstellt und angewendet:In this tutorial, you created and applied a binary prediction model in Power BI using these steps:

  • Erstellen eines Dataflows mit den EingabedatenCreate a dataflow with the input data
  • Erstellen und Trainieren eines Machine Learning-ModellsCreate and train a machine learning model
  • Auswerten des ModellüberprüfungsberichtsReview the model validation report
  • Anwenden des Modells auf eine DataflowentitätApply the model to a dataflow entity
  • Verwenden der bewerteten Ausgabe des Modells in einem Power BI-BerichtUsing the scored output from the model in a Power BI report

Weitere Informationen zur Machine Learning-Automatisierung in Power BI finden Sie unter Automatisiertes Machine Learning in Power BI.For more information about Machine Learning automation in Power BI, see Automated Machine Learning in Power BI.