KI mit DataflowsAI with dataflows

In diesem Artikel werden Möglichkeiten erläutert, wie künstliche Intelligenz (KI) mit Dataflows verwendet werden kann.In this article we discuss ways you can use artificial intelligence (AI) with dataflows. Die in diesem Artikel beschriebenen Bereiche sind die folgenden:The areas described in this article are the following:

  • Cognitive ServicesCognitive Services
  • Automatisiertes maschinelles LernenAutomated Machine Learning
  • Azure Machine Learning-IntegrationAzure Machine Learning Integration

Cognitive Services in Power BICognitive Services in Power BI

Sie können mit Cognitive Services in Power BI verschiedene Algorithmen der Azure Cognitive Services anwenden, um Ihre Daten in der Self-Service-Datenaufbereitung für Dataflows zu ergänzen.With Cognitive Services in Power BI, you can apply different algorithms from Azure Cognitive Services to enrich your data in the self-service data prep for Dataflows.

Die derzeit unterstützten Dienste sind Standpunktanalyse, Schlüsselbegriffserkennung, Sprachenerkennung und Bildmarkierung.The services that are supported today are Sentiment Analysis, Key Phrase Extraction, Language Detection, and Image Tagging. Die Transformationen werden auf dem Power BI-Dienst ausgeführt und erfordern kein Azure Cognitive Services-Abonnement.The transformations are executed on the Power BI Service and do not require an Azure Cognitive Services subscription. Dieses Feature erfordert Power BI Premium.This feature requires Power BI Premium.

Aktivieren von KI-FunktionenEnabling AI features

Cognitive Services werden für Premium-Kapazitätsknoten EM2, A2 oder P1 und höher unterstützt.Cognitive services are supported for Premium capacity nodes EM2, A2, or P1 and above. Eine separate KI-Workload auf der Kapazität wird zum Ausführen von Cognitive Services verwendet.A separate AI workload on the capacity is used to run cognitive services. Während der Vorschauversion (vor Juni 2019) war diese Workload standardmäßig deaktiviert.During public preview (prior to June 2019), this workload was disabled by default. Bevor Cognitive Services in Power BI verwendet werden können, muss die KI-Workload in den Einstellungen für die Kapazität des Verwaltungsportals aktiviert werden.Before using cognitive services in Power BI, the AI workload needs to be enabled in the capacity settings of the admin portal. Sie können die KI-Workload im Workloadsabschnitt aktivieren und die Höchstmenge an Arbeitsspeicher definieren, die diese Workload nutzen soll.You can turn on the AI workload in the workloads section, and define the maximum amount of memory you would like this workload to consume. Die empfohlene Arbeitsspeichergrenze beträgt 20%.The recommended memory limit is 20%. Die Überschreitung dieser Grenze führt zur Verlangsamung der Abfrage.Exceeding this limit causes the query to slow down.

Cognitive Services in Power BI

Erste Schritte mit Cognitive Services in Power BIGetting started with Cognitive Services in Power BI

Cognitive Services-Transformationen sind Teil der Self-Service-Datenvorbereitung für Datenflüsse.Cognitive Services transforms are part of the Self-Service Data Prep for dataflows. Um die Daten mit Cognitive Services zu erweitern, beginnen Sie mit dem Bearbeiten eines Datenflusses.To enrich your data with Cognitive Services, start by editing a dataflow.

Bearbeiten einer Datenbank

Klicken Sie auf die Schaltfläche KI Insights im oberen Menüband des Power Query-Editors.Select the AI Insights button in the top ribbon of Power Query Editor.

KI Insights im Power Query-Editor

Wählen Sie im Popupfenster die Funktion aus, die Sie verwenden möchten, und die Daten, die Sie transformieren möchten.In the pop-up window, select the function you want to use and the data you want to transform. In diesem Beispiel bewerte ich den Standpunkt einer Spalte, die einen Rezensionstext enthält.In this example, I'm scoring the sentiment of a column that contains review text.

Auswählen einer Funktion

CultureInfo ist eine optionale Eingabe, um die Sprache des Texts anzugeben.Cultureinfo is an optional input to specify the language of the text. Dieses Feld erwartet einen ISO-Code.This field is expecting an ISO code. Sie können eine Spalte oder ein statisches Feld als Eingabe für CultureInfo verwenden.You can use a column as input for Cultureinfo, or a static field. In diesem Beispiel wird die Sprache Englisch (En) für die gesamte Spalte angegeben.In this example, the language is specified as English (en) for the whole column. Wenn Sie dieses Feld leer lassen, erkennt Power BI die Sprache automatisch vor dem Anwenden der Funktion.If you leave this field blank, Power BI automatically detects the language before applying the function. Wählen Sie als Nächstes Invoke aus.Next, select Invoke.

Auswählen von Invoke

Nach dem Aufrufen der Funktion wird das Ergebnis als neue Spalte der Tabelle hinzugefügt.After invoking the function, the result is added as a new column to the table. Die Transformation wird auch als angewendeter Schritt in der Abfrage hinzugefügt.The transformation is also added as an applied step in the query.

Neue Spalte wird erstellt

Wenn die Funktion mehrere Ausgabefelder zurückgibt, fügt der Aufruf der Funktion eine neue Spalte mit einem Datensatz der mehreren Ausgabefelder hinzu.If the function returns multiple output fields, invoking the function adds a new column with a record of the multiple output fields.

Verwenden Sie die Erweiterungsoption, um einen oder beide Werte Ihren Daten als Spalten hinzuzufügen.Use the expand option to add one or both values as columns to your data.

Spalte erweitern

Verfügbare FunktionenAvailable functions

Dieser Abschnitt beschreibt die verfügbaren Funktionen in Cognitive Services in Power BI.This section describes the available functions in Cognitive Services in Power BI.

Erkennen von SpracheDetect Language

Die Sprachenerkennungsfunktion wertet Texteingabe aus und gibt für jedes Feld den Sprachennamen und ISO-Bezeichner zurück.The language detection function evaluates text input, and for each field, returns the language name and ISO identifier. Diese Funktion ist nützlich für Datenspalten, die beliebigen Text sammeln, wobei die Sprache unbekannt ist.This function is useful for data columns that collect arbitrary text, where language is unknown. Die Funktion erwartet Daten im Textformat als Eingabe.The function expects data in text format as input.

Die Textanalyse erkennt bis zu 120 Sprachen.Text Analytics recognizes up to 120 languages. Weitere Informationen finden Sie unter Sprach- und Regionsunterstützung für die Textanalyse-API.For more information, see supported languages.

Erkennen von SchlüsselbegriffenExtract Key Phrases

Die Funktion Schlüsselbegriffserkennung wertet unstrukturierten Text aus und gibt für jedes Textfeld eine Liste von Schlüsselbegriffen zurück.The Key Phrase Extraction function evaluates unstructured text, and for each text field, returns a list of key phrases. Die Funktion erfordert ein Textfeld als Eingabe und akzeptiert eine optionale Eingabe für Cultureinfo.The function requires a text field as input, and accepts an optional input for Cultureinfo. (Siehe Abschnitt Erste Schritte weiter oben in diesem Artikel).(See the Getting Started section earlier in this article).

Die Schlüsselbegriffserkennung funktioniert am besten, wenn Sie ihr größere Textblöcke zur Verarbeitung zuweisen.Key phrase extraction works best when you give it bigger chunks of text to work on. Dies ist anders als bei der Standpunktanalyse, die kleinere Textblöcke besser verarbeiten kann.This is opposite from sentiment analysis, which performs better on smaller blocks of text. Um die besten Ergebnisse beider Vorgänge zu erhalten, sollten Sie die Eingaben entsprechend umstrukturieren.To get the best results from both operations, consider restructuring the inputs accordingly.

Score SentimentScore Sentiment

Die Score Sentiment-Funktion wertet die Texteingabe aus und gibt eine Stimmungspunktzahl im Bereich von 0 (negativ) bis 1 (positiv) für jedes Dokument zurück.The Score Sentiment function evaluates text input and returns a sentiment score for each document, ranging from 0 (negative) to 1 (positive). Diese Funktion ist nützlich zum Erkennen von positiven und negativen Standpunkten in sozialen Medien, Kundenrezensionen und Diskussionsforen.This function is useful for detecting positive and negative sentiment in social media, customer reviews, and discussion forums.

Die Textanalyse verwendet einen Machine Learning-Klassifizierungsalgorithmus, um eine Stimmungspunktzahl zwischen 0 und 1 zu generieren.Text Analytics uses a machine learning classification algorithm to generate a sentiment score between 0 and 1. Bewertungen, die näher an 1 liegen, weisen auf einen positiven Standpunkt hin, Bewertungen, die näher an 0 liegen, auf einen negativen Standpunkt.Scores closer to 1 indicate positive sentiment, scores closer to 0 indicate negative sentiment. Das Modell ist mit einem umfangreichen Textkörper mit Standpunktzuordnungen vortrainiert.The model is pre-trained with an extensive body of text with sentiment associations. Derzeit können Sie nicht Ihre eigenen Trainingsdaten verwenden.Currently, it's not possible to provide your own training data. Das Modell verwendet zur Textanalyse eine Kombination aus Verfahren – einschließlich Textverarbeitung, Wortartanalyse, Wortplatzierung und Wortassoziationen.The model uses a combination of techniques during text analysis, including text processing, part-of-speech analysis, word placement, and word associations. Weitere Informationen zum Algorithmus finden Sie unter Introducing Text Analytics (Einführung in die Textanalyse).For more information about the algorithm, see Introducing Text Analytics.

Die Standpunktanalyse wird für das gesamte Eingabefeld durchgeführt, im Gegensatz zum Erkennen des Standpunkts für eine bestimmte Entität im Text.Sentiment analysis is performed on the entire input field, as opposed to extracting sentiment for a particular entity in the text. In der Praxis besteht die Tendenz, dass sich die Genauigkeit der Bewertung verbessert, wenn Dokumente einen oder zwei Sätze anstatt eines großen Textblocks enthalten.In practice, there's a tendency for scoring accuracy to improve when documents contain one or two sentences rather than a large block of text. Während einer Objektivitätsbewertungsphase bestimmt das Modell, ob ein Eingabefeld als Ganzes objektiv ist oder einen Standpunkt enthält.During an objectivity assessment phase, the model determines whether an input field as a whole is objective or contains sentiment. Ein überwiegend objektives Eingabefeld wird nicht der Standpunkterkennung übergeben und erhält ohne weitere Verarbeitung eine Bewertung von 0,50.An input field that is mostly objective does not progress to the sentiment detection phrase, resulting in a .50 score, with no further processing. Für die folgenden Eingabefelder in der Pipeline generiert die nächste Erkennung je nach Grad des im Eingabefeld erkannten Standpunkts eine Bewertung über oder unter 0,50.For input fields continuing in the pipeline, the next phase generates a score above or below .50, depending on the degree of sentiment detected in the input field.

Derzeit unterstützt die Standpunktanalyse Englisch, Deutsch, Spanisch und Französisch.Currently, Sentiment Analysis supports English, German, Spanish, and French. Andere Sprachen befinden sich in der Vorschauphase.Other languages are in preview. Weitere Informationen finden Sie unter Unterstützte Sprachen.For more information, see Supported languages.

Tag ImagesTag Images

Die Tag Images-Funktion gibt Tags basierend auf mehr als 2.000 erkennbaren Objekten, Lebewesen, Landschaften und Aktionen zurück.The Tag Images function returns tags based on more than 2,000 recognizable objects, living beings, scenery, and actions. Wenn Tags nicht eindeutig oder nicht allgemein bekannt sind, bietet die Ausgabe „Hinweise“, um die Bedeutung des Tags im Kontext einer bekannten Einstellung zu verdeutlichen.When tags are ambiguous or not common knowledge, the output provides 'hints' to clarify the meaning of the tag in context of a known setting. Tags sind nicht taxonomisch angeordnet, und es gibt keine Vererbungshierarchien.Tags are not organized as a taxonomy and no inheritance hierarchies exist. Eine Auflistung von Inhaltstags bildet die Grundlage für eine „Bildbeschreibung“, die in einer für Menschen lesbaren Sprache in vollständigen Sätzen angezeigt wird.A collection of content tags forms the foundation for an image 'description' displayed as human readable language formatted in complete sentences.

Nach dem Hochladen eines Bilds oder der Angabe einer Bild-URL geben Algorithmen für maschinelles Sehen Tags basierend auf den im Bild identifizierten Objekten, Lebewesen und Aktionen aus.After uploading an image or specifying an image URL, Computer Vision algorithms output tags based on the objects, living beings, and actions identified in the image. Das Taggen ist nicht auf das Hauptbildmotiv wie etwa eine Person im Vordergrund beschränkt, sondern beinhaltet auch die Einstellung (drinnen oder draußen) Möbel, Werkzeuge, Pflanzen, Tiere, Zubehör, Geräte usw.Tagging is not limited to the main subject, such as a person in the foreground, but also includes the setting (indoor or outdoor), furniture, tools, plants, animals, accessories, gadgets, and so on.

Diese Funktion setzt eine Bild-URL oder ein Base-64-Feld als Eingabe voraus.This function requires an image URL or abase-64 field as input. Zurzeit unterstützt die Bildmarkierung Englisch, Spanisch, Japanisch, Portugiesisch und Chinesisch (vereinfacht).At this time, image tagging supports English, Spanish, Japanese, Portuguese, and Simplified Chinese. Weitere Informationen finden Sie unter Unterstützte Sprachen.For more information, see Supported languages.

Automatisiertes Machine Learning in Power BIAutomated Machine Learning in Power BI

Automatisiertes maschinelles Lernen (AutoML) für Dataflows ermöglicht Business Analysts, ML-Modelle (Machine Learning) direkt in Power BI zu trainieren, zu prüfen und aufzurufen.Automated machine learning (AutoML) for dataflows enables business analysts to train, validate, and invoke Machine Learning (ML) models directly in Power BI. Dazu gehört eine einfache Umgebung zur Erstellung eines neuen ML-Modells, in dem Analysten ihre Dataflows verwenden können, um die Eingabedaten zum Trainieren des Modells festzulegen.It includes a simple experience for creating a new ML model where analysts can use their dataflows to specify the input data for training the model. Der Dienst extrahiert automatisch die wichtigsten Features, wählt einen geeigneten Algorithmus aus, optimiert das ML-Modell und prüft es.The service automatically extracts the most relevant features, selects an appropriate algorithm, and tunes and validates the ML model. Nach dem Trainieren eines Modells erstellt Power BI automatisch einen Leistungsbericht, der die Ergebnisse der Prüfung enthält.After a model is trained, Power BI automatically generates a performance report that includes the results of the validation. Das Modell kann anschließend für alle neuen oder aktualisierten Daten im Dataflow aufgerufen werden.The model can then be invoked on any new or updated data within the dataflow.

Bildschirm zum maschinellen Lernen

Automatisiertes maschinelles Lernen ist nur für Datenflows verfügbar, die in Power BI Premium und Embedded gehostet werden.Automated machine learning is available for dataflows that are hosted on Power BI Premium and Embedded capacities only.

Arbeiten mit AutoMLWorking with AutoML

Dataflows lassen eine Self-Service-Datenaufbereitung für Big-Data-Szenarios zu.Dataflows offer self-serve data prep for big data. AutoML ist in Dataflows integriert und ermöglicht Ihnen zum Erstellen von Machine Learning-Modellen die Aufbereitung Ihrer Daten direkt in Power BI.AutoML is integrated into dataflows and enables you to leverage your data prep effort for building machine learning models, right within Power BI.

AutoML in Power BI ermöglicht Datenanalysten den Einsatz von Dataflows, um Machine Learning Modelle in vereinfachter Weise zu erstellen, wobei nur Power BI-Fertigkeiten genutzt werden.AutoML in Power BI enables data analysts to use dataflows to build machine learning models with a simplified experience, using just Power BI skills. Der größte Teil der Data Science hinter der Erstellung der ML-Modelle wird von Power BI automatisiert.Most of the data science behind the creation of the ML models is automated by Power BI. Dies geschieht mithilfe von Vorkehrungen, die sicherstellen, dass das produzierte Modell eine gute Qualität aufweist. Außerdem erhalten Sie Einblick in den Prozess, der zum Erstellen des ML-Modells verwendet wird.It has guardrails to ensure that the model produced has good quality and provides visibility into the process used to create your ML model.

AutoML unterstützt für Dataflows das Erstellen von Modellen der Typen Binäre Vorhersage, Klassifizierung und Regression.AutoML supports the creation of Binary Prediction, Classification, and Regression Models for dataflows. Dies sind beaufsichtigte Machine Learning-Techniken, was bedeutet, dass sie aus den bekannten Ergebnissen früherer Beobachtungen lernen, um die Ergebnisse anderer Beobachtungen vorherzusagen.These are types of supervised machine learning techniques, which means that they learn from the known outcomes of past observations to predict the outcomes of other observations. Das Eingabedataset zum Trainieren eines AutoML-Modells besteht aus einer Reihe von Datensätzen, die mit den bekannten Ergebnissen beschriftet sind.The input dataset for training an AutoML model is a set of records that are labeled with the known outcomes.

AutoML in Power BI integriert automatisiertes Machine Learning aus Azure Machine Learning zur Erstellung Ihrer Machine Learning-Modelle.AutoML in Power BI integrates automated ML from Azure Machine Learning to create your ML models. Sie benötigen jedoch kein Azure-Abonnement, um AutoML in Power BI zu nutzen.However, you don't need an Azure subscription to use AutoML in Power BI. Der Prozess des Trainings und Hostings der ML-Modelle wird vollständig vom Power BI-Dienst verwaltet.The process of training and hosting the ML models is managed entirely by the Power BI service.

Nachdem ein ML-Modell trainiert wurde, erstellt AutoML automatisch einen Power BI-Bericht, der die wahrscheinliche Leistung Ihres ML-Modells erklärt.After an ML model is trained, AutoML automatically generates a Power BI report that explains the likely performance of your ML model. AutoML legt den Schwerpunkt auf Erklärbarkeit, indem es die wichtigsten Einflussfaktoren unter Ihren Eingaben hervorhebt, die die von Ihrem Modell gelieferten Vorhersagen beeinflussen.AutoML emphasizes explainability by highlighting the key influencers among your inputs that influence the predictions returned by your model. Der Bericht enthält auch Schlüsselmetriken für das Modell.The report also includes key metrics for the model.

Andere Seiten des generierten Berichts zeigen eine statistische Zusammenfassung zum Modell und die Trainingsdetails.Other pages of the generated report show the statistical summary of the model and the training details. Die statistische Zusammenfassung ist für Benutzer von Interesse, die die üblichen Data-Science-Measures der Modellleistung einsehen möchten.The statistical summary is of interest to users who would like to see the standard data science measures of model performance. In den Trainingsdetails sind alle Iterationen mit den zugehörigen Modellierungsparametern zusammengefasst, die zur Erstellung Ihres Modells erfolgt sind.The training details summarize all the iterations that were run to create your model, with the associated modeling parameters. Außerdem wird beschrieben, wie die einzelnen Eingaben zur Erstellung des ML-Modells verwendet wurden.It also describes how each input was used to create the ML model.

Danach können Sie Ihr ML-Modell auf Ihre Daten anwenden, um es zu bewerten.You can then apply your ML model to your data for scoring. Bei der Aktualisierung des Dataflows werden Ihre Daten mit Vorhersagen aus Ihrem ML-Datenmodell aktualisiert.When the dataflow is refreshed, your data is updated with predictions from your ML model. Power BI bietet auch eine individualisierte Erklärung für die jeweilige Vorhersage, die das ML-Modell liefert.Power BI also includes an individualized explanation for each specific prediction that the ML model produces.

Erstellen eines Machine Learning-ModellsCreating a machine learning model

In diesem Abschnitt wird das Erstellen eines AutoML-Modells beschrieben.This section describes how to create an AutoML model.

Datenaufbereitung zum Erstellen eines ML-ModellsData prep for creating an ML model

Um ein Machine Learning-Modell in Power BI zu erstellen, müssen Sie zunächst einen Dataflow für die Daten mit den historischen Ergebnisinformationen erstellen, der zum Trainieren des ML-Modells verwendet wird.To create a machine learning model in Power BI, you must first create a dataflow for the data containing the historical outcome information, which is used for training the ML model. Sie sollten auch berechnete Spalten für Geschäftsmetriken hinzufügen, die starke Prädiktoren für das Ergebnis sein können, das Sie vorherzusagen versuchen.You should also add calculated columns for any business metrics that may be strong predictors for the outcome you're trying to predict. Details zum Konfigurieren Ihres Dataflows finden Sie unter Konfigurieren und Nutzen eines Dataflows.For details on configuring your dataflow, see configure and consume a dataflow.

In AutoML gelten für das Trainieren eines Machine Learning-Modells bestimmte Anforderungen.AutoML has specific data requirements for training a machine learning model. Diese Anforderungen werden in den folgenden Abschnitten basierend auf den jeweiligen Modelltypen beschrieben.These requirements are described in sections below, based on respective model types.

Konfigurieren der Eingaben in das ML-ModellConfiguring the ML model inputs

Um ein AutoML-Modell zu erstellen, klicken Sie in der Spalte Aktionen der Dataflowentität auf das ML-Symbol und wählen Machine Learning-Modell hinzufügen aus.To create an AutoML model, select the ML icon in the Actions column of the dataflow entity, and select Add a machine learning model.

Machine Learning-Modell hinzufügen

Es wird eine vereinfachte Umgebung gestartet, die aus einem Assistenten besteht, der Sie durch die Erstellung des ML-Modells begleitet.A simplified experience is launched, consisting of a wizard that guides you through the process of creating the ML model. Der Assistent umfasst die folgenden einfachen Schritte.The wizard includes the following simple steps.

1. Wählen Sie die Entität mit den historischen Daten und das Ergebnisfeld aus, für das Sie eine Vorhersage wünschen.1. Select the entity with the historical data, and the outcome field for which you want a prediction

Im Ergebnisfeld wird das Beschriftungsattribut für das Training des ML-Modells bestimmt. Die folgende Abbildung veranschaulicht das.The outcome field identifies the label attribute for training the ML model, shown in the following image.

Historische Ergebnisdaten auswählen

2. Wählen Sie einen Modelltyp aus.2. Choose a model type

Wenn Sie das Ergebnisfeld angeben, analysiert AutoML die Beschriftungsdaten, um den wahrscheinlichsten ML-Modelltyp vorzuschlagen, der trainiert werden kann.When you specify the outcome field, AutoML analyzes the label data to recommend the most likely ML model type that can be trained. Wie im Folgenden dargestellt, können Sie einen anderen Modelltyp auswählen, indem Sie auf „Anderes Modell auswählen“ klicken.You can pick a different model type as shown below by clicking on “Select a different model”.

Modell auswählen

Hinweis

Einige Modelltypen werden möglicherweise nicht für die von Ihnen ausgewählten Daten unterstützt und sind daher deaktiviert.Some model types may not be supported for the data that you have selected and hence would be disabled. Im obigen Beispiel ist „Regression“ deaktiviert, da eine Textspalte als Ergebnisfeld ausgewählt ist.In the above example, Regression is disabled, as a text column is selected as outcome field.

3. Wählen Sie die Eingaben aus, die das Modell als Prognosesignale verwenden soll.3. Select the inputs you want the model to use as predictive signals

AutoML analysiert eine Stichprobe der ausgewählten Entität, um die Eingaben vorzuschlagen, die für das Training des ML-Modells verwendet werden können.AutoML analyzes a sample of the selected entity to suggest the inputs that can be used for training the ML model. Neben Feldern, die nicht ausgewählt sind, werden Erläuterungen angezeigt.Explanations would be provided next to fields that are not selected. Wenn ein bestimmtes Feld zu viele unterschiedliche Werte oder nur einen Wert oder eine geringfügige oder hohe Korrelation mit dem Ergebnisfeld aufweist, wird es nicht empfohlen.If a particular field has too many distinct values or only one value, or low or high correlation with the output field, it would not be recommended.

Alle Eingaben, die vom Ergebnisfeld (oder Beschriftungsfeld) abhängig sind, dürfen nicht zum Trainieren des ML-Modells verwendet werden, da sie dessen Leistung beeinträchtigen.Any inputs that are dependent on the outcome field (or the label field) should not be used for training the ML model, since they will affect its performance. Felder dieser Art werden als Felder gekennzeichnet, die „eine verdächtig hohe Korrelation mit dem Ergebnisfeld“ aufweisen.Such fields would be flagged as having “suspiciously high correlation with output field”. Wenn diese Felder in die Trainingsdaten einbezogen werden, kann dies zu einem Beschriftungsleck führen, bei dem das Modell bei Prüfungs- oder Testdaten gut abschneidet, diese Leistung bei Verwendung in der Produktion zur Bewertung jedoch nicht erreicht.Introducing these fields into the training data causes label leakage, where the model performs well on the validation or test data but cannot match that performance when used in production for scoring. Ein Beschriftungsleck kann bei AutoML-Modellen ein Problem darstellen, wenn die Leistung des Trainingsmodells überdurchschnittlich gut ist.Label leakage could be a possible concern in AutoML models, when training model performance is too good to be true.

Diese Featureempfehlung beruht auf einer Stichprobe von Daten. Daher sollten Sie die verwendeten Eingaben überprüfen.This feature recommendation is based on a sample of a data, so you should review the inputs used. Sie haben die Möglichkeit, die Auswahl so zu ändern, dass nur die Felder einbezogen werden, die mit dem Modell untersucht werden sollen.You have the option to change the selections to include only the fields you want the model to study. Sie können auch alle Felder auswählen, indem Sie das Kontrollkästchen neben dem Entitätsnamen aktivieren.You can also select all the fields by selecting the checkbox next to the entity name.

Eingabefelder anpassen

4. Geben Sie Ihrem Modell einen Namen, und speichern Sie die Konfiguration.4. Name your model and save your configuration

Im letzten Schritt geben Sie dem Modell einen Namen und wählen „Speichern und trainieren“ aus, um mit dem Training des ML-Modells zu beginnen.In the final step, you can name the model and select Save and train which begins training the ML model. Sie können entscheiden, ob Sie die Trainingszeit verkürzen möchten, um schnelle Ergebnisse zu erzielen, oder ob Sie die Trainingszeit verlängern möchten, um das beste Modell zu erhalten.You can choose to reduce the training time to see quick results or increase the amount of time spent in training to get the best model.

Dem Modell einen Namen geben

ML-ModelltrainingML model training

Das Training von AutoML-Modellen ist Teil der Aktualisierung des Dataflows.Training of AutoML models is a part of the dataflow refresh. AutoML bereitet zunächst Ihre Daten auf das Training auf.AutoML first prepares your data for training. AutoML unterteilt die von Ihnen bereitgestellten historischen Daten in Trainings- und Testdatasets.AutoML splits the historical data you provide into training and testing datasets. Der Testdataset besteht aus zurückgehaltenen Daten, die zum Prüfen der Modellleistung nach dem Training verwendet werden.The test dataset is a holdout set that is used for validating the model performance after training. Diese werden als Trainings- und Test entitäten im Dataflow realisiert.These are realized as Training and Testing entities in the dataflow. AutoML verwendet zur Modellprüfung die Kreuzvalidierung.AutoML uses cross-validation for the model validation.

Anschließend wird jedes Eingabefeld analysiert und die Anrechnung angewendet, bei der fehlende Werte durch Ersatzwerte ausgetauscht werden.Next, each input field is analyzed and imputation is applied, which replaces any missing values with substituted values. AutoML arbeitet mit verschiedenen Anrechnungsstrategien.A couple of different imputation strategies are used by AutoML. Bei Eingabeattributen, die als numerische Features behandelt werden, wird der Mittelwert der Spaltenwerte zur Anrechnung verwendet.For input attributes treated as numeric features, the mean of the column values is used for imputation. Bei Eingabeattributen, die als kategorische Features behandelt werden, verwendet AutoML den Modus der Spaltenwerte zur Anrechnung.For input attributes treated as categorical features, AutoML uses the mode of the column values for imputation. Der Mittelwert und der Modus von Werten, die zur Anrechnung verwendet werden, werden vom AutoML-Framework in dem Trainingsdataset verwendet, das eine Teilstichprobe darstellt.The mean and mode of values used for imputation are calculated by the AutoML framework on the subsampled training dataset.

Anschließend werden bei Bedarf Stichprobenentnahmen und Normalisierungen auf Ihre Daten angewendet.Then, sampling and normalization are applied to your data as required. Bei Klassifizierungsmodellen führt AutoML die Eingabedaten über geschichtete Zufallsstichprobenentnahmen aus und gleicht die Klassen aus, sodass alle dieselbe Anzahl von Zeilen enthalten.For classification models, AutoML runs the input data through stratified sampling and balances the classes to ensure the row counts are equal for all.

AutoML wendet auf jedes ausgewählte Eingabefeld je nach Datentyp und statistischen Eigenschaften mehrere Transformationen an.AutoML applies several transformations on each selected input field based on its data type, and its statistical properties. AutoML verwendet diese Transformationen zum Extrahieren von Features, die zum Trainieren Ihres ML-Modells verwendet werden.AutoML uses these transformations to extract features for use in training your ML model.

Der Trainingsprozess für AutoML-Modelle besteht aus bis zu 50 Iterationen mit unterschiedlichen Modellierungsalgorithmen und Hyperparametereinstellungen, um das Modell mit der besten Leistung zu finden.The training process for AutoML models consists of up to 50 iterations with different modeling algorithms and hyperparameter settings to find the model with the best performance. Das Training kann schnell mit weniger Iterationen enden, wenn AutoML feststellt, dass keine Leistungsverbesserung beobachtet werden kann.Training can end early with lesser iterations if AutoML notices that there is no performance improvement being observed. Die Leistung der einzelnen Modelle wird mittels Prüfung mit dem zurückgehaltenen Testdataset bewertet.The performance of each of these models is assessed by validation with the holdout test dataset. Während dieses Trainingsschritts erstellt AutoML verschiedene Pipelines für Training und Prüfung dieser Iterationen.During this training step, AutoML creates several pipelines for training and validation of these iterations. Der Prozess der Leistungsbewertung von Modellen kann je nach Größe Ihres Datasets und der verfügbaren Kapazitätsressourcen eine gewisse Zeit dauern, und zwar von einigen Minuten bis zu mehreren Stunden, je nach der im Assistenten konfigurierten Trainingszeit.The process of assessing the performance of the models can take time, anywhere from several minutes to a couple of hours up-to the training time configured in the wizard, depending on the size of your dataset and the capacity resources available.

In einigen Fällen verwendet das endgültige generierte Modell möglicherweise Ensemble-Lernmethoden, bei denen mehrere Modelle verwendet werden, um eine bessere Vorhersageleistung zu erzielen.In some cases, the final model generated may use ensemble learning, where multiple models are used to deliver better predictive performance.

Erklärbarkeit des AutoML-ModellsAutoML model explainability

Nachdem dem Trainieren des Modells analysiert AutoML die Beziehung zwischen Eingabefeatures und Modellausgabe.After the model has been trained, AutoML analyzes the relationship between the input features and the model output. Es bewertet für jedes Eingabefeature das Ausmaß der Änderung an der Modellausgabe für das zurückgehaltene Testdataset.It assesses the magnitude of change to the model output for the holdout test dataset for each input feature. Dies wird als Featurepriorität bezeichnet.This is known as the feature importance. Dies geschieht im Rahmen der Aktualisierung nach Abschluss des Trainings.This happens as a part of the refresh once training is complete. Daher dauert die Aktualisierung möglicherweise länger als durch die im Assistenten konfigurierte Trainingszeit angegeben.Hence your refresh may take longer than the training time configured in the wizard.

Featurepriorität

AutoML-ModellberichtAutoML model report

AutoML generiert einen Power BI-Bericht, der die Leistung des Modells während der Prüfung sowie die globale Featurepriorität aufzeigt.AutoML generates a Power BI report that summarizes the performance of the model during validation, along with the global feature importance. Auf diesen Bericht können Sie nach der Aktualisierung des Dataflows über die Registerkarte „Machine Learning-Modell“ zugreifen.This report can be accessed from the Machine Learning Model tab once the dataflow refresh is successful. Der Bericht fasst die Ergebnisse der Anwendung des ML-Modells auf die zurückgehaltenen Testdaten zusammen und vergleicht die Vorhersagen mit den bekannten Ergebniswerten.The report summarizes the results from applying the ML model to the holdout test data and comparing the predictions with the known outcome values.

Sie können den Bericht zum Modell überprüfen, um seine Leistung zu verstehen.You can review the model report to understand its performance. Sie können auch prüfen, ob die wichtigsten Einflussfaktoren des Modells mit den geschäftlichen Erkenntnissen zu den bekannten Ergebnissen übereinstimmen.You can also validate that the key influencers of the model align with the business insights about the known outcomes.

Die Diagramme und Measures, die zum Beschreiben der Modellleistung im Bericht verwendet werden, hängen vom Modelltyp ab.The charts and measures used to describe the model performance in the report depend on the model type. Diese Leistungsdiagramme und -measures werden in den folgenden Abschnitten beschrieben.These performance charts and measures are described in the following sections.

Auf weiteren Seiten des Berichts werden ggf. statistische Measures des Modells aus Data Science-Perspektive beschrieben.Additional pages in the report may describe statistical measures about the model from a data science perspective. Der Bericht Binäre Vorhersage enthält beispielsweise ein Diagramm der Verstärkung und die Grenzwertoptimierungskurve für das Modell.For instance, the Binary Prediction report includes a gain chart and the ROC curve for the model.

Die Berichte enthalten auch die Seite Trainingsdetails mit einer Beschreibung, wie das Modell trainiert wurde, und einem Diagramm, mit dem die Modellleistung bei den einzelnen Iterationsläufen beschrieben wird.The reports also include a Training Details page that includes a description of how the model was trained, and a chart describing the model performance over each of the iterations run.

Details zum Training

In einem weiteren Abschnitt auf dieser Seite wird neben dem erkannten Typ des Eingabefelds auch die Anrechnungsmethode beschrieben, die zum Auffüllen fehlender Werte verwendet wird.Another section on this page describes the detected type of the input field and imputation method used for filling missing values. Der Abschnitt enthält auch die Parameter, die vom endgültigen Modell verwendet werden.It also includes the parameters used by the final model.

Weitere Informationen zum Modell

Wenn das produzierte Modell Ensemble-Lernmethoden verwendet, enthält die Seite Trainingsdetails auch ein Diagramm, mit dem die Gewichtung der einzelnen Teilmodelle im Ensemble sowie deren Parameter beschrieben werden.If the model produced uses ensemble learning, then the Training Details page also includes a chart showing the weight of each constituent model in the ensemble, as well as its parameters.

Gewichtung im Ensemble

Anwenden des AutoML-ModellsApplying the AutoML model

Falls Sie mit der Leistung des erstellten ML-Modells zufrieden sind, können Sie es auf neue oder aktualisierte Daten anwenden, wenn Ihr Dataflow aktualisiert wird.If you're satisfied with the performance of the ML model created, you can apply it to new or updated data when your dataflow is refreshed. Dies können Sie im Modellbericht tun, indem Sie rechts oben auf die Schaltfläche Anwenden oder auf der Registerkarte „Machine Learning-Modelle“ unter „Aktionen“ auf die Schaltfläche „ML-Modell anwenden“ klicken.You can do this from the model report, by selecting the Apply button in the top-right corner or the Apply ML Model button under actions in the Machine Learning Models tab.

Um das ML-Modell anzuwenden, müssen Sie den Namen der Entität, auf die es angewendet werden soll, und ein Präfix für die Spalten angeben, die bei der Modellausgabe dieser Entität hinzugefügt werden sollen.To apply the ML model, you must specify the name of the entity to which it must be applied, and a prefix for the columns that will be added to this entity for the model output. Das Standardpräfix für die Spaltennamen ist der Modellname.The default prefix for the column names is the model name. Die Funktion Anwenden kann zusätzliche, für den Modelltyp spezifische Parameter einschließen.The Apply function may include additional parameters specific to the model type.

Beim Anwenden des ML-Modells werden zwei neue Dataflowentitäten erstellt, welche die Vorhersagen und individualisierte Erklärung für die einzelnen Zeilen enthalten, die in der Ausgabeentität bewertet werden.Applying the ML model creates two new dataflow entities which contains the predictions and individualized explanations for each row that it scores in the output entity. Wenn Sie beispielsweise das Modell PurchaseIntent auf die Entität OnlineShoppers anwenden, werden bei der Ausgabe die Entitäten OnlineShoppers enriched PurchaseIntent (durch OnlineShoppers erweitertes PurchaseIntent) und OnlineShoppers enriched PurchaseIntent explanations (durch OnlineShoppers erweiterte PurchaseIntent-Erklärung) erzeugt.For instance, if you apply the PurchaseIntent model to the OnlineShoppers entity, the output will generate the OnlineShoppers enriched PurchaseIntent and OnlineShoppers enriched PurchaseIntent explanations entities. Für die einzelnen Zeilen in der erweiterten Entität werden Erläuterungen in mehrere Zeilen in der erweiterten Erklärungsentität im Eingabefeature unterteilt.For each row in the enriched entity, The Explanations is broken down into multiple rows in the enriched explanations entity based on the input feature. Mit ExplanationIndex können die Zeilen aus der erweiterten Erklärungsentität der Zeile in der erweiterten Entität zugeordnet werden.An ExplanationIndex helps map the rows from the enriched explanations entity to the row in enriched entity.

Abfrage-Editor

Sie können auch ein beliebigen Power BI-AutoML-Modell auf Entitäten in einem Dataflow im selben Arbeitsbereich anwenden, indem Sie KI Insights im PQO-Funktionsbrowser verwenden.You can also apply any Power BI AutoML model to entities in any dataflow in the same workspace using AI Insights in PQO function browser. Auf diese Weise können Sie von anderen Personen erstellte Modelle im selben Arbeitsbereich verwenden, ohne Besitzer des Dataflows sein zu müssen, zu dem das Modell gehört.This way, you can use models created by others in the same workspace without necessarily being an owner of the dataflow that has the model. Power Query entdeckt alle Power BI-ML-Modelle im Arbeitsbereich und macht sie als dynamische Power Query-Funktionen verfügbar.Power Query discovers all the Power BI ML models in the workspace and exposes them as dynamic Power Query functions.  Sie können diese Funktionen aufrufen, indem Sie über das Menüband im Power Query-Editor darauf zugreifen oder indem Sie die M-Funktion direkt aufrufen.You can invoke those functions by accessing them from the ribbon in Power Query Editor, or by invoking the M function directly. Diese Funktionalität wird derzeit nur für Power BI-Dataflows und im Power BI-Dienst für Power Query Online unterstützt.This functionality is currently only supported for Power BI dataflows, and for Power Query Online in the Power BI service. Beachten Sie, dass dieses Verfahren völlig anders ist als das Anwenden von ML-Modellen innerhalb eines Dataflows mit dem AutoML-Assistenten.Note that this is very different from applying ML models within a dataflow using the AutoML wizard. Mit dieser Methode wird keine Erläuterungsentität erstellt, und Sie können nur dann auf Modelltrainingsberichte zugreifen oder das Modell erneut trainieren, wenn Sie Besitzer des Dataflows sind.There is no explanations entity created using this method and unless you are the owner of the dataflow, you cannot access model training reports or retrain the model. Wenn das Quellmodell bearbeitet wird (durch Hinzufügen oder Entfernen von Eingabefeldern) oder das Modell oder der Quelldataflow gelöscht wird, funktioniert dieser abhängige Dataflow nicht mehr.If the source model is edited (adding or removing input fields) or, the model or source dataflow is deleted, then this dependent dataflow would break.

Anwenden eines Modells mithilfe des PQO-Funktionsbrowsers

Nachdem Sie das Modell angewendet haben, werden Ihre Vorhersagen von AutoML mit jeder Aktualisierung des Dataflows ebenfalls aktualisiert.After you apply the model, AutoML always keeps your predictions up-to-date whenever the dataflow is refreshed.

Um die Erkenntnisse und Vorhersagen aus dem ML-Modell in einem Power BI-Bericht zu verwenden, können Sie sich in Power BI Desktop über den Connector Dataflows mit der Ausgabeentität verbinden.To use the insights and predictions from the ML model in a Power BI report, you can connect to the output entity from Power BI Desktop using the dataflows connector.

Binäre VorhersagemodelleBinary Prediction models

Modelle zur binären Vorhersage, auch bekannt als binäre Klassifizierungsmodelle, werden verwendet, um ein Dataset in zwei Gruppen aufzuteilen.Binary Prediction models, more formally known as binary classification models, are used to classify a dataset into two groups. Sie werden für die Vorhersage von Ereignissen verwendet, die ein binäres Ergebnis aufweisen können,They're used to predict events that can have a binary outcome. wie z. B. ob eine Verkaufschance in einen Abschluss konvertiert wird, ob ein Kunde abwandert, ob eine Rechnung pünktlich bezahlt wird, ob eine Transaktion betrügerisch ist usw.For instance, whether a sales opportunity will convert, whether an account will churn, whether an invoice will be paid on time, whether a transaction is fraudulent, and so on.

Die Ausgabe eines Modells zur binären Vorhersage ist eine Wahrscheinlichkeitswert, der angibt, mit welcher Wahrscheinlichkeit das angestrebte Ergebnis erreicht wird.The output of a Binary Prediction model is a probability score, which identifies the likelihood that the target outcome will be achieved.

Trainieren eines Modells zur binären VorhersageTraining a Binary Prediction model

Voraussetzungen:Pre-requisites:

  • Für jede Ergebnisklasse sind mindestens 20 Zeilen mit historischen Daten erforderlich.A minimum of 20 rows of historical data is required for each class of outcomes

Der Erstellungsprozess des Modells zur binären Vorhersage folgt den gleichen Schritten wie bei anderen AutoML-Modellen, die im Abschnitt Konfigurieren der Eingaben in das ML-Modell weiter oben beschrieben sind.The process of creation for a Binary Prediction model follows the same steps as other AutoML models, described in the section Configuring the ML model inputs above. Der Prozess unterscheidet sich lediglich im Hinblick auf den Schritt, bei dem ein Modell ausgewählt wird. Hier können Sie den Wert für das angestrebte Ergebnis auswählen, an dem Sie am meisten interessiert sind.The only difference is in the “Choose a model” step where you can select the target outcome value that you’re most interested in. Sie können auch benutzerfreundliche Beschriftungen für die Ergebnisse angeben, die im automatisch generierten Bericht verwendet werden, der die Ergebnisse der Modellüberprüfung zusammenfasst.You can also provide friendly labels for the outcomes to be used in the automatically generated report that will summarize the results of the model validation.

Assistent für binäre Vorhersagen

Bericht zum Modell zur binären VorhersageBinary Prediction model report

Mit dem Modell zur binären Vorhersage wird als Ausgabe ein Wert generiert, der angibt, mit welcher Wahrscheinlichkeit das angestrebte Ergebnis erreicht wird.The Binary Prediction model produces as an output a probability that a record will achieve the target outcome. Der Bericht enthält einen Datenschnitt für den Wahrscheinlichkeitsschwellenwert, der beeinflusst, wie die Werte über und unter dem Wahrscheinlichkeitsschwellenwert interpretiert werden.The report includes a slicer for the probability threshold, which influences how the scores above and below the probability threshold are interpreted.

Im Bericht wird die Leistung des Modells als True Positives, False Positives, True Negatives und False Negatives beschrieben.The report describes the performance of the model in terms of True Positives, False Positives, True Negatives, and False Negatives. „Richtige Positive“ und „Richtige Negative“ sind für die beiden Klassen in den Ergebnisdaten richtig vorhergesagte Ergebnisse.True Positives and True Negatives are correctly predicted outcomes for the two classes in the outcome data. „False Positives“ sind Datensätze, für die vorhergesagt wurde, dass sie angestrebte Ergebnisse enthalten, bei denen dies jedoch nicht der Fall ist.False Positives are records that were predicted to have Target outcome but actually did not. Umgekehrt sind „False Negatives“ Datensätze, die angestrebte Ergebnisse enthalten, für die jedoch vorhergesagt wurde, dass sie keine angestrebten Ergebnisse enthalten.Conversely, False Negatives are records that had Target outcome but were predicted as not having it.

Measures, z. B. Genauigkeit und Abruf, beschreiben die Auswirkung des Wahrscheinlichkeitsschwellenwerts auf die vorhergesagten Ergebnisse.Measures, such as Precision and Recall, describe the effect of the probability threshold on the predicted outcomes. Sie können den Datenschnitt für den Wahrscheinlichkeitsschwellenwert verwenden, um einen Schwellenwert auszuwählen, der einen ausgewogenen Kompromiss zwischen Genauigkeit und Abruf erreicht.You can use the probability threshold slicer to select a threshold that achieves a balanced compromise between Precision and Recall.

Vorschau der Genauigkeit

Der Bericht enthält darüber hinaus ein Kosten-Nutzen-Analysetool zur Ermittlung der Teilmenge der Grundgesamtheit, die zur Realisierung einer optimalen Gewinnspanne gezielt angesprochen werden muss.The report also includes a Cost-Benefit analysis tool to help identify the subset of the population that should be targeted to yield the highest profit. Mit der Kosten-Nutzen-Analyse soll der Gewinn mithilfe von geschätzten Kosten pro Einheit für die Zielsetzung und einem Gewinn pro Einheit bei Erzielung eines angestrebten Ergebnisses maximiert werden.Given an estimated unit cost of targeting and a unit benefit from achieving a target outcome, Cost-Benefit analysis attempts to maximize profit. Mit diesem Tool können Sie Ihren Wahrscheinlichkeitsschwellenwert basierend auf dem maximalen Punkt im Graphen zur Maximierung des Gewinns auswählen.You can use this tool to pick your probability threshold based on the maximum point in the graph to maximize profit. Sie können den Graphen auch verwenden, um den Gewinn oder die Kosten für Ihre Auswahl des Wahrscheinlichkeitsschwellenwerts zu berechnen.You can also use the graph to compute the profit or cost for your choice of probability threshold.

Kosten-Nutzen

Die Seite Accuracy Report (Genauigkeitsbericht) des Modellberichts enthält das Diagramm für kumulative Verstärkungen und die Grenzwertoptimierungskurve für das Modell.The Accuracy Report page of the model report includes the Cumulative Gains chart and the ROC curve for the model. Dabei handelt es sich um statistische Measures der Modellleistung.These are statistical measures of model performance. Die Berichte enthalten Beschreibungen der gezeigten Diagramme.The reports include descriptions of the charts shown.

Bildschirm mit dem Bericht zur Genauigkeit

Anwenden eines Modells zur binären VorhersageApplying a Binary Prediction model

Um ein Modell zur binären Vorhersage anwenden zu können, müssen Sie die Entität mit den Daten angeben, auf die Sie die Vorhersagen aus dem ML-Modell anwenden möchten.To apply a Binary Prediction model, you must specify the entity with the data to which you want to apply the predictions from the ML model. Weitere Parameter sind das Präfix für den Namen der Ausgabespalte und der Wahrscheinlichkeitsschwellenwert für die Klassifizierung des vorhergesagten Ergebnisses.Other parameters include the output column name prefix and the probability threshold for classifying the predicted outcome.

Vorhersageeingaben

Wenn ein Modell zur binären Vorhersage angewendet wird, werden der erweiterten Ausgabeentität vier Ausgabespalten hinzugefügt: Outcome, PredictionScore, PredictionExplanation und ExplanationIndex.When a Binary Prediction model is applied, it adds four output columns to the enriched output entity: Outcome, PredictionScore, PredictionExplanation, and ExplanationIndex. Die Spaltennamen in der Entität haben das bei der Anwendung des Modells angegebene Präfix.The column names in the entity have the prefix specified when the model is applied.

PredictionScore ist ein prozentualer Wert, der angibt, mit welcher Wahrscheinlichkeit das angestrebte Ergebnis erreicht wird.PredictionScore is a percentage probability, which identifies the likelihood that the target outcome will be achieved.

Die Spalte Outcome enthält die vorhergesagte Ergebnisbeschriftung.The Outcome column contains the predicted outcome label. Für Datensätze mit einem Wahrscheinlichkeitswert über dem Schwellenwert wird das Erreichen des angestrebten Ergebnisses als wahrscheinlich vorhergesagt. Sie sind mit „True“ gekennzeichnet.Records with probabilities exceeding the threshold are predicted as likely to achieve the target outcome and are labeled as True. Für Datensätze unter dem Schwellenwert wird das Erreichen des Ergebnisses als unwahrscheinlich vorhergesagt. Sie sind mit „False“ gekennzeichnet.Records below the threshold are predicted as unlikely to achieve the outcome and are labeled as False.

Die Spalte PredictionExplanation enthält eine Erklärung des spezifischen Einflusses, den die Eingabefeatures auf PredictionScore hatten.The PredictionExplanation column contains an explanation with the specific influence that the input features had on the PredictionScore.

KlassifizierungsmodelleClassification models

Klassifizierungsmodelle werden verwendet, um ein Dataset in mehrere Gruppen oder Klassen aufzuteilen.Classification models are used to classify a dataset into multiple groups or classes. Diese Modelle werden verwendet, um Ereignisse vorherzusagen, die eines von mehreren möglichen Ergebnissen aufweisen können.They're used to predict events that can have one of the multiple possible outcomes. Dazu gehört beispielsweise, ob ein Kunde wahrscheinlich einen sehr hohen, hohen, mittleren oder niedrigen Ertragswert hat, ob das Ausfallrisiko hoch, mittel, niedrig oder sehr niedrig ist usw.For instance, whether a customer is likely to have a very high, high, medium, or low Lifetime Value, whether the risk of default is High, Moderate, Low, or Very Low; and so on.

Die Ausgabe eines Klassifizierungsmodells ist eine Wahrscheinlichkeitsbewertung, die die Wahrscheinlichkeit angibt, dass ein Datensatz die Kriterien einer bestimmten Klasse erfüllt.The output of a Classification model is a probability score, which identifies the likelihood that a record will achieve the criteria for a given class.

Trainieren eines KlassifizierungsmodellsTraining a Classification model

Die Eingabeentität mit Ihren Trainingsdaten für ein Klassifizierungsmodell muss als Ergebnisfeld ein Zeichenfolgen- oder Ganzzahlfeld aufweisen, mit dem die bisherigen bekannten Ergebnisse angegeben werden.The input entity containing your training data for a Classification model must have a string or whole number field as the outcome field, which identifies the past known outcomes.

Voraussetzungen:Pre-requisites:

  • Für jede Ergebnisklasse sind mindestens 20 Zeilen mit historischen Daten erforderlich.A minimum of 20 rows of historical data is required for each class of outcomes

Der Erstellungsprozess des Klassifizierungsmodells besteht aus den gleichen Schritten wie bei anderen AutoML-Modellen, die im Abschnitt Konfigurieren der Eingaben in das ML-Modell weiter oben beschrieben sind.The process of creation for a Classification model follows the same steps as other AutoML models, described in the section Configuring the ML model inputs above.

Bericht zum KlassifizierungsmodellClassification model report

Der Bericht zum Klassifizierungsmodell wird erstellt, indem das ML-Modell auf die zurückgehaltenen Testdaten angewendet und die vorhergesagte Klasse für einen Datensatz mit der tatsächlich bekannten Klasse verglichen wird.The Classification model report is produced by applying the ML model to the holdout test data and comparing the predicted class for a record with the actual known class.

Der Musterbericht enthält ein Diagramm, das die Aufschlüsselung der richtig und falsch klassifizierten Datensätze für jede bekannte Klasse enthält.The model report includes a chart that includes the breakdown of the correctly and incorrectly classified records for each known class.

Modellbericht

Eine weitere klassenspezifische Recherche ermöglicht eine Analyse, wie die Vorhersagen für eine bekannte Klasse verteilt sind.A further class-specific drilldown enables an analysis of how the predictions for a known class are distributed. Dazu gehören auch die anderen Klassen, in denen Datensätze dieser bekannten Klasse wahrscheinlich falsch klassifiziert werden.This shows the other classes in which records of that known class are likely to be misclassified.

Die Modellerklärung im Bericht enthält auch die wichtigsten Prädiktoren für jede Klasse.The model explanation in the report also includes the top predictors for each class.

Der Bericht zum Klassifizierungsmodell enthält auch eine Seite mit Trainingsdetails ähnlich den Seiten bei anderen Modelltypen, wie im Abschnitt AutoML-Modellbericht weiter oben in diesem Artikel beschrieben.The Classification model report also includes a Training Details page similar to the pages for other model types, as described in the section AutoML model report earlier in this article.

Anwenden eines KlassifizierungsmodellsApplying a classification model

Um ein ML-Modell zur Klassifizierung anzuwenden, müssen Sie die Entität mit den Eingangsdaten und das Präfix für den Namen der Ausgabespalte angeben.To apply a Classification ML model, you must specify the entity with the input data and the output column name prefix.

Wenn ein Klassifizierungsmodell angewendet wird, werden der erweiterten Ausgabeentität fünf Ausgabespalten hinzugefügt: ClassificationScore, ClassificationResult, ClassificationExplanation, ClassProbabilities und ExplanationIndex.When a Classification model is applied, it adds five output columns to the enriched output entity: ClassificationScore, ClassificationResult, ClassificationExplanation, ClassProbabilities, and ExplanationIndex. Die Spaltennamen in der Entität haben das bei der Anwendung des Modells angegebene Präfix.The column names in the entity have the prefix specified when the model is applied.

Die Spalte ClassProbabilities enthält die Liste der Wahrscheinlichkeitsbewertungen für den Datensatz für jede mögliche Klasse.The ClassProbabilities column contains the list of probability scores for the record for each possible class.

ClassificationScore ist ein prozentualer Wert, der angibt, mit welcher Wahrscheinlichkeit ein Datensatz die Kriterien einer bestimmten Klasse erfüllt.The ClassificationScore is the percentage probability, which identifies the likelihood that a record will achieve the criteria for a given class.

Die Spalte ClassificationResult enthält die wahrscheinlichste vorhergesagte Klasse für den Datensatz.The ClassificationResult column contains the most likely predicted class for the record.

Die Spalte ClassificationExplanation enthält eine Erklärung des spezifischen Einflusses, den die Eingabefeatures auf ClassificationScore hatten.The ClassificationExplanation column contains an explanation with the specific influence that the input features had on the ClassificationScore.

RegressionsmodelleRegression models

Regressionsmodelle werden zur Vorhersage eines numerischen Werts verwendet.Regression models are used to predict a numeric value. Beispiele: der wahrscheinlich zu erzielende Erlös aus einem Verkaufsabschluss, der Kundenertragswert, der Betrag einer Debitorenrechnung, der wahrscheinlich bezahlt wird, das Datum, an dem eine Rechnung ggf. bezahlt wird usw.For instance: the revenue likely to be realized from a sales deal, the lifetime value of an account, the amount of a receivable invoice that is likely to be paid, the date on which an invoice may be paid, and so on.

Die Ausgabe eines Regressionsmodells ist der vorhergesagte Wert.The output of a Regression model is the predicted value.

Trainieren eines RegressionsmodellsTraining a Regression model

Die Eingabeentität, die Ihre Trainingsdaten für ein Regressionsmodell enthält, muss als Ergebnisfeld ein numerisches Feld aufweisen, das die bekannten Ergebniswerte angibt.The input entity containing the training data for a Regression model must have a numeric field as the outcome field, which identifies the known outcome values.

Voraussetzungen:Pre-requisites:

  • Für ein Regressionsmodell sind mindestens 100 Zeilen mit historischen Daten erforderlich.A minimum of 100 rows of historical data is required for a Regression model

Der Erstellungsprozess des Regressionsmodells befolgt die gleichen Schritten wie bei anderen AutoML-Modellen, die im Abschnitt Konfigurieren der Eingaben in das ML-Modell weiter oben beschrieben sind.The process of creation for a Regression model follows the same steps as other AutoML models, described in the section Configuring the ML model inputs above.

Bericht zum RegressionsmodellRegression model report

Wie bei den anderen AutoML-Modellberichten basiert der Bericht zur Regression auf den Ergebnissen der Anwendung des Modells auf die zurückgehaltenen Testdaten.Like the other AutoML model reports, the Regression report is based on the results from applying the model to the holdout test data.

Der Modellbericht enthält ein Diagramm, das die vorhergesagten Werte mit den Istwerten vergleicht.The model report includes a chart that compares the predicted values to the actual values. In diesem Diagramm gibt die Entfernung von der Diagonalen den Fehler in der Vorhersage an.In this chart, the distance from the diagonal indicates the error in the prediction.

Das Restfehlerdiagramm zeigt die Verteilung des Prozentsatzes des durchschnittlichen Fehlers für verschiedene Werte im zurückgehaltenen Testdataset.The residual error chart shows the distribution of the percentage of average error for different values in the holdout test dataset. Die horizontale Achse stellt den Mittelwert des Istwertes für die Gruppe dar, wobei die Größe der Blase die Frequenz oder Anzahl der Werte in diesem Bereich anzeigt.The horizontal axis represents the mean of the actual value for the group, with the size of the bubble showing the frequency or count of values in that range. Die vertikale Achse ist der durchschnittliche Restfehler.The vertical axis is the average residual error.

Restfehlerdiagramm

Der Bericht zum Regressionsmodell enthält auch eine Seite mit Trainingsdetails ähnlich wie in den Berichten zu anderen Modelltypen, wie im Abschnitt AutoML-Modellbericht weiter oben in diesem Artikel beschrieben.The Regression model report also includes a Training Details page like the reports for other model types, as described in the section AutoML model report above.

Anwenden eines RegressionsmodellsApplying a regression model

Um ein ML-Modell zur Regression anzuwenden, müssen Sie die Entität mit den Eingabedaten und das Präfix für den Namen der Ausgabespalte angeben.To apply a Regression ML model, you must specify the entity with the input data and the output column name prefix.

Anwenden einer Regression

Wenn ein Regressionsmodell angewendet wird, werden der erweiterten Ausgabeentität drei Ausgabespalten hinzugefügt: RegressionResult, RegressionExplanation und ExplanationIndex.When a Regression model is applied, it adds three output columns to the enriched output entity: RegressionResult, RegressionExplanation, and ExplanationIndex. Die Spaltennamen in der Entität haben das bei der Anwendung des Modells angegebene Präfix.The column names in the entity have the prefix specified when the model is applied.

Die Spalte RegressionResult enthält den basierend auf den Eingabefeldern vorhergesagten Wert für den Datensatz.The RegressionResult column contains the predicted value for the record based on the input fields. Die Spalte RegressionExplanation enthält eine Erklärung des spezifischen Einflusses, den die Eingabefelder auf RegressionResult hatten.The RegressionExplanation column contains an explanation with the specific influence that the input features had on the RegressionResult.

Azure Machine Learning-Integration in Power BIAzure Machine Learning integration in Power BI

Viele Organisationen verwenden Machine Learning-Modelle, um bessere Erkenntnisse über ihr Geschäft zu erhalten und Vorhersagen zu erstellen.Numerous organizations use Machine Learning models for better insights and predictions about their business. Die Möglichkeit, Erkenntnisse aus diesen Modellen aufzurufen und in Ihren Berichten und Dashboards sowie anderen Analysen zu visualisieren, erleichtert die Weitergabe dieser Erkenntnisse an die Geschäftsbenutzer, die sie am dringendsten benötigen.The ability to visualize and invoke insights from these models, in your reports and dashboards and other analytics, can help disseminate these insights to the business users who need it the most. Power BI vereinfacht jetzt die Integration der Erkenntnisse aus Modellen, die in Azure Machine Learning gehostet werden, über einfache Point-and-Click-Gesten.Power BI now makes it simple to incorporate the insights from models hosted on Azure Machine Learning, using straightforward point-and-click gestures.

Zur Verwendung dieser Funktion kann ein Data Scientist dem BI-Analysten einfach über das Azure-Portal Zugriff auf das Azure ML-Modell erteilen.To use this capability, a data scientist can simply grant access to the Azure ML model to the BI analyst using the Azure portal. Dann ermittelt Power Query am Anfang jeder Sitzung alle Azure ML-Modelle, auf die der Benutzer Zugriff hat, und macht sie als dynamische Power Query-Funktionen verfügbar.Then, at the start of each session, Power Query discovers all the Azure ML models to which the user has access and exposes them as dynamic Power Query functions. Der Benutzer kann dann über das Menüband im Power Query-Editor auf diese Funktionen zugreifen oder die M-Funktion direkt aufrufen.The user can then invoke those functions by accessing them from the ribbon in Power Query Editor, or by invoking the M function directly. Power BI erstellt auch beim Aufrufen des Azure ML-Modells für eine Gruppe von Zeilen automatisch Batches der Zugriffsanforderungen, um eine bessere Leistung zu erzielen.Power BI also automatically batches the access requests when invoking the Azure ML model for a set of rows to achieve better performance.

Diese Funktionalität wird derzeit nur für Power BI-Dataflows und im Power BI-Dienst für die Onlinenutzung von Power Query unterstützt.This functionality is currently only supported for Power BI dataflows, and for Power Query online in the Power BI service.

Weitere Informationen zu Dataflows erhalten Sie unter Einführung in Dataflows und Self-Service-Datenaufbereitung.To learn more about dataflows, see Introduction to dataflows and self-service data prep.

Weitere Informationen zu Azure Machine Learning finden Sie unter:To learn more about Azure Machine Learning, please see:

Hinweis

Für die Azure Machine Learning-Integration ist ein Power BI Premium-Abonnement erforderlich.A Power BI Premium subscription is required to use Azure Machine learning integration.

Gewähren von Zugriff auf das Azure ML-Modell für Power BI-BenutzerGranting access to the Azure ML model to a Power BI user

Um von Power BI aus auf ein Azure ML-Modell zugreifen zu können, benötigen Benutzer den Lesezugriff auf das Azure-Abonnement.To access an Azure ML model from Power BI, the user must have Read access to the Azure subscription. Zusätzlich:In addition:

  • Für klassische Machine Learning Studio-Modelle benötigen Benutzer Lesezugriff auf den klassischen Machine Learning Studio-Webdienst.For Machine Learning Studio (classic) models, Read access to Machine Learning Studio (classic) web service
  • Für Machine Learning-Modelle benötigen Benutzer Lesezugriff auf den Machine Learning-Arbeitsbereich.For Machine Learning models, Read access to the Machine Learning workspace

Die Schritte in diesem Artikel beschreiben, wie Power BI-Benutzern Zugriff auf ein im Azure ML-Dienst gehostetes Modell gewährt wird, damit sie als Power Query-Funktion auf dieses Modell zugreifen können.The steps in this article describe how to grant a Power BI user access to a model hosted on the Azure ML service, so they can access this model as a Power Query function. Weitere Informationen finden Sie unter Verwalten des Zugriffs auf Azure-Ressourcen mit RBAC und dem Azure-Portal.For further details, please see Manage access using RBAC and the Azure portal.

  1. Melden Sie sich beim Azure-Portal an.Sign in to the Azure portal.

  2. Wechseln Sie zur Seite Abonnements.Go to the Subscriptions page. Sie finden die Seite Abonnements in der Liste Alle Dienste im Navigationsmenü des Azure-Portals.You can find the Subscriptions page through the All Services list in the nav pane menu of the Azure portal.

    Azure-Seite „Abonnements“ Azure subscriptions page

  3. Wählen Sie Ihr Abonnement aus.Select your subscription.

    Auswählen Ihres Abonnements Select your subscription

  4. Wählen Sie Zugriffssteuerung (IAM) und dann die Schaltfläche Hinzufügen aus.Select Access Control (IAM), and then select the Add button.

    Zugriffssteuerung (IAM) Access control AIM

  5. Wählen Sie Leser als Rolle aus.Select Reader as the Role. Wählen Sie den Power BI-Benutzer aus, dem Sie Zugriff auf das Azure ML-Modell gewähren möchten.Select the Power BI user to whom you wish to grant access to the Azure ML model.

    Auswählen von „Leser“ als Rolle Select Reader as the role

  6. Wählen Sie Speichern.Select Save.

  7. Wiederholen Sie die Schritte drei bis sechs, um dem Benutzer Lesezugriff auf den spezifischen (klassischen) Machine Learning Studio-Webdienst oder auf den Machine Learning-Arbeitsbereich zu gewähren, in dem das Modell gehostet wird.Repeat steps three through six to grant Reader access to the user for the specific Machine Learning Studio (classic) web service, or the Machine Learning workspace hosting the model.

Schemaermittlung für Machine Learning-ModelleSchema discovery for Machine Learning models

Data Scientists verwenden zum Entwickeln und sogar zum Bereitstellen ihrer Machine Learning-Modelle für Machine Learning in erster Linie Python.Data scientists primarily use Python to develop, and even deploy, their machine learning models for Machine Learning. Im Gegensatz zur klassischen Version von Machine Learning Studio, die die Automatisierung des Erstellens einer Schemadatei für das Modell erleichtert, muss der Data Scientist beim Machine Learning die Schemadatei explizit mit Python generieren.Unlike the Machine Learning Studio (classic), which helps automate the task of creating a schema file for the model, in the case of Machine Learning, the data scientist must explicitly generate the schema file using Python.

Diese Schemadatei muss in den bereitgestellten Webdienst für Machine Learning-Modelle aufgenommen werden.This schema file must be included in the deployed web service for Machine Learning models. Um das Schema für den Webdienst automatisch zu generieren, müssen Sie ein Beispiel der Eingabe/Ausgabe im Eingangsskript für das bereitgestellte Modell angeben.To automatically generate the schema for web service, you must provide a sample of the input/output in the entry script for the deployed model. Informationen dazu finden Sie im Unterabschnitt der (optionalen) Azure Machine Learning Service-Dienstdokumentation zur automatischen Swagger-Schemagenerierung in Bereitstellungsmodellen.Please see the subsection on (Optional) Automatic Swagger schema generation in the Deploy models with the Azure Machine Learning service documentation. Der Link beinhaltet das Beispieleingangsskript mit den Anweisungen für die Schemagenerierung.The link includes the example entry script with the statements for the schema generation.

Insbesondere verweisen die Funktionen @input_schema und @output_schema im Eingabeskript auf die Eingabe- und Ausgabebeispielformate in den Variablen input_sample und output_sample und verwenden diese Beispiele, um während der Bereitstellung eine OpenAPI-Spezifikation (Swagger) für den Webdienst zu generieren.Specifically, the @input_schema and @output_schema functions in the entry script reference the input and output sample formats in the input_sample and output_sample variables, and use these samples to generate an OpenAPI (Swagger) specification for the web service during deployment.

Diese Anweisungen zur Schemagenerierung durch Aktualisieren des Eingangsskripts müssen ebenfalls auf Modelle angewendet werden, die automatisierte Experimente in Machine Learning unter Nutzung des Azure Machine Learning-SDKs verwenden.These instructions for schema generation by updating the entry script must also be applied to models created using automated machine learning experiments using the Azure Machine Learning SDK.

Hinweis

Modelle, die mithilfe der grafischen Benutzeroberfläche von Azure Machine Learning erstellt werden, unterstützen aktuell keine Schemagenerierung. Diese Funktion wird jedoch in kommenden Releases implementiert.Models created using the Azure Machine Learning visual interface do not currently support schema generation, but will in subsequent releases.

Aufrufen des Azure ML-Modells in Power BIInvoking the Azure ML model in Power BI

Sie können ein Azure ML-Modell, auf das Ihnen Zugriff gewährt wurde, direkt vom Power Query-Editor in Ihrem Dataflow aus aufrufen.You can invoke any Azure ML model to which you have been granted access, directly from the Power Query Editor in your dataflow. Wählen Sie für den Zugriff auf die Azure ML-Modelle die Schaltfläche Bearbeiten für die Entität aus, die Sie mit Erkenntnissen aus Ihrem Azure ML-Modell erweitern möchten, wie in der folgenden Abbildung dargestellt.To access the Azure ML models, select the Edit button for the entity that you want to enrich with insights from your Azure ML model, as shown in the following image.

Power BI-Dienst: Bearbeiten der Entität Power BI service - edit the entity

Mit Auswahl der Schaltfläche Bearbeiten wird der Power Query-Editor für die Entitäten in Ihrem Dataflow geöffnet.Selecting the Edit button opens the Power Query Editor for the entities in your dataflow.

Power Query-Editor Power Query Editor

Wählen Sie die Schaltfläche KI Insights im Menüband und dann im Navigationsmenü den Ordner Azure Machine Learning Models aus.Select the AI Insights button in the ribbon, and then select the Azure Machine Learning Models folder from the nav pane menu. Alle Azure ML-Modelle, auf die Sie Zugriff haben, finden Sie hier als Power Query-Funktionen aufgelistet.All the Azure ML models to which you have access are listed here as Power Query functions. Darüber hinaus werden die Eingabeparameter für das Azure ML-Modell automatisch als Parameter der entsprechenden Power Query-Funktion zugeordnet.Also, the input parameters for the Azure ML model are automatically mapped as parameters of the corresponding Power Query function.

Um ein Azure ML-Modell aufzurufen, können Sie beliebige Spalten der ausgewählten Entität als Eingabe aus der Dropdownliste angeben.To invoke an Azure ML model, you can specify any of the selected entity's columns as an input from the drop-down. Sie können auch einen konstanten Wert angeben, der als Eingabe verwendet werden soll, indem Sie das Spaltensymbol auf der linken Seite des Eingabedialogfelds umschalten.You can also specify a constant value to be used as an input by toggling the column icon to the left of the input dialog.

Auswählen der Spalte select the column

Wählen Sie Aufrufen aus, um die Vorschau der Ausgabe des Azure ML-Modells als neue Spalte in der Entitätentabelle anzuzeigen.Select Invoke to view the preview of the Azure ML model's output as a new column in the entity table. Sie sehen den Modellaufruf auch als angewendeten Schritt für die Abfrage.You will also see the model invocation as an applied step for the query.

Auswählen des Aufrufs Select invoke

Wenn das Modell mehrere Ausgabeparameter zurückgibt, werden sie als Datensatz in der Ausgabespalte gruppiert.If the model returns multiple output parameters, they are grouped together as a record in the output column. Sie können die Spalte erweitern, um einzelne Ausgabeparameter in separaten Spalten zu erzeugen.You can expand the column to produce individual output parameters in separate columns.

Erweitern der Spalte expand the column

Nach dem Speichern Ihres Dataflows wird das Modell automatisch aufgerufen, wenn der Dataflow aktualisiert wird, um etwaige neue oder aktualisierte Zeilen in der Entitätentabelle zu berücksichtigen.Once you save your dataflow, the model is automatically invoked when the dataflow is refreshed, for any new or updated rows in the entity table.

Nächste SchritteNext steps

Dieser Artikel enthält eine Übersicht über automatisiertes maschinelles Lernen für Dataflows im Power BI-Dienst.This article provided an overview of Automated Machine Learning for Dataflows in the Power BI service. Die folgenden Artikel können ebenfalls hilfreich sein.The following articles may also be useful.

In den folgenden Artikeln finden Sie weitere Informationen zu Dataflows und Power BI:The following articles provide more information about dataflows and Power BI: