Tutorial: Power BI-Integration: Erstellen des Vorhersagemodells mithilfe von automatischem Machine Learning (Teil 1 von 2)

In Teil 1 dieses Tutorials führen Sie das Training und die Bereitstellung eines Predictive Machine Learning-Modells durch. Sie verwenden automatisiertes maschinelles Lernen (Machine Learning, ML) in Azure Machine Learning Studio. In Teil 2 verwenden Sie das Modell mit der besten Leistung, um Ergebnisse in Microsoft Power BI vorherzusagen.

In diesem Tutorial führen Sie Folgendes durch:

  • Erstellen eines Computeclusters für Azure Machine Learning
  • Erstellen eines Datasets
  • Erstellen einer automatisierten Ausführung des maschinellen Lernens
  • Bereitstellen des besten Modells auf einem Echtzeit-Bewertungsendpunkt

Es gibt drei Möglichkeiten, wie Sie das zu verwendende Modell in Power BI erstellen und bereitstellen können. In diesem Artikel wird Option C beschrieben: Trainieren und Bereitstellen von Modellen mit automatisiertem maschinellem Lernen in Studio. Bei dieser Option muss kein Code geschrieben werden. Die Datenaufbereitung und das Modelltraining werden vollständig automatisiert.

Stattdessen können Sie aber auch eine der anderen Optionen nutzen:

Voraussetzungen

Erstellen eines Computeclusters

Beim automatisierten maschinellen Lernen wird eine größere Zahl von Machine Learning-Modellen trainiert, um den „besten“ Algorithmus und die zugehörigen Parameter zu ermitteln. Bei Azure Machine Learning wird die Ausführung des Modelltrainings über einen Computecluster parallelisiert.

Wählen Sie zunächst in Azure Machine Learning Studio im Menü auf der linken Seite die Option Compute aus. Öffnen Sie die Registerkarte Computecluster. Wählen Sie anschließend Neu aus:

Screenshot: Erstellen eines Computeclusters

Gehen Sie auf der Seite Computecluster erstellen wie folgt vor:

  1. Wählen Sie eine VM-Größe aus. Für dieses Tutorial reicht ein Computer vom Typ Standard_D11_v2 aus.
  2. Wählen Sie Weiter aus.
  3. Geben Sie einen gültigen Computenamen an.
  4. Behalten Sie für Mindestanzahl von Knoten die Einstellung 0 bei.
  5. Ändern Sie die Höchstanzahl von Knoten in 4.
  6. Klicken Sie auf Erstellen.

Der Status Ihres Clusters ändert sich in Wird erstellt.

Hinweis

Der neue Cluster verfügt über 0 Knoten, sodass keine Computekosten anfallen. Es fallen nur Kosten an, wenn der Auftrag für das automatisierte maschinelle Lernen ausgeführt wird. Nach einem Leerlaufzeitraum von 120 Sekunden wird der Cluster automatisch zurück auf „0“ skaliert.

Erstellen eines Datasets

In diesem Tutorial verwenden Sie das Diabetes-Dataset. Dieses Dataset ist in Azure Open Datasets verfügbar.

Wählen Sie zum Erstellen des Datasets im Menü auf der linken Seite die Option Datasets aus. Wählen Sie anschließend Dataset erstellen aus. Die folgenden Optionen werden angezeigt:

Screenshot: Erstellen eines neuen Datasets

Wählen Sie die Option Aus Open Datasets aus. Gehen Sie auf der Seite Dataset aus Open Datasets erstellen dann wie folgt vor:

  1. Suchen Sie über die Suchleiste nach diabetes.
  2. Wählen Sie Beispiel: Diabetes aus.
  3. Wählen Sie Weiter aus.
  4. Geben Sie Ihrem Dataset den Namen diabetes.
  5. Klicken Sie auf Erstellen.

Wählen Sie zum Untersuchen der Daten zuerst das Dataset und dann die Option Erkunden aus:

Screenshot: Erkunden eines Datasets

Die Daten enthalten zehn grundlegende Eingabevariablen, z. B. Alter, Geschlecht, BMI, durchschnittliche Blutdruckwerte und sechs auf das Blutserum bezogene Werte. Außerdem ist eine Zielvariable mit dem Namen Y vorhanden. Bei dieser Zielvariablen handelt es sich um ein quantitatives Maß für den Fortschritt der Diabetes-Erkrankung ein Jahr nach der Ermittlung der Grundwerte.

Erstellen einer automatisierten Ausführung des maschinellen Lernens

Wählen Sie in Azure Machine Learning Studio im Menü auf der linken Seite die Option Automatisiertes ML aus. Wählen Sie anschließend die Option Neue Ausführung von automatisiertem ML aus:

Screenshot: Erstellen einer neuen Ausführung von automatisiertem ML

Wählen Sie als Nächstes das Dataset diabetes aus, das Sie zuvor erstellt haben. Wählen Sie anschließend Weiter aus:

Screenshot: Auswählen eines Datasets

Gehen Sie auf der Seite Ausführung konfigurieren wie folgt vor:

  1. Wählen Sie unter Experimentname die Option Neu erstellen aus.
  2. Geben Sie dem Experiment einen Namen.
  3. Wählen Sie im Feld Zielspalte die Option Y aus.
  4. Wählen Sie im Feld Computecluster auswählen den Computecluster aus, den Sie weiter oben erstellt haben.

Ihr ausgefülltes Formular sollte in etwa wie folgt aussehen:

Screenshot: Konfigurieren des automatisierten maschinellen Lernens

Wählen Sie abschließend eine Aufgabe für maschinelles Lernen aus. In diesem Fall hat die Aufgabe den Typ Regression:

Screenshot: Konfigurieren einer Aufgabe

Wählen Sie Fertig stellen aus.

Wichtig

Es dauert ca. 30 Minuten, bis das Trainieren der 100 Modelle per automatisiertem maschinellem Lernen abgeschlossen ist.

Bereitstellen des besten Modells

Nach Abschluss des automatisierten maschinellen Lernens können Sie alle bearbeiteten Machine Learning-Modelle anzeigen, indem Sie die Registerkarte Modelle auswählen. Die Modelle sind nach Leistung sortiert, und das Modell mit der besten Leistung wird zuerst angezeigt. Wenn Sie das beste Modell auswählen, wird die Schaltfläche Bereitstellen aktiviert:

Screenshot: Liste mit Modellen

Wählen Sie die Option Bereitstellen aus, um das Fenster Modell bereitstellen zu öffnen:

  1. Geben Sie Ihrem Modelldienst den Namen diabetes-model.
  2. Wählen Sie Azure Container Service aus.
  3. Klicken Sie auf Bereitstellen.

Es sollte eine Meldung mit dem Hinweis angezeigt werden, dass die Bereitstellung des Modells erfolgreich war.

Nächste Schritte

In diesem Tutorial wurde beschrieben, wie Sie ein Machine Learning-Modell mithilfe von automatisiertem maschinellem Lernen trainieren und bereitstellen. Im nächsten Tutorial erfahren Sie, wie Sie dieses Modell in Power BI nutzen (bewerten).