Tutorial: Prognostizieren von Automobilpreisen mit dem DesignerTutorial: Predict automobile price with the designer

In diesem zweiteiligen Tutorial erfahren Sie, wie Sie mithilfe des Designers von Azure Machine Learning ein Machine Learning-Modell trainieren und bereitstellen, das den Preis eines beliebigen Autos prognostiziert.In this two-part tutorial, you learn how to use the Azure Machine Learning designer to train and deploy a machine learning model that predicts the price of any car. Bei dem Designer handelt es sich um ein Drag & Drop-Tool, mit dem Sie ganz ohne Programmieraufwand Machine Learning-Modelle erstellen können.The designer is a drag-and-drop tool that lets you create machine learning models without a single line of code.

Im ersten Teil des Tutorials lernen Sie Folgendes:In part one of the tutorial, you'll learn how to:

  • Erstellen einer neuen PipelineCreate a new pipeline.
  • Importieren von DatenImport data.
  • Aufbereiten von DatenPrepare data.
  • Trainieren eines Machine Learning-ModellsTrain a machine learning model.
  • Auswerten eines Machine Learning-ModellsEvaluate a machine learning model.

Im zweiten Teil des Tutorials stellen Sie Ihr Modell als Echtzeit-Rückschlussendpunkt bereit, um damit den Preis eines beliebigen Autos basierend auf den von Ihnen an die Lösung gesendeten technischen Spezifikationen zu prognostizieren.In part two of the tutorial, you'll deploy your model as a real-time inferencing endpoint to predict the price of any car based on technical specifications you send it.

Hinweis

Eine fertige Version dieses Tutorials ist als Beispielpipeline verfügbar.A completed version of this tutorial is available as a sample pipeline.

Diese finden Sie im Designer in Ihrem Arbeitsbereich.To find it, go to the designer in your workspace. Wählen Sie im Abschnitt Neue Pipeline die Option Sample 1 - Regression: Automobile Price Prediction(Basic) (Beispiel 1: Regression: Automobilpreisvorhersage (Standard)) aus.In the New pipeline section, select Sample 1 - Regression: Automobile Price Prediction(Basic).

Wichtig

Falls die in diesem Dokument erwähnten grafischen Elemente bei Ihnen nicht angezeigt werden, z. B. Schaltflächen in Studio oder Designer, verfügen Sie unter Umständen nicht über die richtige Berechtigungsebene.If you do not see graphical elements mentioned in this document, such as buttons in studio or designer, you may not have the right level of permissions to the workspace. Wenden Sie sich an Ihren Azure-Abonnementadministrator, um sich zu vergewissern, dass Ihnen die richtige Zugriffsebene gewährt wurde.Please contact your Azure subscription administrator to verify that you have been granted the correct level of access. Weitere Informationen finden Sie unter Verwalten von Benutzern und Rollen.For more information, see Manage users and roles.

Erstellen einer neuen PipelineCreate a new pipeline

Azure Machine Learning-Pipelines fassen mehrere Machine Learning- und Datenverarbeitungsschritte in einer einzelnen Ressource zusammen.Azure Machine Learning pipelines organize multiple machine learning and data processing steps into a single resource. Pipelines ermöglichen die Strukturierung, Verwaltung und Wiederverwendung komplexer Machine Learning-Workflows für verschiedene Projekte und Benutzer.Pipelines let you organize, manage, and reuse complex machine learning workflows across projects and users.

Für die Erstellung einer Azure Machine Learning-Pipeline benötigen Sie einen Azure Machine Learning-Arbeitsbereich.To create an Azure Machine Learning pipeline, you need an Azure Machine Learning workspace. In diesem Abschnitt erfahren Sie, wie Sie diese beiden Ressourcen erstellen.In this section, you learn how to create both these resources.

Erstellen eines neuen ArbeitsbereichsCreate a new workspace

Um den Designer verwenden zu können, benötigen Sie zunächst einen Azure Machine Learning-Arbeitsbereich.In order to use the designer, you first need an Azure Machine Learning workspace. Der Arbeitsbereich ist die Ressource der obersten Ebene für Azure Machine Learning und bietet einen zentralen Ort für die Arbeit mit allen Artefakten, die Sie in Azure Machine Learning erstellen.The workspace is the top-level resource for Azure Machine Learning, it provides a centralized place to work with all the artifacts you create in Azure Machine Learning.

Erstellen der PipelineCreate the pipeline

  1. Melden Sie sich bei ml.azure.com an, und wählen Sie den gewünschten Arbeitsbereich aus.Sign in to ml.azure.com, and select the workspace you want to work with.

  2. Wählen Sie Designer aus.Select Designer.

    Screenshot des visuellen Arbeitsbereichs: Vorgehensweise für den Zugriff auf den Designer

  3. Wählen Sie Easy-to-use prebuilt modules (Benutzerfreundliche vorgefertigte Module) aus.Select Easy-to-use prebuilt modules.

  4. Wählen Sie im oberen Bereich der Canvas den Standardpipelinenamen Pipeline-Created-on aus.At the top of the canvas, select the default pipeline name Pipeline-Created-on. Ändern Sie den Namen in Automobile price prediction (Automobilpreisvorhersage).Rename it to Automobile price prediction. Der Name muss nicht eindeutig sein.The name doesn't need to be unique.

Festlegen des StandardcomputezielsSet the default compute target

Ein Pipeline wird auf einem Computeziel ausgeführt. Dabei handelt es sich um eine an Ihren Arbeitsbereich angefügte Computeressource.A pipeline runs on a compute target, which is a compute resource that's attached to your workspace. Nachdem Sie ein Computeziel erstellt haben, können Sie es für künftige Ausführungen wiederverwenden.After you create a compute target, you can reuse it for future runs.

Sie können ein Standardcomputeziel für die gesamte Pipeline festlegen, wodurch jedes Modul standardmäßig das gleiche Computeziel verwendet.You can set a Default compute target for the entire pipeline, which will tell every module to use the same compute target by default. Sie können aber auch modulspezifische Computeziele angeben.However, you can specify compute targets on a per-module basis.

  1. Wählen Sie im oberen Bereich der Canvas neben dem Namen der Pipeline das Zahnradsymbol Screenshot des Zahnradsymbols aus, um den Bereich Einstellungen zu öffnen.Next to the pipeline name, select the Gear icon Screenshot of the gear icon at the top of the canvas to open the Settings pane.

  2. Wählen Sie rechts neben der Canvas im Bereich Einstellungen die Option Computeziel auswählen aus.In the Settings pane to the right of the canvas, select Select compute target.

    Falls Sie bereits über ein verfügbares Computeziel verfügen, können Sie es auswählen, um diese Pipeline auszuführen.If you already have an available compute target, you can select it to run this pipeline.

    Hinweis

    Der Designer kann nur Trainingsexperimente in Azure Machine Learning Compute ausführen, andere Computeziele werden jedoch nicht angezeigt.The designer can only run training experiments on Azure Machine Learning Compute but other compute targets won't be shown.

  3. Geben Sie einen Namen für die Computeressource ein.Enter a name for the compute resource.

  4. Wählen Sie Speichern aus.Select Save.

    Hinweis

    Die Erstellung einer Computeressource dauert etwa fünf Minuten.It takes approximately five minutes to create a compute resource. Nach der Erstellung der Ressource können Sie sie wiederverwenden und diese Wartezeit in künftigen Ausführungen vermeiden.After the resource is created, you can reuse it and skip this wait time for future runs.

    Eine im Leerlauf befindliche Computeressource wird automatisch auf 0 Knoten skaliert, um Kosten zu sparen.The compute resource autoscales to zero nodes when it's idle to save cost. Wenn Sie sie nach einer Verzögerung erneut verwenden, müssen Sie unter Umständen etwa fünf Minuten warten, bis sie wieder hochskaliert wurde.When you use it again after a delay, you might experience approximately five minutes of wait time while it scales back up.

Daten importierenImport data

Im Designer stehen mehrere Beispieldatasets zur Verfügung, mit denen Sie experimentieren können.There are several sample datasets included in the designer for you to experiment with. Verwenden Sie für dieses Tutorial Automobile Price Data (Raw) (Automobilpreisdaten (Rohdaten)).For this tutorial, use Automobile price data (Raw).

  1. Links neben der Pipelinecanvas befindet sich eine Palette mit Datasets und Modulen.To the left of the pipeline canvas is a palette of datasets and modules. Wählen Sie Beispieldatasets aus, um die verfügbaren Beispieldatasets anzuzeigen.Select Sample datasets to view the available sample datasets.

  2. Wählen Sie das Dataset Automobile Price Data (Raw) (Automobilpreisdaten (Rohdaten)) aus, und ziehen Sie es auf die Canvas.Select the dataset Automobile price data (Raw), and drag it onto the canvas.

    Ziehen von Daten in den Experimentbereich

Visualisieren der DatenVisualize the data

Sie können die Daten visualisieren, um sich mit dem zu verwendenden Dataset vertraut zu machen.You can visualize the data to understand the dataset that you'll use.

  1. Klicken Sie mit der rechten Maustaste auf Automobile Price Data (Raw) , und wählen Sie Visualisierung.Right-click the Automobile price data (Raw) and select Visualize.

  2. Wählen Sie die verschiedenen Spalten im Datenfenster aus, um Informationen zur jeweiligen Spalte zu erhalten.Select the different columns in the data window to view information about each one.

    Jede Zeile steht für ein Fahrzeug, und die Variablen, die den einzelnen Fahrzeugen zugeordnet sind, werden als Spalten angezeigt.Each row represents an automobile, and the variables associated with each automobile appear as columns. Es gibt 205 Zeilen und 26 Spalten in diesem Dataset.There are 205 rows and 26 columns in this dataset.

Vorbereiten von DatenPrepare data

Für Datasets ist vor der Analyse in der Regel eine Vorverarbeitung erforderlich.Datasets typically require some preprocessing before analysis. Bei der Untersuchung des Datasets sind Ihnen unter Umständen einige fehlende Werte aufgefallen.You might have noticed some missing values when you inspected the dataset. Damit das Modell die Daten korrekt analysieren kann, müssen diese fehlenden Werte bereinigt werden.These missing values must be cleaned so that the model can analyze the data correctly.

Entfernen einer SpalteRemove a column

Wenn Sie ein Modell trainieren, müssen Sie etwas gegen fehlende Daten tun.When you train a model, you have to do something about the data that's missing. In diesem Dataset fehlen in der Spalte normalized-losses zahlreiche Werte. Daher schließen wir diese Spalte ganz aus dem Modell aus.In this dataset, the normalized-losses column is missing many values, so you will exclude that column from the model altogether.

  1. Erweitern Sie in der Modulpalette auf der linken Seite der Canvas den Abschnitt Datentransformation, und suchen Sie nach dem Modul Select Columns in Dataset (Spalten im Dataset auswählen).In the module palette to the left of the canvas, expand the Data Transformation section and find the Select Columns in Dataset module.

  2. Ziehen Sie das Modul Select Columns in Dataset (Spalten im Dataset auswählen) auf die Canvas.Drag the Select Columns in Dataset module onto the canvas. Legen Sie das Modul unter dem Datasetmodul ab.Drop the module below the dataset module.

  3. Verbinden Sie das Dataset Automobile price data (Raw) (Automobilpreisdaten (Rohdaten)) mit dem Modul Select Columns in Dataset (Spalten in Dataset auswählen).Connect the Automobile price data (Raw) dataset to the Select Columns in Dataset module. Ziehen Sie eine Linie vom Ausgabeport des Datasets zum Eingabeport von Select Columns in Dataset (Spalten im Dataset auswählen) – also von dem kleinen Kreis am unteren Rand des Datasets auf der Canvas zu dem kleinen Kreis am oberen Rand des Moduls.Drag from the dataset's output port, which is the small circle at the bottom of the dataset on the canvas, to the input port of Select Columns in Dataset, which is the small circle at the top of the module.

    Tipp

    Um einen Datenfluss für Ihre Pipeline zu erstellen, verbinden Sie den Ausgabeport eines Moduls mit dem Eingabeport eines anderen Moduls.You create a flow of data through your pipeline when you connect the output port of one module to an input port of another.

    Verbinden von Modulen

  4. Wählen Sie das Modul Select Columns in Dataset aus.Select the Select Columns in Dataset module.

  5. Wählen Sie rechts neben der Canvas im Bereich mit den Moduldetails die Option Spalte bearbeiten aus.In the module details pane to the right of the canvas, select Edit column.

  6. Erweitern Sie neben Einschließen die Dropdownliste Spaltennamen, und wählen Sie Alle Spalten aus.Expand the Column names drop down next to Include, and select All columns.

  7. Wählen Sie + aus, um eine neue Regel hinzuzufügen.Select the + to add a new rule.

  8. Wählen Sie in den Dropdownmenüs die Optionen Ausschließen und Spaltennamen aus.From the drop-down menus, select Exclude and Column names.

  9. Geben Sie normalized-losses in das Textfeld ein.Enter normalized-losses in the text box.

  10. Wählen Sie rechts unten Speichern aus, um die Spaltenauswahl zu schließen.In the lower right, select Save to close the column selector.

    Ausschließen einer Spalte

  11. Wählen Sie das Modul Select Columns in Dataset aus.Select the Select Columns in Dataset module.

  12. Wählen Sie rechts neben der Canvas im Bereich mit den Moduldetails das Textfeld Kommentar aus, und geben Sie Exclude normalized losses (Normalisierte Verluste ausschließen) ein.In the module details pane to the right of the canvas, select the Comment text box and enter Exclude normalized losses.

    Kommentare werden im Diagramm angezeigt, um Sie bei der Strukturierung Ihrer Pipeline zu unterstützen.Comments will appear on the graph to help you organize your pipeline.

Fehlende Daten bereinigenClean missing data

Auch nach dem Entfernen der Spalte normalized-losses weist Ihr Dataset noch fehlende Werte auf.Your dataset still has missing values after you remove the normalized-losses column. Die restlichen fehlenden Daten können mithilfe des Moduls Clean Missing Data (Fehlende Daten bereinigen) entfernt werden.You can remove the remaining missing data by using the Clean Missing Data module.

Tipp

Die Bereinigung fehlender Werte in den Eingabedaten wird bei den meisten Modulen im Designer vorausgesetzt.Cleaning the missing values from input data is a prerequisite for using most of the modules in the designer.

  1. Erweitern Sie in der Modulpalette auf der linken Seite der Canvas den Abschnitt Datentransformation, und suchen Sie nach dem Modul Clean Missing Data (Fehlende Daten bereinigen).In the module palette to the left of the canvas, expand the section Data Transformation, and find the Clean Missing Data module.

  2. Ziehen Sie das Modul Clean Missing Data (Fehlende Daten bereinigen) auf die Pipelinecanvas.Drag the Clean Missing Data module to the pipeline canvas. Verbinden Sie es mit dem Modul Select Columns in Dataset (Spalten im Dataset auswählen).Connect it to the Select Columns in Dataset module.

  3. Wählen Sie das Modul Clean Missing Data (Fehlende Daten bereinigen) aus.Select the Clean Missing Data module.

  4. Wählen Sie rechts neben der Canvas im Bereich mit den Moduldetails die Option Spalte bearbeiten aus.In the module details pane to the right of the canvas, select Edit Column.

  5. Erweitern Sie im angezeigten Fenster Columns to be cleaned (Zu bereinigende Spalten) das Dropdownmenü neben Einschließen.In the Columns to be cleaned window that appears, expand the drop-down menu next to Include. Wählen Sie Alle Spalten aus.Select, All columns

  6. Wählen Sie Speichern aus.Select Save

  7. Wählen Sie rechts neben der Canvas im Bereich mit den Moduldetails unter Cleaning mode (Bereinigungsmodus) die Option Remove entire row (Gesamte Zeile entfernen) aus.In the module details pane to the right of the canvas, select Remove entire row under Cleaning mode.

  8. Wählen Sie rechts neben der Canvas im Bereich mit den Moduldetails das Textfeld Kommentar aus, und geben Sie Remove missing value rows (Zeilen mit fehlenden Werten entfernen) ein.In the module details pane to the right of the canvas, select the Comment box, and enter Remove missing value rows.

    Ihre Pipeline sollte nun in etwa wie folgt aussehen:Your pipeline should now look something like this:

    Select-column

Trainieren eines Machine Learning-ModellsTrain a machine learning model

Nachdem Sie nun über die Module für die Datenverarbeitung verfügen, können Sie die Trainingsmodule einrichten.Now that you have the modules in place to process the data, you can set up the training modules.

Da Sie einen Preis (also eine Zahl) vorhersagen möchten, können Sie einen Regressionsalgorithmus verwenden.Because you want to predict price, which is a number, you can use a regression algorithm. In diesem Beispiel verwenden Sie ein lineares Regressionsmodell.For this example, you use a linear regression model.

Teilen der DatenSplit the data

Das Aufteilen von Daten ist eine gängige Aufgabe beim maschinellen Lernen.Splitting data is a common task in machine learning. Ihre Daten werden in zwei separate Datasets aufgeteilt:You will split your data into two separate datasets. eins zum Trainieren des Modells und eins zum Testen der Ergebnisqualität des Modells.One dataset will train the model and the other will test how well the model performed.

  1. Erweitern Sie in der Modulpalette den Abschnitt Datentransformation, und suchen Sie nach dem Modul Split Data (Daten aufteilen).In the module palette, expand the section Data Transformation and find the Split Data module.

  2. Ziehen Sie das Modul Split Data (Daten aufteilen) auf die Pipelinecanvas.Drag the Split Data module to the pipeline canvas.

  3. Verbinden Sie den linken Port des Moduls Clean Missing Data (Fehlende Daten bereinigen) mit dem Modul Split Data (Daten aufteilen).Connect the left port of the Clean Missing Data module to the Split Data module.

    Wichtig

    Achten Sie darauf, dass der linke Ausgabeport von Clean Missing Data (Fehlende Daten bereinigen) mit Split Data (Daten aufteilen) verbunden ist.Be sure that the left output ports of Clean Missing Data connects to Split Data. Der linke Port enthält die bereinigten Daten.The left port contains the the cleaned data. Der rechte Port enthält die verworfenen Daten.The right port contains the discarted data.

  4. Wählen Sie das Modul Split Data (Daten aufteilen) aus.Select the Split Data module.

  5. Legen Sie rechts neben der Canvas im Bereich mit den Moduldetails die Option Fraction of rows in the first output dataset (Anteil der Zeilen im ersten Ausgabedataset) auf „0,7“ fest.In the module details pane to the right of the canvas, set the Fraction of rows in the first output dataset to 0.7.

    Mit dieser Option werden 70 Prozent der Daten zum Trainieren des Modells und 30 Prozent zum Testen verwendet.This option splits 70 percent of the data to train the model and 30 percent for testing it. Auf das Dataset mit den 70 Prozent kann über den linken Ausgabeport zugegriffen werden.The 70 percent dataset will be accessible through the left output port. Die restlichen Daten sind über den rechten Ausgabeport verfügbar.The remaining data will be available through the right output port.

  6. Wählen Sie rechts neben der Canvas im Bereich mit den Moduldetails das Textfeld Kommentar aus, und geben Sie Split the dataset into training set (0.7) and test set (0.3) (Dataset in Trainingssatz (0,7) und Testsatz (0,3) unterteilen) ein.In the module details pane to the right of the canvas, select the Comment box, and enter Split the dataset into training set (0.7) and test set (0.3).

Trainieren des ModellsTrain the model

Trainieren Sie das Modell, indem Sie ein Dataset mit Preis bereitstellen.Train the model by giving it a dataset that includes the price. Durch den Algorithmus wird ein Modell erstellt, das die Beziehung zwischen den Features und dem Preis aus den Trainingsdaten erklärt.The algorithm constructs a model that explains the relationship between the features and the price as presented by the training data.

  1. Erweitern Sie in der Modulpalette den Abschnitt Machine Learning-Algorithmen.In the module palette, expand Machine Learning Algorithms.

    Mit dieser Option werden verschiedene Kategorien von Modulen angezeigt, die Sie zur Initialisierung von Lernalgorithmen verwenden können.This option displays several categories of modules that you can use to initialize learning algorithms.

  2. Wählen Sie Regression > Linear Regression (Lineare Regression) aus, und ziehen Sie sie auf die Pipelinecanvas.Select Regression > Linear Regression, and drag it to the pipeline canvas.

  3. Erweitern Sie in der Modulpalette den Abschnitt Module training (Modultraining), und ziehen Sie das Modul Train Model (Modell trainieren) auf die Canvas.In the module palette, expand the section Module training, and drag the Train Model module to the canvas.

  4. Verbinden Sie die Ausgabe des Moduls Linear Regression (Lineare Regression) mit der linken Eingabe des Moduls Train Model (Modell trainieren).Connect the output of the Linear Regression module to the left input of the Train Model module.

  5. Verbinden Sie die Trainingsdatenausgabe (linker Port) des Moduls Split Data (Daten aufteilen) mit der rechten Eingabe des Moduls Train Model (Modell trainieren).Connect the training data output (left port) of the Split Data module to the right input of the Train Model module.

    Wichtig

    Achten Sie darauf, dass der linke Ausgabeport von Split Data (Daten aufteilen) mit Train Model (Modell trainieren) verbunden ist.Be sure that the left output ports of Split Data connects to Train Model. Der linke Port enthält den Trainingssatz.The left port contains the the training set. Der rechte Port enthält den Testsatz.The right port contains the test set.

    Screenshot: Richtige Konfiguration des Moduls „Train Model“ (Modell trainieren). Das Modul „Linear Regression“ (Lineare Regression) ist mit dem linken Port des Moduls „Train Model“ verbunden, und das Modul „Split Data“ (Daten aufteilen) ist mit dem rechten Port von „Train Model“ verbunden.

  6. Wählen Sie das Modul Train Model (Modell trainieren) aus.Select the Train Model module.

  7. Wählen Sie rechts neben der Canvas im Bereich mit den Moduldetails den Selektor Spalte bearbeiten aus.In the module details pane to the right of the canvas, select Edit column selector.

  8. Erweitern Sie im Dialogfeld Bezeichnungsspalte das Dropdownmenü, und wählen Sie Spaltennamen aus.In the Label column dialog box, expand the drop-down menu and select Column names.

  9. Geben Sie price (Preis) in das Textfeld ein, um den Wert anzugeben, der von Ihrem Modell prognostiziert wird.In the text box, enter price to specify the value that your model is going to predict.

    Wichtig

    Achten Sie darauf, dass Sie den Spaltennamen genau eingeben.Make sure you enter the column name exactly. Schreiben Sie price nicht groß.Do not capitalize price.

    Ihre Pipeline sollte wie folgt aussehen:Your pipeline should look like this:

    Screenshot: Richtige Pipelinekonfiguration nach dem Hinzufügen des Moduls „Train Model“ (Modell trainieren)

Hinzufügen des Moduls „Score Model“ (Modell bewerten)Add the Score Model module

Nachdem Sie das Modell mit 70 Prozent der Daten trainiert haben, können Sie unter Verwendung der restlichen 30 Prozent bewerten, wie gut das Modell funktioniert.After you train your model by using 70 percent of the data, you can use it to score the other 30 percent to see how well your model functions.

  1. Geben Sie im Suchfeld den Begriff score model ein, um nach dem Modul Score Model (Bewertungsmodell) zu suchen.Enter score model in the search box to find the Score Model module. Ziehen Sie das Modul auf die Pipelinecanvas.Drag the module to the pipeline canvas.

  2. Verbinden Sie die Ausgabe des Moduls Train Model mit dem linken Eingabeport des Moduls Score Model.Connect the output of the Train Model module to the left input port of Score Model. Verbinden Sie die Testdatenausgabe (den rechten Port) des Moduls Split Data mit dem rechten Eingabeport des Moduls Score Model.Connect the test data output (right port) of the Split Data module to the right input port of Score Model.

Hinzufügen des Moduls „Evaluate Model“Add the Evaluate Model module

Verwenden Sie das Modul Evaluate Model (Modell auswerten), um auszuwerten, wie gut das Testdataset von Ihrem Modell bewertet wurde.Use the Evaluate Model module to evaluate how well your model scored the test dataset.

  1. Geben Sie im Suchfeld den Begriff evaluate ein, um nach dem Modul Evaluate Model (Modell auswerten) zu suchen.Enter evaluate in the search box to find the Evaluate Model module. Ziehen Sie das Modul auf die Pipelinecanvas.Drag the module to the pipeline canvas.

  2. Verbinden Sie die Ausgabe des Moduls Score Model mit der linken Eingabe des Moduls Evaluate Model.Connect the output of the Score Model module to the left input of Evaluate Model.

    Die fertige Pipeline sollte in etwa wie folgt aussehen:The final pipeline should look something like this:

    Screenshot: Richtige Pipelinekonfiguration

Übermitteln der PipelineSubmit the pipeline

Nachdem die Einrichtung Ihrer Pipeline jetzt abgeschlossen ist, können Sie eine Pipelineausführung übermitteln, um Ihr Machine Learning-Modell zu trainieren.Now that your pipeline is all setup, you can submit a pipeline run to train your machine learning model. Sie können jederzeit eine gültige Pipelineausführung übermitteln, mit der während der Entwicklung Änderungen an ihrer Pipeline überprüft werden können.You can submit a valid pipeline run at any point, which can be used to review changes to your pipeline during development.

  1. Wählen Sie im oberen Bereich der Canvas die Option Senden aus.At the top of the canvas, select Submit.

  2. Wählen Sie im Dialogfeld Pipelineausführung einrichten die Option Neu erstellen aus.In the Set up pipeline run dialog box, select Create new.

    Hinweis

    Experimente fassen ähnliche Pipelineausführungen in einer Gruppe zusammen.Experiments group similar pipeline runs together. Wenn Sie eine Pipeline mehrmals ausführen, können Sie für weitere Ausführungen das gleiche Experiment auswählen.If you run a pipeline multiple times, you can select the same experiment for successive runs.

    1. Geben Sie unter Neuer Experimentname einen aussagekräftigen Namen ein.Enter a descriptive name for New experiment Name.

    2. Klicken Sie auf Submit (Senden).Select Submit.

    Ausführungsstatus und Details können rechts oben auf der Canvas angezeigt werden.You can view run status and details at the top right of the canvas.

    Handelt es sich um die erste Ausführung, kann die vollständige Ausführung der Pipeline bis zu 20 Minuten dauern.If is the first run, it may take up to 20 minutes for your pipeline to finish running. In den Standardcomputeeinstellungen ist eine minimale Knotengröße von 0 festgelegt. Das bedeutet, dass der Designer Ressourcen nach dem Leerlauf zuordnen muss.The default compute settings have a minimum node size of 0, which means that the designer must allocate resources after being idle. Wiederholte Pipelineausführungen werden schneller abgeschlossen, da die Computeressourcen bereits zugeordnet sind.Repeated pipeline runs will take less time since the compute resources are already allocated. Außerdem verwendet der Designer für jedes Modul zwischengespeicherte Ergebnisse, um die Effizienz weiter zu steigern.Additionally, the designer uses cached results for each module to further improve efficiency.

Anzeigen bewerteter BezeichnungenView scored labels

Nach Abschluss der Ausführung können Sie sich die Ergebnisse ansehen.After the run completes, you can view the results of the pipeline run. Sehen Sie sich zuerst die vom Regressionsmodell generierten Vorhersagen an.First, look at the predictions generated by the regression model.

  1. Klicken Sie mit der rechten Maustaste auf das Modul Score Model und wählen Sie Visualisieren aus, um seine Ausgabe anzuzeigen.Right click the Score Model module, and select Visualize to view its output.

    Hier sehen Sie die vorhergesagten Preise und die tatsächlichen Preise aus den Testdaten.Here you can see the predicted prices and the actual prices from the testing data.

    Screenshot: Ausgabevisualisierung mit hervorgehobener Spalte „Scored Labels“ (Bewertete Bezeichnungen)

Auswerten von ModellenEvaluate models

Verwenden Sie das Modul Evaluate Model (Modell auswerten), um zu prüfen, wie gut das trainierte Modell beim Testdataset abgeschnitten hat.Use the Evaluate Model to see how well the trained model performed on the test dataset.

  1. Klicken Sie mit der rechten Maustaste auf das Modul Evaluate Model und wählen Sie Visualisieren aus, um seine Ausgabe anzuzeigen.Right-click the Evaluate Model module and select Visualize to view its output.

Die folgenden Statistiken werden für Ihr Modell angezeigt:The following statistics are shown for your model:

  • Mean Absolute Error (MAE) (Mittlerer absoluter Fehler): Der Mittelwert der absoluten Fehler.Mean Absolute Error (MAE): The average of absolute errors. Ein Fehler ist die Differenz zwischen dem prognostizierten und dem tatsächlichen Wert.An error is the difference between the predicted value and the actual value.
  • Root Mean Squared Error (RMSE) (Wurzel des mittleren quadratischen Fehlers): Die Quadratwurzel des Durchschnitts des Quadrats der Prognosefehler für das Testdataset.Root Mean Squared Error (RMSE): The square root of the average of squared errors of predictions made on the test dataset.
  • Relative Absolute Error: Der Mittelwert der absoluten Fehler relativ zur absoluten Differenz zwischen tatsächlichen Werten und dem Durchschnitt aller tatsächlichen Werte.Relative Absolute Error: The average of absolute errors relative to the absolute difference between actual values and the average of all actual values.
  • Relative Squared Error: Der Durchschnitt der quadrierten Fehler relativ zur quadrierten Differenz zwischen tatsächlichen Werten und dem Durchschnitt aller tatsächlichen Werte.Relative Squared Error: The average of squared errors relative to the squared difference between the actual values and the average of all actual values.
  • Coefficient of Determination: Dieser auch als „R-Quadrat“ bezeichnete Wert ist eine statistische Kenngröße, die angibt, wie gut ein Modell zu den Daten passt.Coefficient of Determination: Also known as the R squared value, this statistical metric indicates how well a model fits the data.

Für jede Fehlerstatistik sind kleinere Werte besser.For each of the error statistics, smaller is better. Ein kleinerer Wert gibt an, dass die Vorhersagen näher bei den tatsächlichen Werten liegen.A smaller value indicates that the predictions are closer to the actual values. Für den Bestimmungskoeffizienten gilt Folgendes: Je näher der Bestimmungskoeffizient am Wert eins (1,0) liegt, desto besser die Vorhersage.For the coefficient of determination, the closer its value is to one (1.0), the better the predictions.

Bereinigen von RessourcenClean up resources

Überspringen Sie diesen Abschnitt, wenn Sie mit dem zweiten Teil des Tutorials (Bereitstellen eines Machine Learning-Modells mit dem Designer) fortfahren möchten.Skip this section if you want to continue on with part 2 of the tutorial, deploying models.

Wichtig

Sie können die von Ihnen bei der Vorbereitung erstellten Ressourcen auch in anderen Tutorials und Anleitungen für Azure Machine Learning verwenden.You can use the resources that you created as prerequisites for other Azure Machine Learning tutorials and how-to articles.

Alles löschenDelete everything

Wenn Sie die erstellten Ressourcen nicht mehr benötigen, löschen Sie die gesamte Ressourcengruppe, damit Ihnen keine Kosten entstehen.If you don't plan to use anything that you created, delete the entire resource group so you don't incur any charges.

  1. Wählen Sie im Azure-Portal links im Fenster Ressourcengruppen aus.In the Azure portal, select Resource groups on the left side of the window.

    Löschen der Ressourcengruppe im Azure-Portal

  2. Wählen Sie in der Liste die Ressourcengruppe aus, die Sie erstellt haben.In the list, select the resource group that you created.

  3. Wählen Sie die Option Ressourcengruppe löschen.Select Delete resource group.

Durch das Löschen einer Ressourcengruppe werden auch alle im Designer erstellten Ressourcen gelöscht.Deleting the resource group also deletes all resources that you created in the designer.

Löschen einzelner ObjekteDelete individual assets

In dem Designer, in dem Sie Ihr Experiment erstellt haben, können Sie einzelne Ressourcen löschen, indem Sie erst die gewünschten Ressourcen und dann die Schaltfläche Löschen auswählen.In the designer where you created your experiment, delete individual assets by selecting them and then selecting the Delete button.

Das hier erstellte Computeziel wird automatisch auf null Knoten skaliert, wenn es nicht verwendet wird.The compute target that you created here automatically autoscales to zero nodes when it's not being used. Diese Aktion wird durchgeführt, um Gebühren zu minimieren.This action is taken to minimize charges. Wenn Sie das Computeziel löschen möchten, führen Sie die folgenden Schritte aus: If you want to delete the compute target, take these steps:

Löschen von Assets

Die Registrierung von Datasets im Arbeitsbereich kann aufgehoben werden, indem Sie die einzelnen Datasets und anschließend Registrierung aufheben auswählen.You can unregister datasets from your workspace by selecting each dataset and selecting Unregister.

Aufheben der Registrierung eines Datasets

Zum Löschen eines Datasets wechseln Sie im Azure-Portal oder Azure Storage-Explorer zum Speicherkonto, und löschen Sie diese Ressourcen manuell.To delete a dataset, go to the storage account by using the Azure portal or Azure Storage Explorer and manually delete those assets.

Nächste SchritteNext steps

Im zweiten Teil erfahren Sie, wie Sie Ihr Modell als Echtzeitendpunkt bereitstellen.In part two, you'll learn how to deploy your model as a real-time endpoint.