Zelfstudie: Prijzen voor auto's voorspellen met de ontwerpfunctie (preview-versie)Tutorial: Predict automobile price with the designer (preview)

van toepassing op:  geen Basic  -editie Ja Enter prise Edition                         (upgrade naar Enter prise)APPLIES TO: noBasic edition yesEnterprise edition                       (Upgrade to Enterprise)

In deze tweedelige zelfstudie leert u hoe u het Azure Machine Learning-ontwerpprogramma gebruikt om een machine learning-model te trainen en te implementeren waarmee de prijs van een willekeurige auto kan worden voorspeld.In this two-part tutorial, you learn how to use the Azure Machine Learning designer to train and deploy a machine learning model that predicts the price of any car. De ontwerpfunctie is een slepen-en-neerzettenprogramma waarmee u machine learning-modellen kunt maken zonder ook maar één regel code.The designer is a drag-and-drop tool that lets you create machine learning models without a single line of code.

In deel 1 van de zelfstudie leert u het volgende:In part one of the tutorial, you'll learn how to:

  • Een nieuwe pijplijn maken.Create a new pipeline.
  • Gegevens importeren.Import data.
  • Gegevens voorbereiden.Prepare data.
  • Een machine learning-model trainen.Train a machine learning model.
  • Een machine learning-model evalueren.Evaluate a machine learning model.

In deel 2 van de zelfstudie gaat u uw model implementeren als een realtime deductie-eindpunt om de prijs van een willekeurige auto te voorspellen op basis van technische specificaties die u naar het eindpunt stuurt.In part two of the tutorial, you'll deploy your model as a real-time inferencing endpoint to predict the price of any car based on technical specifications you send it.

Notitie

Een voltooide versie van deze zelfstudie is als voorbeeldpijplijn beschikbaar.A completed version of this tutorial is available as a sample pipeline.

Ga naar de ontwerpfunctie in uw werkruimte om deze te zoeken.To find it, go to the designer in your workspace. In de sectie Nieuwe pijplijn selecteert u Voorbeeld 1 - Regressie: Voorspelling van de autoprijs (basis) .In the New pipeline section, select Sample 1 - Regression: Automobile Price Prediction(Basic).

Belangrijk

Als u grafische elementen die in dit document worden vermeld, zoals knoppen in Studio of Designer, niet ziet, hebt u mogelijk niet het juiste machtigingsniveau voor de werkruimte.If you do not see graphical elements mentioned in this document, such as buttons in studio or designer, you may not have the right level of permissions to the workspace. Neem contact op met de beheerder van uw Azure-abonnement om te controleren of u het juiste toegangsniveau hebt gekregen.Please contact your Azure subscription administrator to verify that you have been granted the correct level of access. Zie Gebruikers en rollen beherenvoor meer informatie.For more information, see Manage users and roles.

Een nieuwe pijplijn makenCreate a new pipeline

Met Azure Machine Learning-pijplijnen kunnen meerdere stappen voor machine learning en gegevensverwerking in één resource worden georganiseerd.Azure Machine Learning pipelines organize multiple machine learning and data processing steps into a single resource. Met pijplijnen kunt u complexe machine learning-workflows voor verschillende projecten en gebruikers organiseren, beheren en opnieuw gebruiken.Pipelines let you organize, manage, and reuse complex machine learning workflows across projects and users.

Als u een Azure Machine Learning-pijplijn wilt maken, hebt u een Azure Machine Learning-werkruimte nodig.To create an Azure Machine Learning pipeline, you need an Azure Machine Learning workspace. In deze sectie leert u hoe u deze beide resources maakt.In this section, you learn how to create both these resources.

Een nieuwe werkruimte makenCreate a new workspace

Als u de ontwerpfunctie wilt gebruiken, hebt u eerst een Azure Machine Learning-werkruimte nodig.In order to use the designer, you first need an Azure Machine Learning workspace. De werkruimte is de resource op het hoogste niveau voor Azure Machine Learning en biedt een gecentraliseerde werkplek met alle artefacten die u in Azure Machine Learning maakt.The workspace is the top-level resource for Azure Machine Learning, it provides a centralized place to work with all the artifacts you create in Azure Machine Learning.

Als u een Azure Machine Learning-werkruimte met een Enterprise-editie hebt, kunt u deze stap overslaan en met de volgende sectie verdergaan.If you have an Azure Machine Learning workspace with an Enterprise edition, skip to the next section.

  1. Meld u aan bij de Azure Portal met behulp van de referenties voor uw Azure-abonnement.Sign in to the Azure portal by using the credentials for your Azure subscription.

  2. Selecteer in de linkerbovenhoek van de Azure Portal + een resource maken.In the upper-left corner of the Azure portal, select + Create a resource.

    Een nieuwe resource maken

  3. Gebruik de zoek balk om machine learningte vinden.Use the search bar to find Machine Learning.

  4. Selecteer machine learning.Select Machine Learning.

  5. Selecteer in het deel venster machine learning de optie maken om te beginnen.In the Machine Learning pane, select Create to begin.

  6. Geef de volgende informatie op om uw nieuwe werk ruimte te configureren:Provide the following information to configure your new workspace:

    VeldField BeschrijvingDescription
    Naam van de werkruimteWorkspace name Voer een unieke naam in die uw werk ruimte identificeert.Enter a unique name that identifies your workspace. In dit voor beeld gebruiken we docs-WS.In this example, we use docs-ws. De namen moeten uniek zijn in de resource groep.Names must be unique across the resource group. Gebruik een naam die gemakkelijk kan worden ingetrokken en om onderscheid te maken tussen werk ruimten die door anderen zijn gemaakt.Use a name that's easy to recall and to differentiate from workspaces created by others.
    AbonnementSubscription Selecteer het Azure-abonnement dat u wilt gebruiken.Select the Azure subscription that you want to use.
    ResourcegroepResource group Gebruik een bestaande resource groep in uw abonnement of voer een naam in om een nieuwe resource groep te maken.Use an existing resource group in your subscription, or enter a name to create a new resource group. Een resource groep bevat gerelateerde resources voor een Azure-oplossing.A resource group holds related resources for an Azure solution. In dit voor beeld gebruiken we docs-AML.In this example, we use docs-aml.
    LocatieLocation Selecteer de locatie die het dichtst bij uw gebruikers ligt en de gegevens bronnen om uw werk ruimte te maken.Select the location closest to your users and the data resources to create your workspace.
    Werkruimte editieWorkspace edition Selecteer Enter prise.Select Enterprise. Voor deze zelf studie is het gebruik van de Enter prise-editie vereist.This tutorial requires the use of the Enterprise edition. De Enter prise Edition is een preview-versie en voegt momenteel geen extra kosten toe.The Enterprise edition is in preview and doesn't currently add any extra costs.
  7. Nadat u klaar bent met het configureren van de werk ruimte, selecteert u maken.After you're finished configuring the workspace, select Create.

    Waarschuwing

    Het kan enkele minuten duren om uw werk ruimte in de cloud te maken.It can take several minutes to create your workspace in the cloud.

    Wanneer het proces is voltooid, wordt een bericht over een geslaagde implementatie weer gegeven.When the process is finished, a deployment success message appears.

  8. Als u de nieuwe werk ruimte wilt weer geven, selecteert u Ga naar resource.To view the new workspace, select Go to resource.

Maak de pijplijnCreate the pipeline

  1. Meld u aan op ml.azure.com en selecteer de werkruimte waar u mee wilt werken.Sign in to ml.azure.com, and select the workspace you want to work with.

  2. Selecteer Designer.Select Designer.

    Schermopname van de visuele werkruimte met instructies voor toegang tot de ontwerpfunctie

  3. Selecteer Gebruiksvriendelijke vooraf gebouwde modules.Select Easy-to-use prebuilt modules.

  4. Selecteer bovenaan het canvas de standaardpijplijnnaam Pipeline-Created-on.At the top of the canvas, select the default pipeline name Pipeline-Created-on. Wijzig de naam in Voorspelling van de autoprijs.Rename it to Automobile price prediction. De naam hoeft niet uniek te zijn.The name doesn't need to be unique.

Het standaardrekendoel instellenSet the default compute target

Een pijplijn wordt uitgevoerd op een rekendoel. Dit is een rekenresource die aan uw werkruimte is gekoppeld.A pipeline runs on a compute target, which is a compute resource that's attached to your workspace. Nadat u een rekendoel hebt gemaakt, kunt u dit voor toekomstige uitvoeringen opnieuw gebruiken.After you create a compute target, you can reuse it for future runs.

U kunt een standaardrekendoel voor de gehele pijplijn instellen. Hierdoor geeft u aan dat voor elke module standaard hetzelfde rekendoel moet worden gebruikt.You can set a Default compute target for the entire pipeline, which will tell every module to use the same compute target by default. U kunt echter ook rekendoelen per module opgeven.However, you can specify compute targets on a per-module basis.

  1. Naast de pijplijnnaam selecteert u het tandwielpictogram Schermopname van het tandwielpictogram bovenaan het canvas om het deelvenster Instellingen te openen.Next to the pipeline name, select the Gear icon Screenshot of the gear icon at the top of the canvas to open the Settings pane.

  2. In het deelvenster Instellingen rechts naast het canvas selecteert u Rekendoel selecteren.In the Settings pane to the right of the canvas, select Select compute target.

    Als u al een beschikbaar rekendoel hebt, kunt u dit selecteren om deze pijplijn uit te voeren.If you already have an available compute target, you can select it to run this pipeline.

    Notitie

    Met de ontwerpfunctie kunnen alleen trainingsexperimenten worden uitgevoerd op rekenexemplaren van Azure Machine Learning Compute en Azure Machine Learning maar andere rekendoelen worden niet weergegeven.The designer can only run training experiments on Azure Machine Learning Compute and Azure Machine Learning compute instances but other compute targets won't be shown.

  3. Voer een naam in voor de rekenresource.Enter a name for the compute resource.

  4. Selecteer Opslaan.Select Save.

    Notitie

    Het duurt ongeveer vijf minuten om een rekenresource te maken.It takes approximately five minutes to create a compute resource. Nadat de resource is gemaakt, kunt u dit opnieuw gebruiken en deze wachttijd voor toekomstige uitvoeringen overslaan.After the resource is created, you can reuse it and skip this wait time for future runs.

    De schaal van de rekenresource wordt automatisch aangepast naar nul knooppunten wanneer deze inactief is, om kosten te besparen.The compute resource autoscales to zero nodes when it's idle to save cost. Wanneer u de resource na een vertraging opnieuw nodig hebt, duurt het mogelijk ongeveer vijf minuten voordat de schaal weer terug is gezet.When you use it again after a delay, you might experience approximately five minutes of wait time while it scales back up.

Gegevens importerenImport data

Er zijn diverse voorbeeldgegevenssets meegeleverd in de ontwerpfunctie waarmee u kunt experimenteren.There are several sample datasets included in the designer for you to experiment with. Voor deze zelfstudie gebruikt u Automobile price data (Raw) .For this tutorial, use Automobile price data (Raw).

  1. Aan de linkerkant van het pijplijncanvas ziet u een palet met gegevenssets en modules.To the left of the pipeline canvas is a palette of datasets and modules. Selecteer Gegevenssets en bekijk dan de sectie Voorbeelden om de beschikbare voorbeeldgegevenssets weer te geven.Select Datasets, and then view the Samples section to view the available sample datasets.

  2. Selecteer de gegevensset Automobile price data (Raw) en sleep deze naar het canvas.Select the dataset Automobile price data (Raw), and drag it onto the canvas.

    Gegevens naar het canvas slepen

De gegevens visualiserenVisualize the data

U kunt de gegevens visualiseren voor meer informatie over de gegevensset die u gebruikt.You can visualize the data to understand the dataset that you'll use.

  1. Selecteer de module Automobile price data (Raw) .Select the Automobile price data (Raw) module.

  2. In het deelvenster Details van de module aan de rechterkant van het canvas selecteert u Uitvoer en logboeken.In the module details pane to the right of the canvas, select Outputs + log.

  3. Selecteer het grafiekpictogram om de gegevens te visualiseren.Select the graph icon to visualize the data.

    Alternatieve tekst hier.

  4. Selecteer de verschillende kolommen in het gegevensvenster om informatie over elke kolom weer te geven.Select the different columns in the data window to view information about each one.

    Elke auto wordt weergegeven als een rij. De variabelen die aan elke auto zijn gekoppeld, worden weergegeven als kolommen.Each row represents an automobile, and the variables associated with each automobile appear as columns. Er zijn 205 rijen en 26 kolommen in deze gegevensset.There are 205 rows and 26 columns in this dataset.

Gegevens voorbereidenPrepare data

Voor gegevenssets moet u doorgaans enige verwerking vooraf uitvoeren voordat u de analyse kunt uitvoeren.Datasets typically require some preprocessing before analysis. U hebt wellicht al gezien dat er een aantal waarden ontbreekt toen u de gegevensset inspecteerde.You might have noticed some missing values when you inspected the dataset. Deze ontbrekende waarden moeten worden opgeschoond, zodat de gegevens correct kunnen worden geanalyseerd.These missing values must be cleaned so that the model can analyze the data correctly.

Een kolom verwijderenRemove a column

Wanneer u een model traint, moet u iets doen aan de ontbrekende gegevens.When you train a model, you have to do something about the data that's missing. In deze gegevensset ontbreken veel waarden in de kolom normalized-losses. Deze kolom gaat u dus helemaal uit het model verwijderen.In this dataset, the normalized-losses column is missing many values, so you will exclude that column from the model altogether.

  1. In het modulepalet aan de linkerkant van het canvas vouwt u de sectie Gegevenstransformatie uit en zoekt u de module Select Columns in Dataset.In the module palette to the left of the canvas, expand the Data Transformation section and find the Select Columns in Dataset module.

  2. Sleep de module Select Columns in Dataset naar het canvas.Drag the Select Columns in Dataset module onto the canvas. Zet de module onder de gegevenssetmodule neer.Drop the module below the dataset module.

  3. Koppel de gegevensset Automobile price data (Raw) aan de module Select Columns in Dataset.Connect the Automobile price data (Raw) dataset to the Select Columns in Dataset module. Sleep van de uitvoerpoort van de gegevensset (de kleine cirkel onderaan de gegevensset op het canvas) naar de invoerpoort van Select Columns in Dataset (de kleine cirkel bovenaan de module).Drag from the dataset's output port, which is the small circle at the bottom of the dataset on the canvas, to the input port of Select Columns in Dataset, which is the small circle at the top of the module.

    Tip

    U maakt een gegevensstroom via uw pijplijn wanneer u de uitvoerpoort van de ene module wilt koppelen aan een invoerpoort van de andere module.You create a flow of data through your pipeline when you connect the output port of one module to an input port of another.

    Modules koppelen

  4. Selecteer de module Select Columns in Dataset.Select the Select Columns in Dataset module.

  5. In het deelvenster Details van de module aan de rechterkant van het canvas selecteert u Kolom bewerken.In the module details pane to the right of the canvas, select Edit column.

  6. Vouw de vervolgkeuzelijst Kolomnamen naast Invoegen uit en selecteer Alle kolommen.Expand the Column names drop down next to Include, and select All columns.

  7. Selecteer de + om een nieuwe regel toe te voegen.Select the + to add a new rule.

  8. Bij de vervolgkeuzemenu's selecteert u Uitsluiten en Kolomnamen.From the drop-down menus, select Exclude and Column names.

  9. Voer normalized-losses in het tekstvak in.Enter normalized-losses in the text box.

  10. Rechtsonder selecteert u Opslaan om de kolomselector te sluiten.In the lower right, select Save to close the column selector.

    Een kolom uitsluiten

  11. Selecteer de module Select Columns in Dataset.Select the Select Columns in Dataset module.

  12. In het deelvenster Details van de module aan de rechterkant van het canvas selecteert u het tekstvak Opmerking en voert u Genormaliseerde verliezen uitsluiten in.In the module details pane to the right of the canvas, select the Comment text box and enter Exclude normalized losses.

    Opmerkingen worden op de grafiek weergegeven om uw pijplijn te helpen organiseren.Comments will appear on the graph to help you organize your pipeline.

Ontbrekende gegevens opschonenClean missing data

Er ontbreken nog steeds waarden in uw gegevensset nadat u de kolom normalized-losses hebt verwijderd.Your dataset still has missing values after you remove the normalized-losses column. U kunt de resterende ontbrekende gegevens verwijderen aan de hand van de module Clean Missing Data.You can remove the remaining missing data by using the Clean Missing Data module.

Tip

Voor de meeste modules geldt dat voor het gebruik van de module de ontbrekende invoergegevens moeten worden opgeschoond met de ontwerpfunctie.Cleaning the missing values from input data is a prerequisite for using most of the modules in the designer.

  1. In het modulepalet aan de linkerkant van het canvas vouwt u de sectie Gegevenstransformatie uit en zoekt u de module Clean Missing Data.In the module palette to the left of the canvas, expand the section Data Transformation, and find the Clean Missing Data module.

  2. Sleep de module Clean Missing Data naar het pijplijncanvas.Drag the Clean Missing Data module to the pipeline canvas. Koppel deze module aan de module Select Columns in Dataset.Connect it to the Select Columns in Dataset module.

  3. Selecteer de module Clean Missing Data.Select the Clean Missing Data module.

  4. In het deelvenster Details van de module aan de rechterkant van het canvas selecteert u Kolom bewerken.In the module details pane to the right of the canvas, select Edit Column.

  5. In het venster Kolommen die moeten worden gewist dat wordt weergegeven, vouwt u het vervolgkeuzemenu naast Invoegen uit.In the Columns to be cleaned window that appears, expand the drop-down menu next to Include. Selecteer Alle kolommenSelect, All columns

  6. Selecteer OpslaanSelect Save

  7. In het deelvenster Details van de module aan de rechterkant van het canvas selecteert u Gehele rij verwijderen onder Wismodus.In the module details pane to the right of the canvas, select Remove entire row under Cleaning mode.

  8. In het deelvenster Details van de module aan de rechterkant van het canvas selecteert u het vak Opmerking en voert u Rijen met ontbrekende waarden verwijderen in.In the module details pane to the right of the canvas, select the Comment box, and enter Remove missing value rows.

    Uw pijplijn ziet er als volgt uit:Your pipeline should now look something like this:

    Selecteer-kolom

Een machine learning-model trainenTrain a machine learning model

Nu u over de modules beschikt om de gegevens te verwerken, kunt u de trainingsmodules instellen.Now that you have the modules in place to process the data, you can set up the training modules.

Omdat u de prijs wilt voorspellen, wat een getal is, gebruikt u een regressiealgoritme.Because you want to predict price, which is a number, you can use a regression algorithm. In dit voorbeeld gebruikt u een lineair regressiemodel.For this example, you use a linear regression model.

De gegevens splitsenSplit the data

Het splitsen van gegevens is een algemene taak bij machine learning.Splitting data is a common task in machine learning. U splitst uw gegevens in twee afzonderlijke gegevenssets.You will split your data into two separate datasets. Met de ene gegevensset wordt het model getraind en met de andere gegevensset wordt getest hoe goed het model presteert.One dataset will train the model and the other will test how well the model performed.

  1. Vouw in het modulepalet de sectie Gegevenstransformatie uit en zoek de module Split Data.In the module palette, expand the section Data Transformation and find the Split Data module.

  2. Sleep de module Split Data naar het pijplijncanvas.Drag the Split Data module to the pipeline canvas.

  3. Koppel de linkerpoort van de module Clean Missing Data aan de module Split Data.Connect the left port of the Clean Missing Data module to the Split Data module.

    Belangrijk

    Controleer of de linkeruitvoerpoort van Clean Missing Data inderdaad aan Split Data wordt gekoppeld.Be sure that the left output ports of Clean Missing Data connects to Split Data. De linkerpoort bevat de opgeschoonde gegevens.The left port contains the the cleaned data. De rechterpoort bevat de verwijderde gegevens.The right port contains the discarted data.

  4. Selecteer de module Split Data.Select the Split Data module.

  5. In het deelvenster Details van de module aan de rechterkant van het canvas stelt u het gedeelte van rijen in de eerste uitvoergegevensset in op 0,7.In the module details pane to the right of the canvas, set the Fraction of rows in the first output dataset to 0.7.

    Met deze optie wordt 70% van de gegevens gebruikt om het model te trainen en 30% om het model te testen.This option splits 70 percent of the data to train the model and 30 percent for testing it. De gegevensset van 70% is toegankelijk via de linkeruitvoerpoort.The 70 percent dataset will be accessible through the left output port. De resterende gegevens zijn beschikbaar via de rechteruitvoerpoort.The remaining data will be available through the right output port.

  6. In het deelvenster Details van de module aan de rechterkant van het canvas selecteert u het vak Opmerking en voert u De gegevensset splitsen in een trainingsset (0,7) en een testset (0,3) in.In the module details pane to the right of the canvas, select the Comment box, and enter Split the dataset into training set (0.7) and test set (0.3).

Het model trainenTrain the model

Train het model door hiervoor een gegevensset te gebruiken waarin de prijs een van de elementen is.Train the model by giving it a dataset that includes the price. Het algoritme bouwt een model waarmee de relatie tussen de functies en de prijs wordt uitgelegd, zoals dat uit de trainingsgegevens blijkt.The algorithm constructs a model that explains the relationship between the features and the price as presented by the training data.

  1. In het modulepalet vouwt u Machine learning-algoritmen uit.In the module palette, expand Machine Learning Algorithms.

    Met deze optie worden diverse categorieën van modules weergegeven die u kunt gebruiken om leeralgoritmen te initialiseren.This option displays several categories of modules that you can use to initialize learning algorithms.

  2. Selecteer Regression > Linear Regression en sleep dit naar het pijplijncanvas.Select Regression > Linear Regression, and drag it to the pipeline canvas.

  3. In het modulepalet vouwt u de sectie Module training uit en sleept u de module Train Model naar het canvas.In the module palette, expand the section Module training, and drag the Train Model module to the canvas.

  4. Koppel de uitvoer van de module Linear Regression aan de linkerinvoer van de module Train Model.Connect the output of the Linear Regression module to the left input of the Train Model module.

  5. Koppel de trainingsgegevensuitvoer (linkerpoort) van de module Split Data aan de rechterinvoer van de module Train Model.Connect the training data output (left port) of the Split Data module to the right input of the Train Model module.

    Belangrijk

    Controleer of de linkeruitvoerpoort van Split Data inderdaad aan Train Model wordt gekoppeld.Be sure that the left output ports of Split Data connects to Train Model. De linkerpoort bevat de trainingsset.The left port contains the the training set. De rechterpoort bevat de testset.The right port contains the test set.

    Schermopname met de juiste configuratie van de module Train Model. De module Linear Regression wordt gekoppeld aan de linkerpoort van de module Train Model en de module Split Data wordt gekoppeld aan de rechterpoort van Train Model.

  6. Selecteer de module Train Model.Select the Train Model module.

  7. In het deelvenster Details van de module aan de rechterkant van het canvas selecteert u de selector Kolom bewerken.In the module details pane to the right of the canvas, select Edit column selector.

  8. In het dialoogvenster Kolom labelen vouwt u het vervolgkeuzemenu uit en selecteert u Kolomnamen.In the Label column dialog box, expand the drop-down menu and select Column names.

  9. In het tekstvak voert u price in om de waarde op te geven die door uw model gaat worden voorspeld.In the text box, enter price to specify the value that your model is going to predict.

    Belangrijk

    Zorg ervoor dat u de kolomnaam exact opgeeft.Make sure you enter the column name exactly. Gebruik geen hoofdletters in het woord price.Do not capitalize price.

    Uw pijplijn ziet er als volgt uit:Your pipeline should look like this:

    Schermopname met de juiste configuratie van de pijplijn nadat de module Train Model is toegevoegd.

De module Score Model toevoegenAdd the Score Model module

Nadat u uw model hebt getraind aan de hand van 70% van de gegevens, kunt u dit gebruiken om de overige 30% van een score te voorzien, om te zien hoe goed uw model werkt.After you train your model by using 70 percent of the data, you can use it to score the other 30 percent to see how well your model functions.

  1. Voer Score Model in het zoekvak in om de module Score Model te zoeken.Enter score model in the search box to find the Score Model module. Sleep de module naar het pijplijncanvas.Drag the module to the pipeline canvas.

  2. Koppel de uitvoer van de module Train Model aan de linkerinvoerpoort van de module Score Model.Connect the output of the Train Model module to the left input port of Score Model. Koppel de testgegevensuitvoer (rechterpoort) van de module Split Data aan de rechterinvoerpoort van de module Score Model.Connect the test data output (right port) of the Split Data module to the right input port of Score Model.

De module Evaluate Model toevoegenAdd the Evaluate Model module

Gebruik de module Evaluate Model om te evalueren hoe goed uw model heeft gescoord voor de testgegevensset.Use the Evaluate Model module to evaluate how well your model scored the test dataset.

  1. Voer evaluate in het zoekvak in om de module Evaluate Model te zoeken.Enter evaluate in the search box to find the Evaluate Model module. Sleep de module naar het pijplijncanvas.Drag the module to the pipeline canvas.

  2. Koppel de uitvoer van de module Score Model aan de linkerinvoer van Evaluate Model.Connect the output of the Score Model module to the left input of Evaluate Model.

    De uiteindelijke pijplijn ziet er als volgt uit:The final pipeline should look something like this:

    Schermopname met de juiste configuratie van de pijplijn.

De pijplijn indienenSubmit the pipeline

Nu uw pijplijn helemaal is ingesteld, kunt u een uitvoering van de pijplijn indienen om uw machine learning-model te trainen.Now that your pipeline is all setup, you can submit a pipeline run to train your machine learning model. U kunt op elk gewenst moment een geldige pijplijnuitvoering indienen. Deze kan worden gebruikt om wijzigingen in uw pijplijn te controleren tijdens de ontwikkeling.You can submit a valid pipeline run at any point, which can be used to review changes to your pipeline during development.

  1. Bovenaan het canvas selecteert u Indienen.At the top of the canvas, select Submit.

  2. In het dialoogvenster Pijplijnuitvoering instellen selecteert u Nieuwe maken.In the Set up pipeline run dialog box, select Create new.

    Notitie

    Aan de hand van experimenten kunt u vergelijkbare pijplijnuitvoeringen groeperen.Experiments group similar pipeline runs together. Als u een pijplijn meerdere keren uitvoert, kunt u hetzelfde experiment selecteren voor achtereenvolgende uitvoeringen.If you run a pipeline multiple times, you can select the same experiment for successive runs.

    1. Voer een beschrijvende naam in voor Naam van nieuw experiment.Enter a descriptive name for New experiment Name.

    2. Selecteer Indienen.Select Submit.

    U kunt de uitvoeringsstatus en details rechtsboven in het canvas zien.You can view run status and details at the top right of the canvas.

    Als dit de eerste keer is dat u de pijplijn uitvoert, kan het maximaal 20 minuten duren voor uw pijplijn helemaal is uitgevoerd.If is the first run, it may take up to 20 minutes for your pipeline to finish running. De standaardrekeninstellingen hebben een minimale knooppuntgrootte van 0, wat betekent dat de ontwerpfunctie na inactiviteit resources moet toewijzen.The default compute settings have a minimum node size of 0, which means that the designer must allocate resources after being idle. Herhaalde pijplijnuitvoeringen kosten minder tijd, omdat de rekenresources al zijn toegewezen.Repeated pipeline runs will take less time since the compute resources are already allocated. Bovendien gebruikt de ontwerpfunctie in de cache opgeslagen resultaten voor elke module om de efficiëntie verder te verbeteren.Additionally, the designer uses cached results for each module to further improve efficiency.

Gescoorde labels weergevenView scored labels

Nadat de uitvoering is voltooid, kunt u de resultaten van de pijplijnuitvoering weergeven.After the run completes, you can view the results of the pipeline run. Kijk eerst naar de voorspellingen die door het regressiemodel zijn gegenereerd.First, look at the predictions generated by the regression model.

  1. Selecteer de module Score Model om de uitvoer weer te geven.Select the Score Model module to view its output.

  2. In het deelvenster Details van de module aan de rechterkant van het canvas selecteert u Uitvoer en logboeken > grafiekpictogram het pictogram Visualiseren om resultaten weer te geven.In the module details pane to the right of the canvas, select Outputs + logs > graph icon visualize icon to view results.

    Hier ziet u de voorspelde prijzen en de daadwerkelijke prijzen van de testgegevens.Here you can see the predicted prices and the actual prices from the testing data.

    Schermopname van de uitvoervisualisatie, waarin de kolom Gescoorde label is gemarkeerd

Modellen evaluerenEvaluate models

Gebruik Evaluate Model om te zien hoe goed het getrainde model heeft gepresteerd met de testgegevensset.Use the Evaluate Model to see how well the trained model performed on the test dataset.

  1. Selecteer de module Evaluate Model om de uitvoer weer te geven.Select the Evaluate Model module to view its output.

  2. In het deelvenster Details van de module aan de rechterkant van het canvas selecteert u Uitvoer en logboeken > grafiekpictogram het pictogram Visualiseren om resultaten weer te geven.In the module details pane to the right of the canvas, select Outputs + logs > graph icon visualize icon to view results.

De volgende statistieken worden weergegeven voor uw model:The following statistics are shown for your model:

  • Gemiddelde absolute fout (Mean Absolute Error of MAE): Het gemiddelde van de absolute fouten.Mean Absolute Error (MAE): The average of absolute errors. Een fout is het verschil tussen de voorspelde waarde en de daadwerkelijke waarde.An error is the difference between the predicted value and the actual value.
  • Standaardafwijking (Root Mean Squared Error of RMSE): De vierkantswortel uit het gemiddelde aan kwadratische fouten voor de voorspellingen op basis van de testgegevensset.Root Mean Squared Error (RMSE): The square root of the average of squared errors of predictions made on the test dataset.
  • Relatieve absolute fout: Het gemiddelde aan absolute fouten ten opzichte van het absolute verschil tussen de werkelijke waarden en het gemiddelde van alle werkelijke waarden.Relative Absolute Error: The average of absolute errors relative to the absolute difference between actual values and the average of all actual values.
  • Relatieve kwadratische fout: Het gemiddelde aan kwadratische fouten ten opzichte van het kwadratische verschil tussen de werkelijke waarden en het gemiddelde van alle werkelijke waarden.Relative Squared Error: The average of squared errors relative to the squared difference between the actual values and the average of all actual values.
  • Determinatiecoëfficiënt: Deze statische meetwaarde, ook wel R²-waarde genoemd, geeft aan hoe goed het model is in het voorspellen van de gegevens.Coefficient of Determination: Also known as the R squared value, this statistical metric indicates how well a model fits the data.

Voor elk van de foutstatistieken geldt: hoe kleiner hoe beter.For each of the error statistics, smaller is better. Een lagere waarde geeft aan dat de voorspellingen dichter bij de daadwerkelijke waarden liggen.A smaller value indicates that the predictions are closer to the actual values. Hoe dichter de determinatiecoëfficiënt bij één (1,0) ligt, hoe beter de voorspellingen.For the coefficient of determination, the closer its value is to one (1.0), the better the predictions.

Resources opschonenClean up resources

Sla deze sectie over als u door wilt gaan met deel 2 van de zelfstudie Modellen implementeren.Skip this section if you want to continue on with part 2 of the tutorial, deploying models.

Belangrijk

U kunt de resources die u hebt gemaakt als vereisten voor andere Azure Machine Learning zelf studies en artikelen met instructies gebruiken.You can use the resources that you created as prerequisites for other Azure Machine Learning tutorials and how-to articles.

Alles verwijderenDelete everything

Als u niet van plan bent om iets te gebruiken dat u hebt gemaakt, verwijdert u de hele resource groep, zodat u geen kosten in rekening brengt.If you don't plan to use anything that you created, delete the entire resource group so you don't incur any charges.

  1. Selecteer in de Azure Portal resource groepen aan de linkerkant van het venster.In the Azure portal, select Resource groups on the left side of the window.

    Een resourcegroep verwijderen in de Azure-portal

  2. Selecteer in de lijst de resource groep die u hebt gemaakt.In the list, select the resource group that you created.

  3. Selecteer Resourcegroep verwijderen.Select Delete resource group.

Als u de resource groep verwijdert, worden ook alle resources die u in de ontwerp functie hebt gemaakt, verwijderd.Deleting the resource group also deletes all resources that you created in the designer.

Afzonderlijke assets verwijderenDelete individual assets

In de ontwerp functie waar u uw experiment hebt gemaakt, verwijdert u afzonderlijke assets door ze te selecteren en vervolgens de knop verwijderen te selecteren.In the designer where you created your experiment, delete individual assets by selecting them and then selecting the Delete button.

Het reken doel dat u hier hebt gemaakt, wordt automatisch geschaald naar nul knoop punten wanneer het niet wordt gebruikt.The compute target that you created here automatically autoscales to zero nodes when it's not being used. Deze actie wordt uitgevoerd om de kosten te minimaliseren.This action is taken to minimize charges.Als u het berekenings doel wilt verwijderen, voert u de volgende stappen uit: If you want to delete the compute target, take these steps:

Assets verwijderen

U kunt de registratie van gegevens sets opheffen vanuit uw werk ruimte door elke gegevensset te selecteren en registratie verwijderente selecteren.You can unregister datasets from your workspace by selecting each dataset and selecting Unregister.

Registratie van gegevensset opheffen

Als u een gegevensset wilt verwijderen, gaat u naar het opslag account met behulp van de Azure Portal of Azure Storage Explorer en verwijdert u deze activa hand matig.To delete a dataset, go to the storage account by using the Azure portal or Azure Storage Explorer and manually delete those assets.

Volgende stappenNext steps

In deel 2 leert u hoe u uw model kunt implementeren als een realtime-eindpunt.In part two, you'll learn how to deploy your model as a real-time endpoint.