Skapa, granska och distribuera automatiserade maskin inlärnings modeller med Azure Machine LearningCreate, review, and deploy automated machine learning models with Azure Machine Learning

gäller för:  ingen Basic  -utgåva ja Enterprise Edition                         (Uppgradera till Enterprise)APPLIES TO: noBasic edition yesEnterprise edition                       (Upgrade to Enterprise)

I den här artikeln får du lära dig hur du skapar, utforskar och distribuerar automatiserade maskin inlärnings modeller utan en enda kodrad i Azure Machine Learning Studio.In this article, you learn how to create, explore, and deploy automated machine learning models without a single line of code in Azure Machine Learning studio.

Viktigt

Den automatiska ML-upplevelsen i Azure Machine Learning Studio är en för hands version.The automated ML experience in the Azure Machine learning studio is in preview. Vissa funktioner kanske inte stöds eller har begränsade funktioner.Certain features may not be supported or have limited capabilities.

Automatisk maskin inlärning är en process där den bästa Machine Learning-algoritmen som används för dina aktuella data väljs åt dig.Automated machine learning is a process in which the best machine learning algorithm to use for your specific data is selected for you. Med den här processen kan du snabbt skapa maskin inlärnings modeller.This process enables you to generate machine learning models quickly. Lär dig mer om automatisk maskin inlärning.Learn more about automated machine learning.

För ett slut punkt till slut punkts exempel kan du prova självstudien för att skapa en klassificerings modell med Azure Machine Learning s automatiserade ml-gränssnitt.For an end to end example, try the tutorial for creating a classification model with Azure Machine Learning's automated ML interface.

Konfigurera automatiserade maskin inlärnings experiment med Azure Machine Learning SDK för en python-kod baserad upplevelse.For a Python code-based experience, configure your automated machine learning experiments with the Azure Machine Learning SDK.

FörutsättningarPrerequisites

Kom igångGet started

  1. Logga in på Azure Machine Learning på https://ml.azure.com .Sign in to Azure Machine Learning at https://ml.azure.com.

  2. Välj din prenumeration och arbets yta.Select your subscription and workspace.

  3. Navigera till den vänstra rutan.Navigate to the left pane. Välj Automatisk ml under avsnittet författare .Select Automated ML under the Author section.

Navigerings fönstret i Azure Machine Learning StudioAzure Machine Learning studio navigation pane

Om det här är första gången du gör ett experiment visas en tom lista och länkar till dokumentationen.If this is your first time doing any experiments, you'll see an empty list and links to documentation.

Annars visas en lista över dina senaste automatiserade maskin inlärnings experiment, inklusive de som har skapats med SDK: n.Otherwise, you'll see a list of your recent automated machine learning experiments, including those created with the SDK.

Skapa och kör experimentCreate and run experiment

  1. Välj + ny automatiserad ml-körning och fyll i formuläret.Select + New automated ML run and populate the form.

  2. Välj en data uppsättning från din lagrings behållare eller skapa en ny data uppsättning.Select a dataset from your storage container, or create a new dataset. Data uppsättningar kan skapas från lokala filer, webb-URL: er, data lager eller Azure Open-datauppsättningar.Datasets can be created from local files, web urls, datastores, or Azure open datasets. Lär dig mer om att skapa data uppsättning.Learn more about dataset creation.

    Viktigt

    Krav för tränings data:Requirements for training data:

    • Data måste vara i tabell form.Data must be in tabular form.
    • Värdet som du vill förutse (mål kolumnen) måste finnas i data.The value you want to predict (target column) must be present in the data.
    1. Om du vill skapa en ny data uppsättning från en fil på den lokala datorn väljer du + skapa data uppsättning och väljer sedan från lokal fil.To create a new dataset from a file on your local computer, select +Create dataset and then select From local file.

    2. Ge din data uppsättning ett unikt namn och ge en valfri beskrivning i formuläret grundläggande information .In the Basic info form, give your dataset a unique name and provide an optional description.

    3. Välj Nästa för att öppna formuläret data lager och fil markering.Select Next to open the Datastore and file selection form. I det här formuläret väljer du var du vill ladda upp din data uppsättning. standard lagrings behållare som skapas automatiskt med din arbets yta eller Välj en lagrings behållare som du vill använda för experimentet.On this form you select where to upload your dataset; the default storage container that's automatically created with your workspace, or choose a storage container that you want to use for the experiment.

      1. Om dina data ligger bakom ett virtuellt nätverk måste du aktivera funktionen hoppa över verifiering för att se till att arbets ytan kan komma åt dina data.If your data is behind a virtual network, you need to enable the skip the validation function to ensure that the workspace can access your data. Lär dig mer om nätverks isolering och sekretess.Learn more about network isolation and privacy.
    4. Välj Bläddra för att ladda upp data filen för din data uppsättning.Select Browse to upload the data file for your dataset.

    5. Granska inställningarna och för hands versions formuläret för noggrannhet.Review the Settings and preview form for accuracy. Formuläret fylls i intelligent baserat på filtypen.The form is intelligently populated based on the file type.

      FältField BeskrivningDescription
      FilformatFile format Definierar layout och typ av data som lagras i en fil.Defines the layout and type of data stored in a file.
      AvgränsareDelimiter Ett eller flera tecken för att ange avgränsningen mellan separata, oberoende regioner i oformaterad text eller andra data strömmar.One or more characters for specifying the boundary between separate, independent regions in plain text or other data streams.
      KodningEncoding Identifierar vilken bit till Character-schema tabell som ska användas för att läsa din data uppsättning.Identifies what bit to character schema table to use to read your dataset.
      KolumnrubrikerColumn headers Anger hur data uppsättningens huvuden, om det finns, kommer att behandlas.Indicates how the headers of the dataset, if any, will be treated.
      Hoppa över raderSkip rows Anger hur många rader som ska hoppas över i data uppsättningen.Indicates how many, if any, rows are skipped in the dataset.

      Välj Nästa.Select Next.

    6. Schema formuläret fylls i intelligent utifrån valen i formuläret Inställningar och för hands version .The Schema form is intelligently populated based on the selections in the Settings and preview form. Konfigurera data typen för varje kolumn, granska kolumn namnen och välj vilka kolumner som inte ska ingå i experimentet.Here configure the data type for each column, review the column names, and select which columns to Not include for your experiment.

      Välj Nästa.Select Next.

    7. Formuläret bekräfta information är en sammanfattning av den information som tidigare har fyllts i i grundläggande information och Inställningar och för hands formulär.The Confirm details form is a summary of the information previously populated in the Basic info and Settings and preview forms. Du kan också välja att skapa en data profil för din data uppsättning med en profilerings aktive rad beräkning.You also have the option to create a data profile for your dataset using a profiling enabled compute. Läs mer om data profilering.Learn more about data profiling.

      Välj Nästa.Select Next.

  3. Välj den nyligen skapade data uppsättningen när den visas.Select your newly created dataset once it appears. Du kan också visa en förhands granskning av data uppsättningen och exempel statistiken.You are also able to view a preview of the dataset and sample statistics.

  4. I formuläret Konfigurera körning anger du ett unikt experiment namn.On the Configure run form, enter a unique experiment name.

  5. Välj en mål kolumn. Det här är den kolumn som du vill göra förutsägelser på.Select a target column; this is the column that you would like to do predictions on.

  6. Välj en beräkning för data profilering och utbildnings jobb.Select a compute for the data profiling and training job. Det finns en lista över dina befintliga beräkningar i list rutan.A list of your existing computes is available in the dropdown. Följ instruktionerna i steg 7 för att skapa en ny beräkning.To create a new compute, follow the instructions in step 7.

  7. Välj skapa en ny beräkning för att konfigurera din beräknings kontext för det här experimentet.Select Create a new compute to configure your compute context for this experiment.

    FältField BeskrivningDescription
    Compute-namnCompute name Ange ett unikt namn som identifierar din beräknings kontext.Enter a unique name that identifies your compute context.
    Prioritet för virtuell datorVirtual machine priority Virtuella datorer med låg prioritet är billigare men garanterar inte Compute-noderna.Low priority virtual machines are cheaper but don't guarantee the compute nodes.
    Typ av virtuell datorVirtual machine type Välj CPU eller GPU för typ av virtuell dator.Select CPU or GPU for virtual machine type.
    Storlek för virtuell datorVirtual machine size Välj storlek på den virtuella datorn för din beräkning.Select the virtual machine size for your compute.
    Min/högsta antal noderMin / Max nodes Du måste ange 1 eller fler noder för att kunna profilera data.To profile data, you must specify 1 or more nodes. Ange det maximala antalet noder för din beräkning.Enter the maximum number of nodes for your compute. Standardvärdet är 6 noder för en AML-beräkning.The default is 6 nodes for an AML Compute.
    Avancerade inställningarAdvanced settings Med de här inställningarna kan du konfigurera ett användar konto och ett befintligt virtuellt nätverk för experimentet.These settings allow you to configure a user account and existing virtual network for your experiment.

    Välj Skapa.Select Create. Det kan ta några minuter att skapa en ny beräkning.Creation of a new compute can take a few minutes.

    Anteckning

    Ditt beräknings namn anger om den beräkning som du väljer/skapar profilering är aktive rad.Your compute name will indicate if the compute you select/create is profiling enabled. (Mer information finns i avsnittet om avsnitts data profilering ).(See the section data profiling for more details).

    Välj Nästa.Select Next.

  8. I formuläret uppgifts typ och inställningar väljer du uppgifts typ: klassificering, regression eller Prognosticering.On the Task type and settings form, select the task type: classification, regression, or forecasting. Mer information finns i aktivitets typer som stöds .See supported task types for more information.

    1. För klassificeringkan du också aktivera djup inlärning som används för text featurizations.For classification, you can also enable deep learning which is used for text featurizations.

    2. För prognoser kan duFor forecasting you can,

      1. Aktivera djup inlärningEnable deep learning

      2. Välj tids kolumn: den här kolumnen innehåller de tids data som ska användas.Select time column: This column contains the time data to be used.

      3. Välj prognos Horisont: Ange hur många tidsenheter (minuter/timmar/dagar/veckor/månader/år) som modellen ska kunna förutsäga till framtiden.Select forecast horizon: Indicate how many time units (minutes/hours/days/weeks/months/years) will the model be able to predict to the future. Den ytterligare modellen krävs för att förutsäga i framtiden. den mindre exakta den blir.The further the model is required to predict into the future, the less accurate it will become. Lär dig mer om prognostisering av prognoser och prognoser.Learn more about forecasting and forecast horizon.

  9. Valfritt Visa ytterligare konfigurations inställningar: ytterligare inställningar som du kan använda för att styra utbildnings jobbet bättre.(Optional) View addition configuration settings: additional settings you can use to better control the training job. Annars tillämpas standardvärdena utifrån experiment val och data.Otherwise, defaults are applied based on experiment selection and data.

    Ytterligare konfigurationerAdditional configurations BeskrivningDescription
    Primärt måttPrimary metric Främsta mått som används för att värdera din modell.Main metric used for scoring your model. Lär dig mer om modell mått.Learn more about model metrics.
    Förklara bästa modellExplain best model Välj om du vill aktivera eller inaktivera, för att visa att den rekommenderade bästa modellen är förklarad.Select to enable or disable, in order to show explainability of the recommended best model.
    Blockerad algoritmBlocked algorithm Välj algoritmer som du vill undanta från utbildnings jobbet.Select algorithms you want to exclude from the training job.
    Avslutnings kriteriumExit criterion När något av dessa villkor uppfylls stoppas utbildnings jobbet.When any of these criteria are met, the training job is stopped.
    Utbildnings jobb tid (timmar): hur lång tid det tar att köra utbildnings jobbet.Training job time (hours): How long to allow the training job to run.
    Mätvärdes tröskel: minsta mått Poäng för alla pipeliner.Metric score threshold: Minimum metric score for all pipelines. Detta säkerställer att om du har ett definierat målmått som du vill nå, ägnar du inte mer tid åt övnings jobbet än nödvändigt.This ensures that if you have a defined target metric you want to reach, you do not spend more time on the training job than necessary.
    ValideringValidation Välj ett av de kors validerings alternativ som ska användas i övnings jobbet.Select one of the cross validation options to use in the training job. Läs mer om kors validering.Learn more about cross validation.
    SamtidighetConcurrency Max. antal samtidiga iterationer: maximalt antal pipelines (iterationer) som ska testas i utbildnings jobbet.Max concurrent iterations: Maximum number of pipelines (iterations) to test in the training job. Jobbet kan inte köra fler än det angivna antalet iterationer.The job will not run more than the specified number of iterations.
  10. Valfritt Visa funktionalisering-inställningar: om du väljer att aktivera Automatisk funktionalisering i formuläret för ytterligare konfigurations inställningar tillämpas standard funktionalisering-teknikerna.(Optional) View featurization settings: if you choose to enable Automatic featurization in the Additional configuration settings form, default featurization techniques are applied. I Visa funktionalisering-inställningar kan du ändra dessa standardvärden och anpassa dem efter behov.In the View featurization settings you can change these defaults and customize accordingly. Lär dig hur du anpassar featurizations.Learn how to customize featurizations.

    Aktivitets typ formulär för Azure Machine Learning Studio

Data profilering & sammanfattnings statistikData profiling & summary stats

Du kan få en mängd olika sammanfattnings statistik över din data uppsättning för att kontrol lera om din data uppsättning är ML-redo.You can get a vast variety of summary statistics across your data set to verify whether your data set is ML-ready. För icke-numeriska kolumner innehåller de bara grundläggande statistik som min, max och antal fel.For non-numeric columns, they include only basic statistics like min, max, and error count. För numeriska kolumner kan du också granska deras statistiska moment och uppskatta quantiles.For numeric columns, you can also review their statistical moments and estimated quantiles. Mer specifikt innehåller vår data profil:Specifically, our data profile includes:

Anteckning

Tomma poster visas för funktioner med irrelevanta typer.Blank entries appear for features with irrelevant types.

StatistikStatistic BeskrivningDescription
FunktionFeature Namn på den kolumn som sammanfattas.Name of the column that is being summarized.
ProfilProfile Infogad visualisering baserat på den härledda typen.In-line visualization based on the type inferred. Strängar, booleska värden och datum har till exempel värde antal, medan decimaler (numeriska värden) har ungefärligt histogram.For example, strings, booleans, and dates will have value counts, while decimals (numerics) have approximated histograms. På så sätt får du en snabb förståelse för data fördelningen.This allows you to gain a quick understanding of the distribution of the data.
Typ distributionType distribution Antal värden i en kolumn.In-line value count of types within a column. Nullvärden är deras egna typ, så den här visualiseringen är användbar för att identifiera udda eller saknade värden.Nulls are their own type, so this visualization is useful for detecting odd or missing values.
TypType Den härledda typen för kolumnen.Inferred type of the column. Möjliga värden är: strängar, booleska värden, datum och decimaler.Possible values include: strings, booleans, dates, and decimals.
MinMin Minsta värde för kolumnen.Minimum value of the column. Tomma poster visas för funktioner vars typ inte har en inbyggd ordning (t. ex. booleska värden).Blank entries appear for features whose type does not have an inherent ordering (e.g. booleans).
MaxMax Max värde för kolumnen.Maximum value of the column.
CountCount Totalt antal saknade och icke-saknade poster i kolumnen.Total number of missing and non-missing entries in the column.
Antal saknas inteNot missing count Antal poster i kolumnen som inte saknas.Number of entries in the column that are not missing. Tomma strängar och fel behandlas som värden, så de kommer inte att bidra till det antal som saknas.Empty strings and errors are treated as values, so they will not contribute to the "not missing count."
KvantilerQuantiles Ungefärligt värde vid varje quantile för att ge en uppfattning om data fördelningen.Approximated values at each quantile to provide a sense of the distribution of the data.
MedelvärdeMean Aritmetiskt medelvärde eller genomsnitt för kolumnen.Arithmetic mean or average of the column.
StandardavvikelseStandard deviation Mått på mängden spridning eller variation för den här kolumnens data.Measure of the amount of dispersion or variation of this column's data.
VariansVariance Mått på hur långt spridning av den här kolumnens data är från det genomsnittliga värdet.Measure of how far spread out this column's data is from its average value.
SnedhetSkewness Mått på hur olika data från den här kolumnen kommer från en normal distribution.Measure of how different this column's data is from a normal distribution.
ToppighetKurtosis Mått på hur mycket data som har staplats i den här kolumnens data jämförs med en normal distribution.Measure of how heavily tailed this column's data is compared to a normal distribution.

Anpassa funktionaliseringCustomize featurization

I formuläret funktionalisering kan du aktivera/inaktivera automatisk funktionalisering och anpassa inställningarna för automatisk funktionalisering för ditt experiment.In the Featurization form, you can enable/disable automatic featurization and customize the automatic featurization settings for your experiment. För att öppna det här formuläret, se steg 10 i avsnittet skapa och köra experiment .To open this form, see step 10 in the Create and run experiment section.

I följande tabell sammanfattas de anpassningar som för närvarande är tillgängliga via Studio.The following table summarizes the customizations currently available via the studio.

KolumnColumn AnpassningCustomization
IngårIncluded Anger vilka kolumner som ska ingå i utbildningen.Specifies which columns to include for training.
Funktions typFeature type Ändra värde typen för den markerade kolumnen.Change the value type for the selected column.
Räkna medImpute with Välj det värde som du vill använda för att ange värden för saknade värden i dina data.Select what value to impute missing values with in your data.

Aktivitets typ formulär för Azure Machine Learning Studio

Kör experimentet och visa resultatenRun experiment and view results

Klicka på Slutför för att köra experimentet.Select Finish to run your experiment. Experimentförberedelserna kan ta upp till 10 minuter.The experiment preparing process can take up to 10 minutes. För träningsjobb kan det ta ytterligare 2–3 minuter för varje pipeline att slutföra körningen.Training jobs can take an additional 2-3 minutes more for each pipeline to finish running.

Visa experimentinformationView experiment details

Skärmen körnings information öppnas på fliken information . Den här skärmen visar en sammanfattning av experiment körningen inklusive ett statusfält överst bredvid körnings numret.The Run Detail screen opens to the Details tab. This screen shows you a summary of the experiment run including a status bar at the top next to the run number.

Fliken Modeller innehåller en lista över de modeller som skapats ordnade efter måttpoängen.The Models tab contains a list of the models created ordered by the metric score. Som standard visas modellen med högst poäng utifrån det valda måttet överst i listan.By default, the model that scores the highest based on the chosen metric is at the top of the list. När träningsjobbet testar fler modeller läggs de till i listan.As the training job tries out more models, they are added to the list. Använd det här för att få en snabb jämförelse av måtten för de modeller som har producerats hittills.Use this to get a quick comparison of the metrics for the models produced so far.

Körnings informations instrument panelRun details dashboard

Visa information om tränings körningarView training run details

Öka detalj nivån för alla färdiga modeller för att se information om utbildning, t. ex. en modell sammanfattning på fliken modell eller diagram över prestanda mått på fliken mått . Läs mer om diagram.Drill down on any of the completed models to see training run details, like a model summary on the Model tab or performance metric charts on the Metrics tab. Learn more about charts.

Upprepnings informationIteration details

Distribuera din modellDeploy your model

När du har den bästa modellen till hands är det dags att distribuera den som en webb tjänst för att förutse nya data.Once you have the best model at hand, it is time to deploy it as a web service to predict on new data.

Med automatisk ML får du hjälp med att distribuera modellen utan att skriva kod:Automated ML helps you with deploying the model without writing code:

  1. Du har ett par alternativ för distribution.You have a couple options for deployment.

    • Alternativ 1: distribuera den bästa modellen enligt de mått kriterier som du har definierat.Option 1: Deploy the best model, according to the metric criteria you defined.

      1. När experimentet är klart navigerar du till den överordnade körnings sidan genom att välja Kör 1 överst på skärmen.After the experiment is complete, navigate to the parent run page by selecting Run 1 at the top of the screen.
      2. Välj den modell som visas i avsnittet bästa modell Sammanfattning .Select the model listed in the Best model summary section.
      3. Välj distribuera längst upp till vänster i fönstret.Select Deploy on the top left of the window.
    • Alternativ 2: om du vill distribuera en speciell modell iteration från det här experimentet.Option 2: To deploy a specific model iteration from this experiment.

      1. Välj önskad modell på fliken modellerSelect the desired model from the Models tab
      2. Välj distribuera längst upp till vänster i fönstret.Select Deploy on the top left of the window.
  2. Fyll i fönstret distribuera modell .Populate the Deploy model pane.

    FältField VärdeValue
    NamnName Ange ett unikt namn för din distribution.Enter a unique name for your deployment.
    BeskrivningDescription Ange en beskrivning för att bättre identifiera vad den här distributionen är för.Enter a description to better identify what this deployment is for.
    Compute-typCompute type Välj den typ av slut punkt som du vill distribuera: Azure Kubernetes service (AKS) eller Azure Container Instance (ACI).Select the type of endpoint you want to deploy: Azure Kubernetes Service (AKS) or Azure Container Instance (ACI).
    Compute-namnCompute name Gäller endast för AKS: Välj namnet på det AKS-kluster som du vill distribuera till.Applies to AKS only: Select the name of the AKS cluster you wish to deploy to.
    Aktivera autentiseringEnable authentication Välj för att tillåta tokenbaserad eller nyckelbaserad autentisering.Select to allow for token-based or key-based authentication.
    Använda anpassade distributions till gångarUse custom deployment assets Aktivera den här funktionen om du vill överföra ditt eget bedömnings skript och miljö fil.Enable this feature if you want to upload your own scoring script and environment file. Lär dig mer om bedömnings skript.Learn more about scoring scripts.

    Viktigt

    Fil namn måste vara under 32 tecken och måste börja och sluta med alfanumeriska tecken.File names must be under 32 characters and must begin and end with alphanumerics. Får innehålla bindestreck, under streck, punkter och alfanumeriska tecken mellan.May include dashes, underscores, dots, and alphanumerics between. Blank steg är inte tillåtna.Spaces are not allowed.

    Menyn Avancerat erbjuder standard distributions funktioner, till exempel inställningar för data insamling och resursutnyttjande.The Advanced menu offers default deployment features such as data collection and resource utilization settings. Om du vill åsidosätta dessa standardinställningar gör du det på den här menyn.If you wish to override these defaults do so in this menu.

  3. Välj Distribuera.Select Deploy. Distributionen kan ta ungefär 20 minuter att slutföra.Deployment can take about 20 minutes to complete. När distributionen har påbörjats visas fliken modell Sammanfattning .Once deployment begins, the Model summary tab appears. Se distributions förloppet i avsnittet distributions status .See the deployment progress under the Deploy status section.

Nu har du en fungerande webb tjänst för att generera förutsägelser!Now you have an operational web service to generate predictions! Du kan testa förutsägelserna genom att fråga tjänsten från Power BI inbyggda Azure Machine Learning-supporten.You can test the predictions by querying the service from Power BI's built in Azure Machine Learning support.

Nästa stegNext steps