Vad är Azure Machine Learning Designer?

Azure Machine Learning är ett dra och släpp-gränssnitt som används för att träna och distribuera modeller i Azure Machine Learning. I den här artikeln beskrivs de uppgifter som du kan utföra i designern.

Azure Machine Learning designerexempel

Designern använder din Azure Machine Learning för att organisera delade resurser, till exempel:

Modellträning och -distribution

Använd en visuell arbetsyta för att skapa ett arbetsflöde för maskininlärning från slutet till slut. Träna, testa och distribuera modeller i designern:

  • Dra och släpp datauppsättningar och komponenter på arbetsytan.
  • Anslut komponenterna för att skapa ett pipelineutkast.
  • Skicka en pipelinekörning med hjälp av beräkningsresurserna i din Azure Machine Learning arbetsyta.
  • Konvertera dina träningspipelines till härledningspipelines.
  • Publicera dina pipelines till en REST-pipelineslutpunkt för att skicka en ny pipeline som körs med olika parametrar och datauppsättningar.
    • Publicera en träningspipeline för att återanvända en enda pipeline för att träna flera modeller samtidigt som du ändrar parametrar och datauppsättningar.
    • Publicera en batch-härledningspipeline för att göra förutsägelser om nya data med hjälp av en tidigare tränad modell.
  1. Distribuera en inferenspipeline i realtid till en realtidsslutpunkt för att göra förutsägelser på nya data i realtid.

Arbetsflödesdiagram för träning, batch inferens och inferens i realtid i designern

Pipeline

En pipeline består av datauppsättningar och analyskomponenter som du ansluter. Pipelines har många användningsområden: du kan skapa en pipeline som tränar en enda modell eller en som tränar flera modeller. Du kan skapa en pipeline som gör förutsägelser i realtid eller i batch, eller skapa en pipeline som endast rensar data. Med pipelines kan du återanvända ditt arbete och organisera dina projekt.

Pipelineutkast

När du redigerar en pipeline i designern sparas förloppet som ett pipelineutkast. Du kan redigera ett pipelineutkast när som helst genom att lägga till eller ta bort komponenter, konfigurera beräkningsmål, skapa parametrar och så vidare.

En giltig pipeline har följande egenskaper:

  • Datauppsättningar kan bara ansluta till komponenter.
  • -komponenter kan bara ansluta till antingen datauppsättningar eller andra komponenter.
  • Alla indataportar för komponenter måste ha någon anslutning till dataflödet.
  • Alla obligatoriska parametrar för varje komponent måste anges.

När du är redo att köra pipelineutkastet skickar du en pipelinekörning.

Pipelinekörning

Varje gång du kör en pipeline lagras konfigurationen av pipelinen och dess resultat på din arbetsyta som en pipelinekörning. Du kan gå tillbaka till en pipelinekörning för att granska den för felsökning eller granskning. Klona en pipelinekörning för att skapa ett nytt pipelineutkast som du kan redigera.

Pipelinekörningar grupperas i experiment för att organisera körningshistoriken. Du kan ange experimentet för varje pipelinekörning.

Datauppsättningar

En datauppsättning för maskininlärning gör det enkelt att komma åt och arbeta med dina data. Flera exempeldatauppsättningar ingår i designern som du kan experimentera med. Du kan registrera fler datauppsättningar när du behöver dem.

Komponent

En komponent är en algoritm som du kan utföra på dina data. Designern har flera komponenter, från dataingressfunktioner till processer för träning, bedömning och validering.

En komponent kan ha en uppsättning parametrar som du kan använda för att konfigurera komponentens interna algoritmer. När du väljer en komponent på arbetsytan visas komponentens parametrar i fönstret Egenskaper till höger om arbetsytan. Du kan ändra parametrarna i det här fönstret för att finjustera din modell. Du kan ange beräkningsresurser för enskilda komponenter i designern.

Komponentegenskaper

Hjälp med att navigera i biblioteket med tillgängliga maskininlärningsalgoritmer finns i Översikt över & för algoritmkomponenter. Om du behöver hjälp med att välja en algoritm kan du Azure Machine Learning lathunden för algoritmen.

Beräkningsresurser

Använd beräkningsresurser från arbetsytan för att köra din pipeline och vara värd för dina distribuerade modeller som realtidsslutpunkter eller pipelineslutpunkter (för batchinferens). De beräkningsmål som stöds är:

Beräkningsmål Utbildning Distribution
Azure Machine Learning beräkning
Azure Kubernetes Service

Beräkningsmål är kopplade till din Azure Machine Learning arbetsyta. Du hanterar dina beräkningsmål på arbetsytan i Azure Machine Learning studio.

Distribuera

Om du vill utföra inferens i realtid måste du distribuera en pipeline som en realtidsslutpunkt. Realtidsslutpunkten skapar ett gränssnitt mellan ett externt program och din bedömningsmodell. Ett anrop till en realtidsslutpunkt returnerar förutsägelseresultat till programmet i realtid. Om du vill göra ett anrop till en realtidsslutpunkt skickar du API-nyckeln som skapades när du distribuerade slutpunkten. Slutpunkten baseras på REST, ett populärt arkitekturval för webbprogrammeringsprojekt.

Realtidsslutpunkter måste distribueras till ett Azure Kubernetes Service kluster.

Information om hur du distribuerar din modell finns i Självstudie: Distribuera en maskininlärningsmodell med designern.

Anteckning

Azure Machine Learning Slutpunkter (förhandsversion) ger en förbättrad och enklare distributionsupplevelse. Slutpunkter stöder både scenarier för realtids- och batchslutsatsledning. Slutpunkter tillhandahåller ett enhetligt gränssnitt för att anropa och hantera modelldistributioner mellan beräkningstyper. Se Vad är Azure Machine Learning slutpunkter (förhandsversion)?.

Publicera

Du kan också publicera en pipeline till en pipelineslutpunkt. På ett liknande sätt som med en realtidsslutpunkt kan du skicka nya pipelinekörningar från externa program med hjälp av REST-anrop med hjälp av en pipelineslutpunkt. Du kan dock inte skicka eller ta emot data i realtid med hjälp av en pipelineslutpunkt.

Publicerade pipelines är flexibla, de kan användas för att träna eller träna om modeller, utföra batch-inferens,bearbeta nya data och mycket mer. Du kan publicera flera pipelines till en enda pipelineslutpunkt och ange vilken pipelineversion som ska köras.

En publicerad pipeline körs på de beräkningsresurser som du definierar i pipelineutkastet för varje komponent.

Designern skapar samma PublishedPipeline-objekt som SDK:n.

Nästa steg