Machine Learning – Träna

Viktigt

Stödet för Machine Learning Studio (klassisk) upphör den 31 augusti 2024. Vi rekommenderar att du byter till Azure Machine Learning innan dess.

Från och med den 1 december 2021 kan du inte längre skapa nya Machine Learning Studio-resurser (klassisk). Du kan fortsätta att använda befintliga Machine Learning Studio-resurser (klassisk) till och med den 31 augusti 2024.

Dokumentationen om ML Studio (klassisk) håller på att dras tillbaka och kanske inte uppdateras i framtiden.

I den här artikeln beskrivs de moduler som finns i Machine Learning Studio (klassisk) för träning av en maskininlärningsmodell. Träning är en process för att analysera indata med hjälp av parametrarna för en fördefinierad modell. Från den här analysen lär sig modellen mönstren och sparar dem i form av en tränad modell.

Anteckning

Gäller endast för: Machine Learning Studio (klassisk)

Liknande dra och släpp-moduler är tillgängliga i Azure Machine Learning designer.

Den här artikeln beskriver också den övergripande processen i Machine Learning Studio (klassisk) för modellskapande, träning, utvärdering och bedömning.

Skapa och använda maskininlärningsmodeller

Det typiska arbetsflödet för maskininlärning omfattar följande faser:

  • Välja en lämplig algoritm och ange inledande alternativ.
  • Träna modellen på kompatibla data.
  • Skapa förutsägelser med hjälp av nya data, baserat på modellens mönster.
  • Utvärdera modellen för att avgöra om förutsägelserna är korrekta, hur många fel det finns och om det finns någon överanpassad.

Machine Learning Studio (klassisk) stöder ett flexibelt, anpassningsbart ramverk för maskininlärning. Varje uppgift i den här processen utförs av en viss typ av modul, som kan ändras, läggas till eller tas bort, utan att resten av experimentet bryts.

Modulerna i den här kategorin stöder träning för olika typer av modeller. Under träningen analyseras data av maskininlärningsalgoritmen. Den här algoritmen analyserar distributionen och typen av data, kompilerar statistik och skapar mönster som kan användas senare för förutsägelse.

Mer om modellträning

När Machine Learning tränar en modell hoppas rader med saknade värden över. Om du vill åtgärda värdena manuellt, använda imputering eller ange en annan metod för att hantera saknade värden använder du därför modulen Rensa data som saknas innan du tränar på datauppsättningen.

Vi rekommenderar att du använder modulen Redigera metadata för att åtgärda andra problem med data. Du kan behöva markera etikettkolumnen, ändra datatyper eller korrigera kolumnnamn.

Andra vanliga datarensningsuppgifter, till exempel normalisering, sampling, datalagring och skalning, finns i kategorin Datatransformering .

Välj rätt utbildare

Vilken metod du använder för att träna en modell beror på vilken typ av modell du skapar och vilken typ av data som modellen kräver. Till exempel innehåller Machine Learning moduler specifikt för träning av modeller för avvikelseidentifiering, rekommendationsmodeller med mera.

Kontrollera listan över träningsmoduler för att avgöra vilken som är korrekt för ditt scenario.

Om du inte är säker på vilka parametrar som är bäst att använda när du tränar en modell använder du någon av modulerna som tillhandahålls för parametersökning och validering:

  • Hyperparametrar för finjusteringsmodeller kan utföra en parametersökning på nästan alla klassificerings- och regressionsmodeller. Den tränar flera modeller och returnerar sedan den bästa modellen.

  • Modulen Rensa kluster stöder modelljustering under träningsprocessen och är endast avsedd att användas med klustringsmodeller. Du kan ange ett intervall med centroider och träna på data samtidigt som du automatiskt identifierar de bästa parametrarna.

  • Modulen Kors validera modell är också användbar för modelloptimering, men returnerar inte en tränad modell. I stället innehåller den mått som du kan använda för att fastställa den bästa modellen.

Omtrimningsmodeller

Om du behöver träna om en produktionsmodell kan du köra experimentet när som helst.

Du kan också automatisera omträningsprocessen med hjälp av webbtjänster. En genomgång finns i Träna om och uppdatera Machine Learning med Azure Data Factory.

Använda förtränade modeller

Machine Learning innehåller vissa modeller som tränas i förväg, till exempel modulen Pretrained Cascade Image Classification. Du kan använda dessa modeller för bedömning utan ytterligare indata.

Dessutom genererar inte vissa moduler (till exempel avvikelseidentifiering i tidsserier) en tränad modell i iLearner-format. Men de tar träningsdata och skapar en modell internt, som sedan kan användas för att göra förutsägelser. Om du vill använda dessa konfigurerar du bara parametrarna och anger data.

Spara en ögonblicksbild av en tränad modell

Om du vill spara eller exportera modellen högerklickar du på träningsmodulen och väljer Spara som tränad modell. Modellen exporteras till formatet iLearner och sparas på din arbetsyta under Tränade modeller. Tränade modeller kan åter användas i andra experiment eller anslutas till andra moduler för bedömning.

Du kan också använda modulen Load Trained Model (Läs in tränad modell) i ett experiment för att hämta en lagrad modell.

Lista över moduler

Kategorin Träna innehåller följande moduler:

  • Rensa kluster: Utför en parametersökning på en klustringsmodell för att fastställa optimala parameterinställningar och träna den bästa modellen.
  • Träna avvikelseidentifieringsmodell: Tränar en avvikelseidentifieringsmodell och etiketterar data från en träningsuppsättning.
  • Träna klustringsmodell: Tränar en klustringsmodell och tilldelar data från träningsuppsättningen till kluster.
  • Träna Matchbox Recommender: Tränar en Bayesian-rekommenderare med hjälp av Matchbox-algoritmen.
  • Träningsmodell: Tränar en klassificerings- eller regressionsmodell från en träningsuppsättning.
  • Hyperparametrar för finjusteringsmodell: Utför en parametersökning på en regressions- eller klassificeringsmodell för att fastställa optimala parameterinställningar och träna den bästa modellen.

Vissa moduler är inte i den här kategorin eftersom de kräver ett särskilt format eller är anpassade för en viss uppgift:

Se även