Machine Learning-träna

I den här artikeln beskrivs de moduler som beskrivs i Azure Machine Learning Studio (klassisk) för att träna en maskin inlärnings modell. Träning är en process för att analysera indata med hjälp av parametrarna i en fördefinierad modell. I den här analysen lär sig modellen mönstren och sparar dem i form av en tränad modell.

Anteckning

Gäller för: Machine Learning Studio (klassisk)

Det här innehållet gäller endast Studio (klassisk). Liknande dra och släpp-moduler har lagts till i Azure Machine Learning designer. Läs mer i den här artikeln om att jämföra de två versionerna.

Den här artikeln beskriver också den övergripande processen i Machine Learning Studio (klassisk) för skapande av modeller, utbildning, utvärdering och poängsättning.

Skapa och använda Machine Learning-modeller

Det vanligaste arbets flödet för Machine Learning omfattar följande faser:

  • Välja en lämplig algoritm och ange inledande alternativ.
  • Träna modellen på kompatibla data.
  • Skapa förutsägelser genom att använda nya data baserat på mönster i modellen.
  • Utvärdera modellen för att avgöra om förutsägelserna är korrekta, hur mycket fel det finns och om det finns någon överbyggnad.

Machine Learning Studio (klassisk) stöder ett flexibelt anpassningsbart ramverk för maskin inlärning. Varje aktivitet i den här processen utförs av en speciell typ av modul, som kan ändras, läggas till eller tas bort utan att resten av experimentet bryts.

Modulerna i den här kategorin stöder utbildning för olika typer av modeller. Under utbildningen analyseras data av Machine Learning-algoritmen. Den här algoritmen analyserar distribution och typ av data, kompilerar statistik och skapar mönster som kan användas senare för förutsägelse.

Mer om modell träning

När Machine Learning tränar en modell hoppas rader med värden som saknas över. Om du vill åtgärda värdena manuellt, använder du Imputation eller anger en annan metod för hantering av saknade värden använder du modulen Rensa data som saknas innan du tränar på data uppsättningen.

Vi rekommenderar att du använder modulen Redigera metadata för att åtgärda eventuella andra problem med data. Du kan behöva Markera etikett kolumnen, ändra data typerna eller rätt kolumn namn.

För andra vanliga data rensnings aktiviteter, till exempel normalisering, sampling, diskretisering och skalning, se kategorin data omvandling .

Välj den högra utbildaren

Vilken metod du använder för att träna en modell beror på vilken typ av modell du skapar och vilken typ av data som modellen kräver. Machine Learning innehåller till exempel moduler som är specifika för att utbilda avvikelse identifierings modeller, rekommendations modeller med mera.

Kontrol lera listan över träna moduler för att avgöra vilket som är korrekt för ditt scenario.

Om du inte är säker på de bästa parametrarna som ska användas när du tränar en modell, använder du en av modulerna som finns för parameter rensning och verifiering:

  • Om du finjusterar modellens egenskaper kan du utföra en parameter rensning på nästan alla klassificerings-och Regressions modeller. Det tränar flera modeller och returnerar sedan den bästa modellen.

  • Modulen rensning av kluster stöder modell justering under inlärnings processen och är avsedd att användas med kluster modeller. Du kan ange ett intervall med centroids och träna på data och automatiskt identifiera de bästa parametrarna.

  • Modell modulen för kors validering är också användbar för modell optimering, men returnerar ingen tränad modell. I stället tillhandahåller det mått som du kan använda för att fastställa den bästa modellen.

Omtrimningsmodeller

Om du behöver träna om en produktions modell kan du när som helst köra experimentet igen.

Du kan också automatisera återställnings processen med hjälp av webb tjänster. En genom gång finns i omträning och uppdatera Azure Machine Learning modeller med Azure Data Factory.

Använda förtränade modeller

Machine Learning innehåller vissa modeller som är förtränade, t. ex. den förtränade bild klassificerings modulen. Du kan använda dessa modeller för att lägga till poäng utan ytterligare data inmatning.

Vissa moduler (till exempel tids serie avvikelse identifiering) genererar inte heller en tränad modell i iLearner-formatet. Men de tar övnings data och skapar en modell internt, som sedan kan användas för att göra förutsägelser. Om du vill använda dessa konfigurerar du bara parametrarna och tillhandahåller data.

Spara en ögonblicks bild av en utbildad modell

Om du vill spara eller exportera modellen högerklickar du på modulen utbildning och väljer Spara som utbildad modell. Modellen exporteras till iLearner-formatet och sparas i din arbets yta, under utbildade modeller. Utbildade modeller kan återanvändas i andra experiment eller anslutas till andra moduler för att utvärdera.

Du kan också använda modulen load trained Model i ett experiment för att hämta en lagrad modell.

Lista över moduler

Kategorin träna innehåller följande moduler:

  • Rensnings kluster: utför en parameter rensning på en kluster modell för att fastställa de optimala parameter inställningarna och tågen den bästa modellen.
  • Träna avvikelse identifierings modell: tågen en avvikande detektor modell och etiketter data från en tränings uppsättning.
  • Träna kluster modell: tågen en kluster modell och tilldelar data från inlärnings uppsättningen till kluster.
  • Träna matchbox-rekommendation: tågen en Bayesian-rekommendation genom att använda matchbox-algoritmen.
  • Träna modell: tågen en klassificerings-eller Regressions modell från en tränings uppsättning.
  • Finjustera modellens egenskaper: utför en parameter rensning på en Regressions-eller klassificerings modell för att fastställa de optimala parameter inställningarna och tågen den bästa modellen.

Vissa moduler är inte i den här kategorin eftersom de kräver ett särskilt format eller är anpassade för en viss uppgift:

Se även