Träningsmodell

Träna en klassificerings- eller regressionsmodell på ett övervakat sätt

Kategori: Machine Learning/träna

Anteckning

Gäller för: Machine Learning Studio (klassisk)

Det här innehållet gäller endast Studio (klassisk). Liknande dra och släpp-moduler har lagts till i Azure Machine Learning designer. Läs mer i den här artikeln om att jämföra de två versionerna.

Modulöversikt

I den här artikeln beskrivs hur du använder modulen Träna modell i Azure Machine Learning Studio (klassisk) för att träna en klassificerings- eller regressionsmodell. Träningen sker när du har definierat en modell och angett dess parametrar och kräver taggade data. Du kan också använda Träningsmodell för att träna om en befintlig modell med nya data.

Så här fungerar träningsprocessen

I Azure Machine Learning är det vanligtvis en trestegsprocess att skapa och använda en maskininlärningsmodell.

  1. Du konfigurerar en modell genom att välja en viss typ av algoritm och definiera dess parametrar eller hyperparametrar. Välj någon av följande modelltyper:

    • Klassificeringsmodeller,baserade på neurala nätverk, beslutsträd, beslutsskogar och andra algoritmer.
    • Regressionsmodeller, som kan innehålla linjär standard regression eller som använder andra algoritmer, inklusive neurala nätverk och Baysian-regression.
  2. Ange en datauppsättning som är märkt och har data som är kompatibla med algoritmen. Anslut både data och modellen till Train Model ( Träna modell).

    Det som träningen producerar är ett specifikt binärt format, iLearner, som kapslar in de statistiska mönster som har lärts in från data. Du kan inte ändra eller läsa det här formatet direkt. Andra moduler i Studio (klassisk) kan dock använda den här tränade modellen.

    Du kan också visa modellens egenskaper. Mer information finns i avsnittet Resultat.

  3. När träningen är klar använder du den tränade modellen med en av bedömningsmodulernaför att göra förutsägelser om nya data.

Anteckning

Andra specialiserade maskininlärningsuppgifter kräver olika utbildningsmetoder, och Studio (klassisk) tillhandahåller separata utbildningsmoduler för dem. Bildidentifiering, klustring och avvikelseavkänning använder till exempel anpassade träningsmetoder. Train Model är endast avsett att användas med regressions- och klassificeringsmodeller.

Övervakad och oövervakad träning

Du kanske har hört termerna övervakad eller oövervakad inlärning. Att träna en klassificerings- eller regressionsmodell med Träningsmodell är ett klassiskt exempel på övervakad maskininlärning. Det innebär att du måste ange en datauppsättning som innehåller historiska data som du kan lära dig mönster från. Data bör innehålla både det resultat (etikett) som du försöker förutsäga och relaterade faktorer (variabler). Maskininlärningsmodellen behöver resultaten för att fastställa de funktioner som bäst förutsäger resultatet.

Under träningsprocessen sorteras data efter resultat och algoritmen extraherar statistiska mönster för att skapa modellen.

Oövervakad inlärning anger antingen att resultatet är okänt eller att du väljer att inte använda kända etiketter. Klustringsalgoritmer använder till exempel vanligtvis oövervakade inlärningsmetoder, men kan använda etiketter om det är tillgängligt. Ett annat exempel är ämnesmodellering med LDA. Du kan inte använda Träna modell med dessa algoritmer.

Tips

Är maskininlärning nytt för dig? Den här självstudien visar hur du hämtar data, konfigurerar en algoritm, tränar och sedan använder en modell: Skapa ditt första maskininlärningsexperiment

Så här använder du en tränad modell

  1. I Azure Machine Learning Studio (klassisk) konfigurerar du en klassificeringsmodell eller regressionsmodellmodeller.

    Du kan också träna en anpassad modell som skapats med hjälp av Skapa R-modell.

  2. Lägg till modulen Träna modell i experimentet. Du hittar den här modulen under Machine Learning kategori. Expandera Träna och dra sedan modulen Train Model (Träna modell) till experimentet.

  3. Till vänster indata kopplar du det ej tränade läget. Koppla träningsdatamängden till höger indata för Träningsmodell.

    Datamängden för träning måste innehålla en etikettkolumn. Alla rader utan etiketter ignoreras.

  4. För Kolumnen Etikett klickar du på Starta kolumnväljaren och väljer en enda kolumn som innehåller resultat som modellen kan använda för träning.

    • För klassificeringsproblem måste etikettkolumnen innehålla antingen kategoriska värden eller diskreta värden. Några exempel kan vara ett ja-/nej-omdöme, en kod för sjukdomsklassificering, ett namn eller en inkomstgrupp. Om du väljer en icke-kategorisk kolumn returnerar modulen ett fel under träningen.

    • För regressionsproblem måste etikettkolumnen innehålla numeriska data som representerar svarsvariabeln. Helst representerar numeriska data en kontinuerlig skala.

    Exempel kan vara en kreditriskpoäng, den prognostiserade feltiden för en hårddisk eller det prognostiserade antalet anrop till ett callcenter en viss dag eller tid. Om du inte väljer en numerisk kolumn kan du få ett felmeddelande.

    • Om du inte anger vilken etikettkolumn som ska användas Azure Machine Learning försöka dra slutsatsen vilken som är lämplig etikettkolumn med hjälp av datauppsättningens metadata. Om den väljer fel kolumn använder du kolumnväljaren för att korrigera den.

    Tips

    Om du har problem med att använda kolumnväljaren kan du läsa artikeln Välj kolumner i datauppsättning för tips. Den beskriver några vanliga scenarier och tips för att använda alternativen MED REGLER och EFTER NAMN.

  5. Kör experimentet. Om du har mycket data kan det ta en stund.

Resultat

När modellen har tränats:

  • Om du vill visa modellparametrarna och funktionsvikterna högerklickar du på utdata och väljer Visualisera.

  • Om du vill använda modellen i andra experiment högerklickar du på modellen och väljer Spara modell. Ange ett namn för modellen.

    Detta sparar modellen som en ögonblicksbild som inte uppdateras av upprepade körningar av experimentet.

  • Om du vill använda modellen för att förutsäga nya värden ansluter du den till modulen Score Model (Poängmodell) tillsammans med nya indata.

Om du behöver träna en typ av modell som inte stöds av Träna modell finns det flera alternativ:

  • Skapa en anpassad bedömningsmetod med hjälp av R-skript eller använd ett av de många tillgängliga R-bedömningspaketen.

  • Skriv ditt eget Python-skript för att träna och poängsa en modell, eller använd ett befintligt Python-bibliotek:

  • Avvikelseidentifieringsmodeller

  • Rekommendationsmodeller

    • Om din modell använder den Matchbox-rekommendation som Azure Machine Learning använder du modulen Train Matchbox Recommender (Träna Matchbox-rekommenderare).

    • Om du använder en annan algoritm för varukorgsanalys eller rekommendation använder du dess träningsmetoder i R-skript eller Python-skript.

  • Klustringsmodeller

Exempel

Exempel på hur modulen Träna modell används i maskininlärningsexperiment finns i dessa experiment i Azure AI Gallery:

Förväntade indata

Namn Typ Description
Ej tränad modell ILearner-gränssnitt Ej tränad utbildning
Datamängd Datatabell Träningsdata

Modulparametrar

Name Intervall Typ Standardvärde Description
Etikettkolumn valfri ColumnSelection Välj den kolumn som innehåller etikett- eller utfallskolumnen

Utdata

Namn Typ Description
Tränad modell ILearner-gränssnitt Tränad lärare

Undantag

En lista över alla modulfel finns i Felkoder för moduler.

Undantag Description
Fel 0032 Undantaget inträffar om argumentet inte är ett tal.
Fel 0033 Undantaget inträffar om argumentet är Oändlighet.
Fel 0083 Undantaget inträffar om datauppsättningen som används för träning inte kan användas för konkret typ av utbildning.
Fel 0035 Undantaget inträffar om inga funktioner har angetts för en viss användare eller ett visst objekt.
Fel 0003 Undantag inträffar om en eller flera indata är null eller tomma.
Fel 0020 Undantaget inträffar om antalet kolumner i vissa datauppsättningar som skickas till modulen är för litet.
Fel 0021 Undantaget inträffar om antalet rader i vissa datauppsättningar som skickas till modulen är för litet.
Fel 0013 Undantaget inträffar om det skickas till modul learner har en ogiltig typ.

Se även

Utvärdera modell
A-Z-modullista