Komponent för logistisk regression med flera klasser

I den här artikeln beskrivs en komponent i Azure Machine Learning-designern.

Använd den här komponenten för att skapa en logistisk regressionsmodell som kan användas för att förutsäga flera värden.

Klassificering med logistisk regression är en övervakad inlärningsmetod och kräver därför en märkt datauppsättning. Du tränar modellen genom att ange modellen och den märkta datauppsättningen som indata till en komponent, till exempel Träningsmodell. Den tränade modellen kan sedan användas för att förutsäga värden för nya indataexempel.

Azure Machine Learning tillhandahåller också en komponent för logistisk regression i två klasser , som passar för klassificering av binära eller dikottomösa variabler.

Om logistisk regression med flera klasser

Logistisk regression är en välkänd metod i statistik som används för att förutsäga sannolikheten för ett utfall och är populär för klassificeringsuppgifter. Algoritmen förutsäger sannolikheten för förekomst av en händelse genom att anpassa data till en logistisk funktion.

I logistisk regression med flera klasser kan klassificeraren användas för att förutsäga flera utfall.

Konfigurera en logistisk regression med flera klasser

  1. Lägg till komponenten Multiclass Logistic Regression i pipelinen.

  2. Ange hur du vill att modellen ska tränas genom att ange alternativet Skapa träningsläge .

    • Enkel parameter: Använd det här alternativet om du vet hur du vill konfigurera modellen och ange en specifik uppsättning värden som argument.

    • Parameterintervall: Välj det här alternativet om du inte är säker på de bästa parametrarna och vill köra en parameterrensning. Välj ett värdeintervall att iterera över, så itererar Tune Model Hyperparameters över alla möjliga kombinationer av de inställningar som du angav för att fastställa de hyperparametrar som ger optimala resultat.

  3. Optimeringstolerans, ange tröskelvärdet för optimeringskonvergens. Om förbättringen mellan iterationer är mindre än tröskelvärdet stoppas algoritmen och returnerar den aktuella modellen.

  4. L1 regulariseringsvikt, L2-regulariseringsvikt: Ange ett värde som ska användas för regulariseringsparametrarna L1 och L2. Ett värde som inte är noll rekommenderas för båda.

    Regularisering är en metod för att förhindra överanpassning genom att straffa modeller med extrema koefficientvärden. Regularisering fungerar genom att lägga till det straff som är associerat med koefficientvärden i hypotesfelet. En korrekt modell med extrema koefficientvärden skulle straffas mer, men en mindre exakt modell med mer konservativa värden skulle straffas mindre.

    L1- och L2-regularisering har olika effekter och användningsområden. L1 kan tillämpas på glesa modeller, vilket är användbart när du arbetar med högdimensionella data. L2-regularisering är däremot att föredra för data som inte är glesa. Den här algoritmen stöder en linjär kombination av L1- och L2-regulariseringsvärden: d.v.s. om x = L1 och y = L2, ax + by = c definierar det linjära intervallet för regulariseringstermer.

    Olika linjära kombinationer av L1- och L2-termer har utformats för logistiska regressionsmodeller, till exempel elastisk nät regularisering.

  5. Slumptalsfrö: Ange ett heltalsvärde som ska användas som startvärde för algoritmen om du vill att resultatet ska upprepas över körningar. Annars används ett systemklockavärde som startvärde, vilket kan ge något olika resultat i körningar av samma pipeline.

  6. Anslut en etiketterad datauppsättning och träna modellen:

    • Om du anger Skapa träningsläge till Enskild parameter ansluter du en taggad datauppsättning och komponenten Träna modell .

    • Om du ställer in Skapa träningslägeParameterintervall ansluter du en taggad datauppsättning och tränar modellen med hjälp av Tune Model Hyperparameters.

    Anteckning

    Om du skickar ett parameterintervall till Train Model används endast standardvärdet i listan med enskilda parametrar.

    Om du skickar en enda uppsättning parametervärden till komponenten Tune Model Hyperparameters ignoreras värdena när en uppsättning inställningar för varje parameter förväntas, och standardvärdena för learner används.

    Om du väljer alternativet Parameterintervall och anger ett enda värde för valfri parameter används det enskilda värdet som du angav under svepet, även om andra parametrar ändras över ett värdeintervall.

  7. Skicka pipelinen.

Nästa steg

Se den uppsättning komponenter som är tillgängliga för Azure Machine Learning.