Multiclass Logistic Regression-onderdeel

In dit artikel wordt een onderdeel in de Azure Machine Learning-ontwerpfunctie beschreven.

Gebruik dit onderdeel om een logistiek regressiemodel te maken dat kan worden gebruikt om meerdere waarden te voorspellen.

Classificatie met behulp van logistieke regressie is een leermethode onder supervisie en vereist daarom een gelabelde gegevensset. U traint het model door het model en de gelabelde gegevensset op te geven als invoer voor een onderdeel, zoals Model trainen. Het getrainde model kan vervolgens worden gebruikt om waarden voor nieuwe invoervoorbeelden te voorspellen.

Azure Machine Learning biedt ook een onderdeel logistieke regressie met twee klassen , dat geschikt is voor de classificatie van binaire of dichotome variabelen.

Over logistieke regressie met meerdere klassen

Logistieke regressie is een bekende methode in statistieken die wordt gebruikt om de waarschijnlijkheid van een resultaat te voorspellen en is populair voor classificatietaken. Het algoritme voorspelt de waarschijnlijkheid van het optreden van een gebeurtenis door gegevens aan een logistieke functie toe te passen.

Bij logistieke regressie met meerdere klassen kan de classificatie worden gebruikt om meerdere resultaten te voorspellen.

Een logistieke regressie met meerdere klassen configureren

  1. Voeg het onderdeel Multiclass Logistic Regression toe aan de pijplijn.

  2. Geef op hoe u het model wilt trainen door de optie Trainermodus maken in te stellen.

    • Enkele parameter: gebruik deze optie als u weet hoe u het model wilt configureren en een specifieke set waarden als argumenten wilt opgeven.

    • Parameterbereik: selecteer deze optie als u niet zeker bent van de beste parameters en een parameter-sweep wilt uitvoeren. Selecteer een waardenbereik dat u wilt herhalen. De hyperparameters van het model afstemmen worden herhaald met alle mogelijke combinaties van de instellingen die u hebt opgegeven om de hyperparameters te bepalen die de optimale resultaten opleveren.

  3. Optimalisatietolerantie: geef de drempelwaarde op voor optimalisatiecondensatie. Als de verbetering tussen iteraties lager is dan de drempelwaarde, stopt het algoritme en retourneert het huidige model.

  4. L1 regularisatiegewicht, L2-regularisatiegewicht: typ een waarde die u wilt gebruiken voor de regularisatieparameters L1 en L2. Een niet-nulwaarde wordt aanbevolen voor beide.

    Regularisatie is een methode om overfitting te voorkomen door modellen met extreme coëfficiëntwaarden te bestraffen. Regularisatie werkt door de boete die is gekoppeld aan coëfficiëntwaarden toe te voegen aan de fout van de hypothese. Een nauwkeurig model met extreme coëfficiëntwaarden zou meer bestraft worden, maar een minder nauwkeurig model met meer conservatieve waarden zou minder bestraft worden.

    De regularisatie van L1 en L2 heeft verschillende effecten en toepassingen. L1 kan worden toegepast op sparse modellen, wat handig is bij het werken met hoogdimensionale gegevens. Daarentegen verdient L2-regularisatie de voorkeur voor gegevens die niet sparse zijn. Dit algoritme ondersteunt een lineaire combinatie van L1- en L2-regularisatiewaarden: dat wil gezegd, als x = L1 en y = L2, ax + by = c definieert de lineaire periode van de regularisatietermen.

    Er zijn verschillende lineaire combinaties van L1- en L2-termen bedacht voor logistieke regressiemodellen, zoals elastische net regularisatie.

  5. Seed voor willekeurige getallen: typ een geheel getal dat u wilt gebruiken als seed voor het algoritme als u wilt dat de resultaten kunnen worden herhaald tijdens uitvoeringen. Anders wordt een systeemklokwaarde gebruikt als seed, wat enigszins verschillende resultaten kan produceren in uitvoeringen van dezelfde pijplijn.

  6. Verbind een gelabelde gegevensset en train het model:

    • Als u de modus Trainer maken instelt op Enkele parameter, verbindt u een getagde gegevensset en het onderdeel Train Model .

    • Als u de modus Trainer maken instelt op Parameterbereik, verbindt u een getagde gegevensset en traint u het model met hyperparameters afstemmen.

    Notitie

    Als u een parameterbereik doorgeeft aan Train Model, wordt alleen de standaardwaarde in de lijst met enkelvoudige parameters gebruikt.

    Als u één set parameterwaarden doorgeeft aan het onderdeel Model hyperparameters afstemmen en er een bereik van instellingen voor elke parameter wordt verwacht, worden de waarden genegeerd en worden de standaardwaarden voor de cursist gebruikt.

    Als u de optie Parameterbereik selecteert en één waarde voor een parameter invoert, wordt die ene waarde die u hebt opgegeven, gebruikt tijdens de sweep, zelfs als andere parameters in een bereik van waarden veranderen.

  7. Verzend de pijplijn.

Volgende stappen

Bekijk de set onderdelen die beschikbaar zijn voor Azure Machine Learning.