Two-Class ondersteuningsvectormachineonderdeel

In dit artikel wordt een onderdeel in de Azure Machine Learning-ontwerpfunctie beschreven.

Gebruik dit onderdeel om een model te maken dat is gebaseerd op het algoritme van de ondersteuningsvectormachine.

Ondersteuningsvectormachines (SVM's) zijn een goed onderzochte klasse van leermethoden onder supervisie. Deze specifieke implementatie is geschikt voor het voorspellen van twee mogelijke resultaten, op basis van continue of categorische variabelen.

Nadat u de modelparameters hebt gedefinieerd, traint u het model met behulp van de trainingsonderdelen en geeft u een getagde gegevensset op met een label of resultaatkolom.

Over ondersteuningsvectormachines

Ondersteuningsvectormachines behoren tot de vroegste machine learning-algoritmen en SVM-modellen zijn in veel toepassingen gebruikt, van het ophalen van informatie tot tekst- en afbeeldingsclassificatie. SVM's kunnen worden gebruikt voor zowel classificatie- als regressietaken.

Dit SVM-model is een leermodel onder supervisie waarvoor gelabelde gegevens zijn vereist. In het trainingsproces analyseert het algoritme invoergegevens en herkent het patronen in een multidimensionale functieruimte die het hypervlak wordt genoemd. Alle invoervoorbeelden worden weergegeven als punten in deze ruimte en zijn toegewezen aan uitvoercategorieën op een zodanige manier dat categorieën worden gedeeld door een zo groot mogelijke en duidelijke kloof.

Voor voorspelling wijst het SVM-algoritme nieuwe voorbeelden toe aan de ene of de andere categorie, waarbij ze in dezelfde ruimte worden toegewezen.

Configureren

Voor dit modeltype is het raadzaam dat u de gegevensset normaliseert voordat u deze gebruikt om de classificatie te trainen.

  1. Voeg het onderdeel Two-Class Support Vector Machine toe aan uw pijplijn.

  2. Geef op hoe u het model wilt trainen door de optie Trainermodus maken in te stellen.

    • Enkele parameter: als u weet hoe u het model wilt configureren, kunt u een specifieke set waarden opgeven als argumenten.

    • Parameterbereik: Als u niet zeker bent van de beste parameters, kunt u de optimale parameters vinden met behulp van het onderdeel Model hyperparameters afstemmen . U geeft een bereik van waarden op en de trainer herhaalt meerdere combinaties van de instellingen om de combinatie van waarden te bepalen die het beste resultaat oplevert.

  3. Bij Aantal iteraties typt u een getal dat het aantal iteraties aangeeft dat wordt gebruikt bij het bouwen van het model.

    Deze parameter kan worden gebruikt om het verschil tussen de trainingssnelheid en nauwkeurigheid te bepalen.

  4. Voor Lambda typt u een waarde die u wilt gebruiken als het gewicht voor L1-regularisatie.

    Deze regularisatiecoëfficiënt kan worden gebruikt om het model af te stemmen. Grotere waarden bestraffen complexere modellen.

  5. Selecteer de optie Normalize features (Functies normaliseren) als u de functies vóór de training wilt normaliseren.

    Als u normalisatie toepast, worden gegevenspunten vóór de training gecentreerd op het gemiddelde en geschaald om één eenheid van standaarddeviatie te hebben.

  6. Selecteer de optie Projecteren op de eenheidsbol om de coëfficiënten te normaliseren.

    Het projecteren van waarden op eenheidsruimte betekent dat gegevenspunten vóór de training worden gecentreerd op 0 en worden geschaald om één eenheid van standaarddeviatie te hebben.

  7. Typ in Seed van willekeurig getal een geheel getal dat u als seed wilt gebruiken als u reproduceerbaarheid tussen uitvoeringen wilt garanderen. Anders wordt een systeemklokwaarde gebruikt als seed, wat kan leiden tot iets verschillende resultaten tussen uitvoeringen.

  8. Verbind een gelabelde gegevensset en train het model:

    • Als u de modus Trainer maken instelt op Enkele parameter, verbindt u een getagde gegevensset en het onderdeel Train Model .

    • Als u de modus Trainer maken instelt op Parameterbereik, verbindt u een getagde gegevensset en traint u het model met hyperparameters afstemmen.

    Notitie

    Als u een parameterbereik doorgeeft aan Train Model, wordt alleen de standaardwaarde in de lijst met enkelvoudige parameters gebruikt.

    Als u één set parameterwaarden doorgeeft aan het onderdeel Model hyperparameters afstemmen en er een bereik van instellingen voor elke parameter wordt verwacht, worden de waarden genegeerd en worden de standaardwaarden voor de cursist gebruikt.

    Als u de optie Parameterbereik selecteert en één waarde voor een parameter invoert, wordt die ene waarde die u hebt opgegeven, gebruikt tijdens de sweep, zelfs als andere parameters in een bereik van waarden veranderen.

  9. Verzend de pijplijn.

Resultaten

Nadat de training is voltooid:

  • Als u een momentopname van het getrainde model wilt opslaan, selecteert u het tabblad Uitvoer in het rechterdeelvenster van het onderdeel Model trainen . Selecteer het pictogram Gegevensset registreren om het model op te slaan als een herbruikbaar onderdeel.

  • Als u het model wilt gebruiken voor scoren, voegt u het onderdeel Score Model toe aan een pijplijn.

Volgende stappen

Bekijk de set onderdelen die beschikbaar zijn voor Azure Machine Learning.