komponenten Two-Class Support Vector Machine

Den här artikeln beskriver en komponent i Azure Machine Learning-designern.

Använd den här komponenten för att skapa en modell som baseras på algoritmen för stödvektordatorn.

Stödvektormaskiner (SVM) är en väl undersökt klass med övervakade inlärningsmetoder. Den här implementeringen passar bra för förutsägelse av två möjliga resultat, baserat på antingen kontinuerliga eller kategoriska variabler.

När du har definierat modellparametrarna tränar du modellen med hjälp av träningskomponenterna och tillhandahåller en taggad datauppsättning som innehåller en etikett eller resultatkolumn.

Om stödvektordatorer

Stödvektormaskiner är bland de tidigaste maskininlärningsalgoritmerna, och SVM-modeller har använts i många program, från informationshämtning till text- och bildklassificering. SVM:er kan användas för både klassificerings- och regressionsaktiviteter.

Den här SVM-modellen är en övervakad inlärningsmodell som kräver märkta data. I träningsprocessen analyserar algoritmen indata och identifierar mönster i ett flerdimensionellt funktionsutrymme som kallas hyperplanet. Alla indataexempel representeras som punkter i det här utrymmet och mappas till utdatakategorier på ett sådant sätt att kategorierna delas upp med en så bred och tydlig lucka som möjligt.

För förutsägelse tilldelar SVM-algoritmen nya exempel till en kategori eller en annan och mappar dem till samma utrymme.

Konfigurera

För den här modelltypen rekommenderar vi att du normaliserar datamängden innan du använder den för att träna klassificeraren.

  1. Lägg till komponenten Tvåklasss stödvektordator i pipelinen.

  2. Ange hur du vill att modellen ska tränas genom att ange alternativet Skapa träningsläge .

    • Enkel parameter: Om du vet hur du vill konfigurera modellen kan du ange en specifik uppsättning värden som argument.

    • Parameterintervall: Om du inte är säker på de bästa parametrarna kan du hitta de optimala parametrarna med hjälp av komponenten Tune Model Hyperparameters . Du anger vissa värden och utbildaren itererar över flera kombinationer av inställningarna för att fastställa kombinationen av värden som ger det bästa resultatet.

  3. För Antal iterationer anger du ett tal som anger antalet iterationer som används när modellen skapas.

    Den här parametern kan användas för att styra avvägning mellan träningshastighet och noggrannhet.

  4. För Lambda anger du ett värde som ska användas som vikt för L1-regularisering.

    Den här regulariseringskoefficienten kan användas för att finjustera modellen. Större värden straffar mer komplexa modeller.

  5. Välj alternativet Normalisera funktioner om du vill normalisera funktioner före träning.

    Om du tillämpar normalisering, före träning, centreras datapunkterna efter medelvärdet och skalas för att ha en standardavvikelseenhet.

  6. Välj alternativet Projekt till enhetsfären för att normalisera koefficienter.

    Att projicera värden till enhetsutrymme innebär att datapunkterna centreras på 0 före träningen och skalas så att de har en standardavvikelseenhet.

  7. I Slumptalsutsäde anger du ett heltalsvärde som ska användas som startvärde om du vill säkerställa reproducerbarhet mellan körningar. Annars används ett systemklockavärde som ett frö, vilket kan resultera i något olika resultat mellan körningar.

  8. Anslut en märkt datauppsättning och träna modellen:

    • Om du anger Skapa träningsläge till Enskild parameter ansluter du en taggad datauppsättning och komponenten Träna modell .

    • Om du ställer in Skapa träningslägeParameterintervall ansluter du en taggad datauppsättning och tränar modellen med hjälp av Tune Model Hyperparameters.

    Anteckning

    Om du skickar ett parameterintervall till Träna modell används endast standardvärdet i listan med enskilda parametrar.

    Om du skickar en enda uppsättning parametervärden till komponenten Tune Model Hyperparameters ignorerar den värdena när den förväntar sig ett intervall med inställningar för varje parameter och använder standardvärdena för eleven.

    Om du väljer alternativet Parameterintervall och anger ett enda värde för valfri parameter används det enskilda värdet som du angav under svepningen, även om andra parametrar ändras över ett värdeintervall.

  9. Skicka pipelinen.

Resultat

När träningen är klar:

  • Om du vill spara en ögonblicksbild av den tränade modellen väljer du fliken Utdata på den högra panelen i komponenten Träna modell . Välj ikonen Registrera datauppsättning för att spara modellen som en återanvändbar komponent.

  • Om du vill använda modellen för bedömning lägger du till komponenten Poängsätta modell i en pipeline.

Nästa steg

Se den uppsättning komponenter som är tillgängliga för Azure Machine Learning.