Förbättrat beslutsträd med flera klasser

I den här artikeln beskrivs en komponent i Azure Machine Learning-designern.

Använd den här komponenten för att skapa en maskininlärningsmodell som baseras på algoritmen för förstärkta beslutsträd.

Ett förbättrat beslutsträd är en ensembleinlärningsmetod där det andra trädet korrigeras för felen i det första trädet, det tredje trädet korrigeras för felen i de första och andra träden och så vidare. Förutsägelser baseras på ensemblen av träd tillsammans.

Konfigurera

Den här komponenten skapar en otränad klassificeringsmodell. Eftersom klassificering är en övervakad inlärningsmetod behöver du en märkt datauppsättning som innehåller en etikettkolumn med ett värde för alla rader.

Du kan träna den här typen av modell med hjälp av träningsmodellen.

  1. Lägg till komponenten Flerklassuellt förbättrat beslutsträd i din pipeline.

  2. Ange hur du vill att modellen ska tränas genom att ange alternativet Skapa träningsläge .

    • Enskild parameter: Om du vet hur du vill konfigurera modellen kan du ange en specifik uppsättning värden som argument.

    • Parameterintervall: Välj det här alternativet om du inte är säker på de bästa parametrarna och vill köra en parameterrensning. Välj ett värdeintervall att iterera över, så itererar Tune Model Hyperparameters över alla möjliga kombinationer av de inställningar som du angav för att fastställa de hyperparametrar som ger optimala resultat.

  3. Maximalt antal löv per träd begränsar det maximala antalet terminalnoder (löv) som kan skapas i valfritt träd.

    Genom att öka det här värdet kan du potentiellt öka trädets storlek och uppnå högre precision, med risk för överanpassning och längre träningstid.

  4. Minsta antal exempel per lövnod anger antalet fall som krävs för att skapa en terminalnod (löv) i ett träd.

    Genom att öka det här värdet ökar du tröskelvärdet för att skapa nya regler. Med standardvärdet 1 kan till exempel även ett enskilt fall orsaka att en ny regel skapas. Om du ökar värdet till 5 måste träningsdata innehålla minst fem fall som uppfyller samma villkor.

  5. Inlärningstakten definierar stegstorleken under inlärningen. Ange ett tal mellan 0 och 1.

    Inlärningstakten avgör hur snabbt eller långsamt inlärningen konvergerar på en optimal lösning. Om stegstorleken är för stor kan du felsöka den optimala lösningen. Om stegstorleken är för liten tar träningen längre tid att konvergera på den bästa lösningen.

  6. Antalet konstruerade träd anger det totala antalet beslutsträd som ska skapas i ensemblen. Genom att skapa fler beslutsträd kan du potentiellt få bättre täckning, men träningstiden ökar.

  7. Slumptalsutsöndrad anger om du vill att ett icke-negativt heltal ska användas som slumpmässigt startvärde. Om du anger ett startvärde säkerställs reproducerbarheten mellan körningar som har samma data och parametrar.

    Det slumpmässiga fröet anges som standard till 42. Efterföljande körningar med olika slumpmässiga frön kan ha olika resultat.

  8. Träna modellen:

    • Om du anger Skapa träningsläge till Enskild parameter ansluter du en taggad datauppsättning och komponenten Träna modell .

    • Om du ställer in Skapa träningslägeParameterintervall ansluter du en taggad datauppsättning och tränar modellen med hjälp av Tune Model Hyperparameters.

    Anteckning

    Om du skickar ett parameterintervall till Train Model används endast standardvärdet i listan med enskilda parametrar.

    Om du skickar en enda uppsättning parametervärden till komponenten Tune Model Hyperparameters ignoreras värdena när en uppsättning inställningar för varje parameter förväntas, och standardvärdena för learner används.

    Om du väljer alternativet Parameterintervall och anger ett enda värde för valfri parameter används det enskilda värdet som du angav under svepet, även om andra parametrar ändras över ett värdeintervall.

Nästa steg

Se den uppsättning komponenter som är tillgängliga för Azure Machine Learning.