Versterkte beslissingsstructuur met meerdere klassen

In dit artikel wordt een onderdeel in azure Machine Learning Designer beschreven.

Gebruik dit onderdeel om een machine learning-model te maken dat is gebaseerd op het algoritme voor versterkte beslissingsstructuren.

Een versterkte beslissingsstructuur is een ensembleleermethode waarbij de tweede structuur de fouten van de eerste boom corrigeert, de derde structuur corrigeert voor de fouten van de eerste en tweede boom, enzovoort. Voorspellingen zijn gebaseerd op het ensemble van bomen samen.

Configureren

Met dit onderdeel wordt een niet-getraind classificatiemodel gemaakt. Omdat classificatie een leermethode onder supervisie is, hebt u een gelabelde gegevensset nodig die een labelkolom met een waarde voor alle rijen bevat.

U kunt dit type model trainen met behulp van model trainen.

  1. Voeg het onderdeel Multiclass Boosted Decision Tree toe aan uw pijplijn.

  2. Geef op hoe u het model wilt trainen door de optie Trainermodus maken in te stellen.

    • Enkele parameter: als u weet hoe u het model wilt configureren, kunt u een specifieke set waarden opgeven als argumenten.

    • Parameterbereik: selecteer deze optie als u niet zeker bent van de beste parameters en een parameter-sweep wilt uitvoeren. Selecteer een waardenbereik dat u wilt herhalen en de Hyperparameters van model afstemmen herhaalt alle mogelijke combinaties van de instellingen die u hebt opgegeven om de hyperparameters te bepalen die de optimale resultaten produceren.

  3. Het maximum aantal bladeren per boomstructuur beperkt het maximum aantal terminalknooppunten (bladeren) dat in een structuur kan worden gemaakt.

    Door deze waarde te verhogen, vergroot u mogelijk de grootte van de boomstructuur en bereikt u een hogere precisie, met het risico op overfitting en langere trainingstijd.

  4. Minimum aantal steekproeven per leaf-knooppunt geeft het aantal gevallen aan dat nodig is om een terminalknooppunt (leaf) in een boomstructuur te maken.

    Door deze waarde te verhogen, verhoogt u de drempelwaarde voor het maken van nieuwe regels. Met de standaardwaarde 1 kan zelfs één case ervoor zorgen dat er een nieuwe regel wordt gemaakt. Als u de waarde verhoogt naar 5, moeten de trainingsgegevens ten minste vijf cases bevatten die aan dezelfde voorwaarden voldoen.

  5. Leersnelheid bepaalt de stapgrootte tijdens het leren. Voer een getal in tussen 0 en 1.

    De leersnelheid bepaalt hoe snel of traag de cursist convergeert op een optimale oplossing. Als de stap te groot is, kunt u de optimale oplossing overslaan. Als de stap te klein is, duurt het langer om de training te convergeren op de beste oplossing.

  6. Aantal samengestelde bomen geeft het totale aantal beslissingsstructuren aan dat in het ensemble moet worden gemaakt. Door meer beslissingsstructuren te maken, kunt u mogelijk een betere dekking krijgen, maar de trainingstijd neemt toe.

  7. Seed voor willekeurige getallen stelt desgewenst een niet-negatief geheel getal in dat moet worden gebruikt als de willekeurige seed-waarde. Als u een seed opgeeft, zorgt u voor reproduceerbaarheid tussen uitvoeringen met dezelfde gegevens en parameters.

    De willekeurige seed is standaard ingesteld op 42. Opeenvolgende uitvoeringen met verschillende willekeurige zaden kunnen verschillende resultaten hebben.

  8. Het model trainen:

    • Als u de modus Trainer maken instelt op Enkele parameter, verbindt u een getagde gegevensset en het onderdeel Train Model .

    • Als u de modus Trainer maken instelt op Parameterbereik, verbindt u een getagde gegevensset en traint u het model met behulp van Hyperparameters afstemmen.

    Notitie

    Als u een parameterbereik doorgeeft aan Train Model, wordt alleen de standaardwaarde in de lijst met parameters gebruikt.

    Als u één set parameterwaarden doorgeeft aan het onderdeel Model hyperparameters afstemmen en er een reeks instellingen voor elke parameter wordt verwacht, worden de waarden genegeerd en worden de standaardwaarden voor de cursist gebruikt.

    Als u de optie Parameterbereik selecteert en één waarde invoert voor een parameter, wordt die ene waarde die u hebt opgegeven, gebruikt tijdens de sweep, zelfs als andere parameters in een bereik van waarden veranderen.

Volgende stappen

Bekijk de set onderdelen die beschikbaar zijn voor Azure Machine Learning.