Two-Class Decision Two-Class
Belangrijk
De ondersteuning voor Azure Machine Learning-studio (klassiek) eindigt op 31 augustus 2024. U wordt aangeraden om vóór die datum over te stappen naar Azure Machine Learning.
Vanaf 1 december 2021 kunt u geen nieuwe resources voor Azure Machine Learning-studio (klassiek) meer maken. Tot en met 31 augustus 2024 kunt u de bestaande resources van Azure Machine Learning-studio (klassiek) blijven gebruiken.
- Zie informatie over het verplaatsen machine learning van ML Studio (klassiek) naar Azure Machine Learning.
- Meer informatie over Azure Machine Learning.
De documentatie van ML-studio (klassiek) wordt buiten gebruik gesteld en wordt in de toekomst mogelijk niet meer bijgewerkt.
Hiermee maakt u een classificatiemodel met twee klassen met behulp van het beslissingsalgoritme
Categorie: Machine Learning/ Model/classificatie initialiseren
Notitie
Van toepassing op: Machine Learning Studio (klassiek)
Vergelijkbare modules voor slepen en neerzetten zijn beschikbaar in Azure Machine Learning designer.
Moduleoverzicht
In dit artikel wordt beschreven hoe u de module Two-Class DecisionValt in Machine Learning Studio (klassiek) gebruikt om een machine learning-model te maken dat is gebaseerd op een onder supervisie geplaatst ensembleleeralgoritme met de naam beslissingsgroepen.
De module Decision Module met twee klassen retourneert een niet-getrainde classificatie. Vervolgens traint u dit model op een gelabelde trainingsgegevensset met behulp van Train Model of Tune Model Hyperparameters. Het getrainde model kan vervolgens worden gebruikt om voorspellingen te doen.
Meer informatie over beslissingsbeslissingen
Beslissingsbeslissingen zijn een recente uitbreiding van beslissings forests. Een beslissingsding bestaat uit een geheel van beslissingsgestuurde acyclische grafieken (DAG's).
Beslissingsbeslissingen hebben de volgende voordelen:
Doordat boom branches kunnen worden samengevoegd, heeft een beslissings-DAG doorgaans een lagere geheugenvoetafdruk en betere generalisatieprestaties dan een beslissingsstructuur, hoewel dit ten koste gaat van iets langere trainingstijd.
Beslissingsmodellen zijn niet-parametrische modellen die niet-lineaire beslissingsgrenzen kunnen vertegenwoordigen.
Ze voeren geïntegreerde functieselectie en -classificatie uit en zijn flexibel in de aanwezigheid van ruisfuncties.
Tip
Voor meer informatie over het onderzoek achter dit machine learning algoritme, zie Decision Welkes: Compact and Rich Models for Classification (downloadbare PDF).
Een beslissing Two-Class configureren
Voeg de module Two-Class Decision Module toe aan uw experiment in Studio (klassiek).
Kies voor methode Resampling de methode die wordt gebruikt om de afzonderlijke boomen te maken. U kunt kiezen uit Inpakken of Repliceren.
Bagging: selecteer deze optie om bagging te gebruiken, ook wel bootstrap aggregeren genoemd.
Elke structuur in een beslissingsstructuur heeft een Gaussiaanse distributie als voorspelling. De aggregatie is om een Gaussian te vinden waarvan de eerste twee momenten overeenkomen met de momenten van de combinatie van Gaussians die worden gegeven door alle Gaussians te combineren die worden geretourneerd door afzonderlijke boomsoorten.
Repliceren: Bij replicatie wordt elke structuur getraind op exact dezelfde invoergegevens. Het bepalen van welk splitsingspredicaat wordt gebruikt voor elk structuur-knooppunt blijft willekeurig en de structuur zal divers zijn.
Geef op hoe u het model wilt trainen door de optie Trainer-modus maken in te stellen.
Enkele parameter: als u weet hoe u het model wilt configureren, kunt u een specifieke set waarden opgeven als argumenten.
Parameterbereik: als u niet zeker bent van de beste parameters, kunt u de optimale parameters vinden door meerdere waarden op te geven en de module Tune Model Hyperparameters te gebruiken om de optimale configuratie te vinden. De docent doorsteert meerdere combinaties van de instellingen die u hebt opgegeven en bepaalt de combinatie van waarden die het beste model produceren.
Geef bij Aantal beslissings-DAG's het maximum aantal grafieken aan dat in het ensemble kan worden gemaakt.
Voor Maximale diepte van de beslissings-DAG's geeft u de maximale diepte van elke grafiek aan.
Voor Maximale breedte van de beslissings-DAG's geeft u de maximale breedte van elke grafiek aan.
Geef in Aantal optimalisatiestappen per beslissingslaag DAG aan hoeveel iteraties de gegevens moeten uitvoeren bij het bouwen van elke DAG.
Selecteer de optie Onbekende waarden toestaan voor categorische functies om een groep te maken voor onbekende waarden in test- of validatiegegevens.
Als u de selectie ervan ongedaan maakt, kan het model alleen de waarden accepteren die zijn opgenomen in de trainingsgegevens. In het eerste geval is het model mogelijk minder nauwkeurig voor bekende waarden, maar het kan betere voorspellingen geven voor nieuwe (onbekende) waarden.
Voeg een getagde gegevensset toe aan het experiment en verbind een van de trainingsmodules.
Als u de modus Create train mode instelt op Single Parameter, gebruikt u de module Train Model .
Als u De modus Maken in stelt op Parameterbereik, gebruikt u de module Tune Model Hyperparameters .
Notitie
Als u een parameterbereik doorgeeft aan Train Model, wordt alleen de eerste waarde in de lijst met parameterbereiken gebruikt.
Als u één set parameterwaarden doorgeeft aan de module Tune Model Hyperparameters , worden de waarden genegeerd en worden de standaardwaarden voor de learner genegeerd wanneer er een bereik van instellingen voor elke parameter wordt verwacht.
Als u de optie Parameterbereik selecteert en één waarde voor een parameter ingeeft, wordt die ene waarde die u hebt opgegeven, gebruikt tijdens het opruimen, zelfs als andere parameters binnen een bereik van waarden veranderen.
Resultaten
Nadat de training is voltooid:
- Als u het model wilt gebruiken om te scoren, verbindt u het met Score Model om waarden voor nieuwe invoervoorbeelden te voorspellen.
Voorbeelden
Voor voorbeelden van hoe beslissingsbeslissingen worden gebruikt in machine learning, zie de Azure AI Gallery:
- Binaire classificaties vergelijken: maakt gebruik van verschillende algoritmen en bespreekt de voor- en nadelen.
Technische opmerkingen
Deze sectie bevat implementatiedetails, tips en antwoorden op veelgestelde vragen.
Gebruikstips
Als u beperkte gegevens hebt of de tijd die u nodig hebt om het model te trainen wilt minimaliseren, kunt u deze instellingen proberen.
Beperkte trainingsset
Als uw trainingsset klein is:
- Maak de beslissingsdeser met behulp van een groot aantal beslissings-DAG's (bijvoorbeeld meer dan 20).
- Gebruik de optie Bagging om opnieuw een steekproef te nemen.
- Geef een groot aantal optimalisatiestappen per DAG-laag op (bijvoorbeeld meer dan 10.000).
Beperkte trainingtijd
Als de trainingsset groot is, maar de training tijd beperkt is:
- Maak de beslissingsdeser met behulp van een minder aantal beslissings-DAG's (bijvoorbeeld 5-10).
- Gebruik de optie Repliceren om opnieuw een steekproef te maken.
- Geef een kleiner aantal optimalisatiestappen per DAG-laag op (bijvoorbeeld minder dan 2000).
Moduleparameters
Name | Bereik | Type | Standaard | Beschrijving |
---|---|---|---|---|
Methode Resampling | Alle | ResamplingMethod | Zakken | Een hersampling-methode kiezen |
Aantal beslissings-DAG's | >= 1 | Geheel getal | 8 | Geef het aantal beslissingsgrafieken op dat in het ensemble moet worden gebouwd |
Maximale diepte van de beslissings-DAG's | >= 1 | Geheel getal | 32 | De maximale diepte van de beslissingsgrafieken in het ensemble opgeven |
Maximale breedte van de beslissings-DAG's | >= 8 | Geheel getal | 128 | De maximale breedte van de beslissingsgrafieken in het ensemble opgeven |
Aantal optimalisatiestappen per dag-beslissingslaag | >= 1000 | Geheel getal | 2048 | Geef het aantal stappen op dat moet worden gebruikt om elk niveau van de beslissingsgrafieken te optimaliseren |
Onbekende waarden voor categorische functies toestaan | Alle | Boolean-waarde | True | Aangeven of onbekende waarden van bestaande categorische functies kunnen worden toegevoegd aan een nieuwe, extra functie |
Uitvoer
Naam | Type | Description |
---|---|---|
Niet-getraind model | ILearner-interface | Een ongetraind binair classificatiemodel |
Zie ook
Classificatie
Beslissing met meerdere klasses
Lijst met A-Z-modules