Two-Class Decision Two-Class

Belangrijk

De ondersteuning voor Azure Machine Learning-studio (klassiek) eindigt op 31 augustus 2024. U wordt aangeraden om vóór die datum over te stappen naar Azure Machine Learning.

Vanaf 1 december 2021 kunt u geen nieuwe resources voor Azure Machine Learning-studio (klassiek) meer maken. Tot en met 31 augustus 2024 kunt u de bestaande resources van Azure Machine Learning-studio (klassiek) blijven gebruiken.

De documentatie van ML-studio (klassiek) wordt buiten gebruik gesteld en wordt in de toekomst mogelijk niet meer bijgewerkt.

Hiermee maakt u een classificatiemodel met twee klassen met behulp van het beslissingsalgoritme

Categorie: Machine Learning/ Model/classificatie initialiseren

Notitie

Van toepassing op: Machine Learning Studio (klassiek)

Vergelijkbare modules voor slepen en neerzetten zijn beschikbaar in Azure Machine Learning designer.

Moduleoverzicht

In dit artikel wordt beschreven hoe u de module Two-Class DecisionValt in Machine Learning Studio (klassiek) gebruikt om een machine learning-model te maken dat is gebaseerd op een onder supervisie geplaatst ensembleleeralgoritme met de naam beslissingsgroepen.

De module Decision Module met twee klassen retourneert een niet-getrainde classificatie. Vervolgens traint u dit model op een gelabelde trainingsgegevensset met behulp van Train Model of Tune Model Hyperparameters. Het getrainde model kan vervolgens worden gebruikt om voorspellingen te doen.

Meer informatie over beslissingsbeslissingen

Beslissingsbeslissingen zijn een recente uitbreiding van beslissings forests. Een beslissingsding bestaat uit een geheel van beslissingsgestuurde acyclische grafieken (DAG's).

Beslissingsbeslissingen hebben de volgende voordelen:

  • Doordat boom branches kunnen worden samengevoegd, heeft een beslissings-DAG doorgaans een lagere geheugenvoetafdruk en betere generalisatieprestaties dan een beslissingsstructuur, hoewel dit ten koste gaat van iets langere trainingstijd.

  • Beslissingsmodellen zijn niet-parametrische modellen die niet-lineaire beslissingsgrenzen kunnen vertegenwoordigen.

  • Ze voeren geïntegreerde functieselectie en -classificatie uit en zijn flexibel in de aanwezigheid van ruisfuncties.

Tip

Voor meer informatie over het onderzoek achter dit machine learning algoritme, zie Decision Welkes: Compact and Rich Models for Classification (downloadbare PDF).

Een beslissing Two-Class configureren

  1. Voeg de module Two-Class Decision Module toe aan uw experiment in Studio (klassiek).

  2. Kies voor methode Resampling de methode die wordt gebruikt om de afzonderlijke boomen te maken. U kunt kiezen uit Inpakken of Repliceren.

  3. Geef op hoe u het model wilt trainen door de optie Trainer-modus maken in te stellen.

    • Enkele parameter: als u weet hoe u het model wilt configureren, kunt u een specifieke set waarden opgeven als argumenten.

    • Parameterbereik: als u niet zeker bent van de beste parameters, kunt u de optimale parameters vinden door meerdere waarden op te geven en de module Tune Model Hyperparameters te gebruiken om de optimale configuratie te vinden. De docent doorsteert meerdere combinaties van de instellingen die u hebt opgegeven en bepaalt de combinatie van waarden die het beste model produceren.

  4. Geef bij Aantal beslissings-DAG's het maximum aantal grafieken aan dat in het ensemble kan worden gemaakt.

  5. Voor Maximale diepte van de beslissings-DAG's geeft u de maximale diepte van elke grafiek aan.

  6. Voor Maximale breedte van de beslissings-DAG's geeft u de maximale breedte van elke grafiek aan.

  7. Geef in Aantal optimalisatiestappen per beslissingslaag DAG aan hoeveel iteraties de gegevens moeten uitvoeren bij het bouwen van elke DAG.

  8. Selecteer de optie Onbekende waarden toestaan voor categorische functies om een groep te maken voor onbekende waarden in test- of validatiegegevens.

    Als u de selectie ervan ongedaan maakt, kan het model alleen de waarden accepteren die zijn opgenomen in de trainingsgegevens. In het eerste geval is het model mogelijk minder nauwkeurig voor bekende waarden, maar het kan betere voorspellingen geven voor nieuwe (onbekende) waarden.

  9. Voeg een getagde gegevensset toe aan het experiment en verbind een van de trainingsmodules.

    Notitie

    Als u een parameterbereik doorgeeft aan Train Model, wordt alleen de eerste waarde in de lijst met parameterbereiken gebruikt.

    Als u één set parameterwaarden doorgeeft aan de module Tune Model Hyperparameters , worden de waarden genegeerd en worden de standaardwaarden voor de learner genegeerd wanneer er een bereik van instellingen voor elke parameter wordt verwacht.

    Als u de optie Parameterbereik selecteert en één waarde voor een parameter ingeeft, wordt die ene waarde die u hebt opgegeven, gebruikt tijdens het opruimen, zelfs als andere parameters binnen een bereik van waarden veranderen.

Resultaten

Nadat de training is voltooid:

  • Als u het model wilt gebruiken om te scoren, verbindt u het met Score Model om waarden voor nieuwe invoervoorbeelden te voorspellen.

Voorbeelden

Voor voorbeelden van hoe beslissingsbeslissingen worden gebruikt in machine learning, zie de Azure AI Gallery:

Technische opmerkingen

Deze sectie bevat implementatiedetails, tips en antwoorden op veelgestelde vragen.

Gebruikstips

Als u beperkte gegevens hebt of de tijd die u nodig hebt om het model te trainen wilt minimaliseren, kunt u deze instellingen proberen.

Beperkte trainingsset

Als uw trainingsset klein is:

  • Maak de beslissingsdeser met behulp van een groot aantal beslissings-DAG's (bijvoorbeeld meer dan 20).
  • Gebruik de optie Bagging om opnieuw een steekproef te nemen.
  • Geef een groot aantal optimalisatiestappen per DAG-laag op (bijvoorbeeld meer dan 10.000).

Beperkte trainingtijd

Als de trainingsset groot is, maar de training tijd beperkt is:

  • Maak de beslissingsdeser met behulp van een minder aantal beslissings-DAG's (bijvoorbeeld 5-10).
  • Gebruik de optie Repliceren om opnieuw een steekproef te maken.
  • Geef een kleiner aantal optimalisatiestappen per DAG-laag op (bijvoorbeeld minder dan 2000).

Moduleparameters

Name Bereik Type Standaard Beschrijving
Methode Resampling Alle ResamplingMethod Zakken Een hersampling-methode kiezen
Aantal beslissings-DAG's >= 1 Geheel getal 8 Geef het aantal beslissingsgrafieken op dat in het ensemble moet worden gebouwd
Maximale diepte van de beslissings-DAG's >= 1 Geheel getal 32 De maximale diepte van de beslissingsgrafieken in het ensemble opgeven
Maximale breedte van de beslissings-DAG's >= 8 Geheel getal 128 De maximale breedte van de beslissingsgrafieken in het ensemble opgeven
Aantal optimalisatiestappen per dag-beslissingslaag >= 1000 Geheel getal 2048 Geef het aantal stappen op dat moet worden gebruikt om elk niveau van de beslissingsgrafieken te optimaliseren
Onbekende waarden voor categorische functies toestaan Alle Boolean-waarde True Aangeven of onbekende waarden van bestaande categorische functies kunnen worden toegevoegd aan een nieuwe, extra functie

Uitvoer

Naam Type Description
Niet-getraind model ILearner-interface Een ongetraind binair classificatiemodel

Zie ook

Classificatie
Beslissing met meerdere klasses
Lijst met A-Z-modules