Two-Class Decision–

Viktigt

Stödet för Machine Learning Studio (klassisk) upphör den 31 augusti 2024. Vi rekommenderar att du byter till Azure Machine Learning innan dess.

Från och med den 1 december 2021 kan du inte längre skapa nya Machine Learning Studio-resurser (klassisk). Du kan fortsätta att använda befintliga Machine Learning Studio-resurser (klassisk) till och med den 31 augusti 2024.

Dokumentationen om ML Studio (klassisk) håller på att dras tillbaka och kanske inte uppdateras i framtiden.

Skapar en klassificeringsmodell med två klasser med beslutsalgoritmen

Kategori: Machine Learning/initiera modell/klassificering

Anteckning

Gäller endast för: Machine Learning Studio (klassisk)

Liknande dra och släpp-moduler är tillgängliga i Azure Machine Learning designer.

Modulöversikt

Den här artikeln beskriver hur du använder modulen Two-Class Decision Module i Machine Learning Studio (klassisk) för att skapa en maskininlärningsmodell som baseras på en övervakad ensembleinlärningsalgoritm som kallas beslutsroller.

Modulen Two-Class Decision Module returnerar en ej tränad klassificerare. Sedan tränar du den här modellen på en märkt träningsdatauppsättning med hjälp av Hyperparametrarna Train Model (Träna modell ) eller Tune Model (Justera modell). Den tränade modellen kan sedan användas för att göra förutsägelser.

Mer om beslutsfattare

Beslutsskogar är en ny utökning av beslutsskogar. En beslutsgraf består av en ensemble med besluts riktade acykliska grafer (DAG: er).

Beslutsfördelar har följande fördelar:

  • Genom att låta trädgrenar sammanslå har ett besluts-DAG vanligtvis ett lägre minnesfotavtryck och bättre generaliseringsprestanda än ett beslutsträd, även om träningstiden är något längre.

  • Beslutsmodeller är icke-parametrisbaserade modeller som kan representera icke-linjära beslutsgränser.

  • De utför val och klassificering av integrerade funktioner och är motståndskraftiga när det förekommer brusfunktioner.

Tips

Mer information om forskningen bakom den här maskininlärningsalgoritmen finns i Decision Hashs: Compact and Rich Models for Classification (nedladdningsbar PDF).

Så här konfigurerar du Two-Class DecisionNde

  1. Lägg till modulen Two-Class Decision Module i experimentet i Studio (klassisk).

  2. För Omsamplingsmetod väljer du den metod som används för att skapa enskilda träd. Du kan välja mellan Bagging (Bagging ) eller Replicate (Replikera).

    • Felsökning: Välj det här alternativet om du vill använda bagging, även kallat bootstrap-aggregering.

      Varje träd i ett beslutsutdata matar ut en gaussisk fördelning som förutsägelse. Aggregeringen är att hitta en Gaussian vars första två ögonblick matchar den tid då blandning av Gaussianer ges genom att kombinera alla gaussianer som returneras av enskilda träd.

    • Replikera: Vid replikering tränas varje träd på exakt samma indata. Bestämningen av vilket delat predikat som används för varje trädnod förblir slumpmässig och trädträden kommer att vara olika.

      Mer information finns i Beslutsskogar för Visuellt innehåll medicinsk bildanalys. Criminisi och J. Shotton. Springer 2013.

  3. Ange hur du vill att modellen ska tränas genom att ange alternativet Skapa utbildarläge .

    • Enskild parameter: Om du vet hur du vill konfigurera modellen kan du ange en specifik uppsättning värden som argument.

    • Parameterintervall: Om du inte är säker på de bästa parametrarna kan du hitta de optimala parametrarna genom att ange flera värden och använda modulen Finjustera hyperparametrar för modell för att hitta den optimala konfigurationen. Utbildaren itererar över flera kombinationer av de inställningar som du har angett och bestämmer vilken kombination av värden som ger den bästa modellen.

  4. För Antal besluts-DAG:er anger du det maximala antalet grafer som kan skapas i ensemblen.

  5. För Maximalt djup för besluts-DAG:er anger du det maximala djupet för varje graf.

  6. För Maximal bredd för besluts-DAG:erna anger du den maximala bredden för varje diagram.

  7. I Antal optimeringssteg per besluts-DAG-lager anger du hur många iterationer över data som ska utföras när du skapar varje DAG.

  8. Välj alternativet Tillåt okända värden för kategoriska funktioner för att skapa en grupp för okända värden i test- eller valideringsdata.

    Om du avmarkerar den kan modellen bara acceptera de värden som finns i träningsdata. I det första fallet kan modellen vara mindre exakt för kända värden, men den kan ge bättre förutsägelser för nya (okända) värden.

  9. Lägg till en taggad datauppsättning i experimentet och anslut en av träningsmodulerna.

    Anteckning

    Om du skickar ett parameterintervall till Train Model (Träna modell) används bara det första värdet i listan med parameterintervall.

    Om du skickar en enda uppsättning parametervärden till modulen Hyperparameters för tune model ignoreras värdena och standardvärdena för learner används när ett antal inställningar för varje parameter förväntas.

    Om du väljer alternativet Parameterintervall och anger ett enda värde för en parameter används det enskilda värde som du angav under hela omfånget, även om andra parametrar ändras över ett värdeintervall.

Resultat

När träningen är klar:

  • Om du vill använda modellen för bedömning ansluter du den till Poängmodell för att förutsäga värden för nya indataexempel.

Exempel

Exempel på hur beslutsfattarna används i maskininlärning finns i Azure AI Gallery:

Teknisk information

Det här avsnittet innehåller implementeringsinformation, tips och svar på vanliga frågor.

Användningstips

Om du har begränsade data eller vill minimera den tid som läggs på att träna modellen kan du prova de här inställningarna.

Begränsad träningsuppsättning

Om din träningsuppsättning är liten:

  • Skapa beslutsguggen genom att använda ett stort antal besluts-DAG:er (till exempel fler än 20).
  • Använd alternativet Bagging (Bagging ) för omsampling.
  • Ange ett stort antal optimeringssteg per DAG-lager (till exempel fler än 10 000).

Begränsad träningstid

Om träningsuppsättningen är stor men träningstiden är begränsad:

  • Skapa beslutsguggen med ett färre antal besluts-DAG:er (till exempel 5–10).
  • Använd alternativet Replikera för omsampling.
  • Ange ett mindre antal optimeringssteg per DAG-lager (till exempel mindre än 2 000).

Modulparametrar

Name Intervall Typ Standardvärde Description
Omsamplingsmetod Valfri OmsamplingMethod Uppsamlare Välj en omsamplingsmetod
Antal besluts-DAG:er >= 1 Integer 8 Ange antalet beslutsdiagram som ska byggas i ensemblen
Maximalt djup för besluts-DAG:er >= 1 Integer 32 Ange det maximala djupet för beslutsdiagrammen i ensemblen
Maximal bredd för besluts-DAG:er >= 8 Integer 128 Ange den maximala bredden för beslutsdiagrammen i ensemblen
Antal optimeringssteg per dag-lager för beslut >= 1000 Integer 2048 Ange antalet steg som ska användas för att optimera varje nivå i beslutsdiagrammen
Tillåt okända värden för kategoriska funktioner Valfri Boolesk Sant Ange om okända värden för befintliga kategoriska funktioner kan mappas till en ny, ytterligare funktion

Utdata

Namn Typ Description
Ej tränad modell ILearner-gränssnitt En otränad binär klassificeringsmodell

Se även

Klassificering
Beslutsklass med flera klasser
A-Z-modullista