Beslutsklass med flera klasser

Artikel
05/06/2019

Viktigt

Stödet för Machine Learning Studio (klassisk) upphör den 31 augusti 2024. Vi rekommenderar att du byter till Azure Machine Learning innan dess.

Från och med den 1 december 2021 kan du inte längre skapa nya Machine Learning Studio-resurser (klassisk). Du kan fortsätta att använda befintliga Machine Learning Studio-resurser (klassisk) till och med den 31 augusti 2024.

Dokumentationen om ML Studio (klassisk) håller på att dras tillbaka och kanske inte uppdateras i framtiden.

Skapar en klassificeringsmodell med flera klasser med beslutsalgoritmen

Kategori: Machine Learning/initiera modell/klassificering

Anteckning

Gäller endast för: Machine Learning Studio (klassisk)

Liknande dra och släpp-moduler är tillgängliga i Azure Machine Learning designer.

Modulöversikt

Den här artikeln beskriver hur du använder modulen Multiclass Decision Module i Machine Learning Studio (klassisk) för att skapa en maskininlärningsmodell som baseras på en övervakad inlärningsalgoritm som kallas beslutsfattare.

Du definierar modellen och dess parametrar med hjälp av den här modulen och ansluter sedan en märkt träningsdatauppsättning för att träna modellen med någon av träningsmodulerna. Den tränade modellen kan användas för att förutsäga ett mål som har flera värden.

Mer om beslutsfattare

Beslutsskogar är en ny utökning av beslutsskogar. En beslutsgraf består av en ensemble med besluts riktade acykliska grafer (DAG: er).

Beslutsfördelar har följande fördelar:

Genom att låta trädgrenar sammanslå har ett besluts-DAG vanligtvis ett lägre minnesfotavtryck och bättre generaliseringsprestanda än ett beslutsträd, även om det kostar lite längre träningstid.
Beslutsmodeller är icke-parametrisbaserade modeller som kan representera icke-linjära beslutsgränser.
De utför val och klassificering av integrerade funktioner och är motståndskraftiga när det förekommer brusfunktioner.

Mer information om forskningen bakom den här maskininlärningsalgoritmen finns i Decision Hashs: Compact and Rich Models for Classification (nedladdningsbar PDF).

Så här konfigurerar du beslutsmodell med flera klasser

Lägg till modulen Multiclass Decision Module i experimentet i Studio (klassisk). Du hittar den här modulen under Machine Learning, Initiera modell och Klassificering.
Dubbelklicka på modulen för att öppna fönstret Egenskaper.
Omsamplingsmetod väljer du metoden för att skapa flera träd, antingen felsökning eller replikering.
- Felsökning: Välj det här alternativet om du vill använda bagging, även kallat bootstrap-aggregering.
  
  Varje träd i en beslutsskog matar ut en gaussisk fördelning via förutsägelse. Aggregeringen är att hitta en Gaussian vars första två ögonblick matchar den tid då blandning av Gaussianer ges genom att kombinera alla gaussianer som returneras av enskilda träd.
- Replikera: Välj det här alternativet om du vill använda replikering. I den här metoden tränas varje träd på exakt samma indata. Bestämningen av vilket delat predikat som används för varje trädnod förblir slumpmässig, så olika träd skapas.
Ange hur du vill att modellen ska tränas genom att ange alternativet Skapa utbildarläge .
- Enskild parameter: Använd det här alternativet när du vet hur du vill konfigurera modellen.
- Parameterintervall: Använd det här alternativet om du inte är säker på de bästa parametrarna och vill använda en parametersökning.
Antal besluts-DAG:er: Ange det maximala antalet grafer som kan skapas i ensemblen.
Högsta djup för besluts-DAG:er: Ange det maximala djupet för varje graf.
Högsta bredd för besluts-DAG:er: Ange den maximala bredden för varje graf.
Antal optimeringssteg per dag-lager för beslut: Ange hur många iterationer av data som ska utföras när du skapar varje DAG.
Tillåt okända värden för kategoriska funktioner: Välj det här alternativet om du vill skapa en grupp för okända värden i test- eller valideringsdata. Modellen kan vara mindre exakt för kända värden, men den kan ge bättre förutsägelser för nya (okända) värden.

Om du avmarkerar det här alternativet kan modellen bara acceptera värden som fanns i träningsdata.
Anslut en märkt datauppsättning och en av utbildningsmodulerna:
- Om du ställer in läget Skapa utbildarepå Enkel parameter använder du modulen Träna modell.
- Om du ställer in läget Skapa utbildarepå Parameterintervall använder du modulen Hyperparametrar för finjusteringsmodell . Med det här alternativet itererar algoritmen över flera kombinationer av de inställningar som du angav och avgör kombinationen av värden som ger den bästa modellen.
Anteckning

Om du skickar ett parameterintervall till Train Model (Träna modell) används bara det första värdet i listan med parameterintervall.

Om du skickar en enda uppsättning parametervärden till modulen Hyperparameters för tune model ignoreras värdena och standardvärdena för learner används när ett antal inställningar för varje parameter förväntas.

Om du väljer alternativet Parameterintervall och anger ett enda värde för en parameter används det enskilda värde som du angav under hela omfånget, även om andra parametrar ändras över ett värdeintervall.
Kör experimentet.

Resultat

När träningen är klar:

Om du vill använda modellen för bedömning ansluter du den till Poängmodell för att förutsäga värden för nya indataexempel.

Exempel

Exempel på hur beslutsskogar används i maskininlärning finns i Azure AI Gallery:

Jämför exempel på klassificerare med flera klasser: Använder flera algoritmer och diskuterar deras för- och nackdelar.

Teknisk information

Det här avsnittet innehåller implementeringsinformation, tips och svar på vanliga frågor.

Mer information om träningsprocessen med alternativet Replikera finns i:

Beslutsskogar för analys av datorseende och medicinska bilder. Criminisi och Shotton. Springer 2013

Användningstips

Om du har begränsade data eller vill minimera den tid som läggs på att träna modellen kan du prova följande rekommendationer:

Begränsad träningsuppsättning

Om träningsuppsättningen innehåller ett begränsat antal instanser:

Skapa beslutsguggen med ett stort antal besluts-DAG:er (till exempel fler än 20)
Använd alternativet Bagging (Bagging ) för omsampling.
Ange ett stort antal optimeringssteg per DAG-lager (till exempel fler än 10 000).

Begränsad träningstid

Om träningsuppsättningen innehåller ett stort antal instanser och träningstiden är begränsad:

Skapa beslutsguggen som använder ett mindre antal besluts-DAG:er (till exempel 5–10).
Använd alternativet Replikera för omsampling.
Ange ett mindre antal optimeringssteg per DAG-lager (till exempel mindre än 2 000).

Modulparametrar

Name	Intervall	Typ	Standardvärde	Description
Omsamplingsmetod	Valfri	OmsamplingMethod	Uppsamlare	Välj en omsamplingsmetod
Antal besluts-DAG:er	>= 1	Integer	8	Ange antalet beslutsdiagram som kan skapas i ensemblen
Maximalt djup för besluts-DAG:er	>= 1	Integer	32	Ange det maximala djupet för beslutsdiagrammen som ska skapas i ensemblen
Maximal bredd för besluts-DAG:er	>= 8	Integer	128	Ange den maximala bredden för beslutsdiagrammen som ska skapas i ensemblen
Antal optimeringssteg per dag-lager för beslut	>= 1000	Integer	2048	Ange antalet steg som ska användas för att optimera varje nivå i beslutsdiagrammen
Tillåt okända värden för kategoriska funktioner	Valfri	Boolesk	Sant	Ange om okända värden för befintliga kategoriska funktioner kan mappas till en ny, ytterligare funktion

Utdata

Namn	Typ	Description
Ej tränad modell	ILearner-gränssnitt	En otränad klassificeringsmodell med flera klasser

Se även

Beslutsklass med två klasser
Klassificering
A-Z-modullista