Genomsnittsperceptron med två klasser

Artikel
05/06/2019

Viktigt

Stödet för Machine Learning Studio (klassisk) upphör den 31 augusti 2024. Vi rekommenderar att du byter till Azure Machine Learning innan dess.

Från och med den 1 december 2021 kan du inte längre skapa nya Machine Learning Studio-resurser (klassisk). Du kan fortsätta att använda befintliga Machine Learning Studio-resurser (klassisk) till och med den 31 augusti 2024.

Dokumentationen om ML Studio (klassisk) håller på att dras tillbaka och kanske inte uppdateras i framtiden.

Skapar en binär klassificeringsmodell med genomsnittlig perceptron

Kategori: Machine Learning/initiera modell/klassificering

Anteckning

Gäller endast för: Machine Learning Studio (klassisk)

Liknande dra och släpp-moduler är tillgängliga i Azure Machine Learning designer.

Modulöversikt

I den här artikeln beskrivs hur du använder modulen Averaged Perceptron med två klasser i Machine Learning Studio (klassisk) för att skapa en maskininlärningsmodell som baseras på den genomsnittliga perceptronalgoritmen.

Den här klassificeringsalgoritmen är en metod för övervakad inlärning som kräver en taggad datamängd som innehåller en etikettkolumn. Du kan träna modellen genom att tillhandahålla modellen och den taggade datauppsättningen som indata för att träna modellen eller finjustera modellens hyperparametrar. Den tränade modellen kan sedan användas för att förutsäga värden för de nya indataexempel.

Mer om genomsnittsmodeller för perceptron

Den genomsnittliga perceptronmetoden är en tidig och mycket enkel version av ett neuralt nätverk. Med den här metoden klassificeras indata i flera möjliga utdata baserat på en linjär funktion och kombineras sedan med en uppsättning vikter som härleds från funktionsvektorn – därav namnet "perceptron".

De enklare perceptronmodellerna är lämpade för att lära sig linjärt åtskiljbara mönster, medan neurala nätverk (särskilt djupa neurala nätverk) kan modellera mer komplexa klassgränser. Perceptroner är dock snabbare, och eftersom de bearbetar fall seriellt kan perceptroner användas med kontinuerlig träning.

Så här konfigurerar Two-Class genomsnittlig perceptron

Lägg till modulen Averaged Perceptron (Genomsnittlig perceptron med två klasser) i experimentet i Studio (klassisk).
Ange hur du vill att modellen ska tränas genom att ange alternativet Skapa utbildarläge .
- Enskild parameter: Om du vet hur du vill konfigurera modellen anger du en specifik uppsättning värden som argument.
- Parameterintervall: Om du inte är säker på de bästa parametrarna kan du hitta de optimala parametrarna genom att ange flera värden och använda modulen Finjustera hyperparametrar för modell för att hitta den optimala konfigurationen. Utbildaren itererar över flera kombinationer av de inställningar som du har angett och avgör kombinationen av värden som ger den bästa modellen.
För Learning anger du ett värde för inlärningstakten. Värdena för inlärningstakt styr storleken på det steg som används i stochastic gradient descent varje gång modellen testas och korrigeras.

Genom att göra hastigheten mindre testar du modellen oftare, med risk för att du fastnar på en lokal platå. Genom att göra steget större kan du konvergera snabbare, med risk för att det sanna miniman skulle gå över.
I Maximalt antal iterationer anger du hur många gånger du vill att algoritmen ska undersöka träningsdata.

Att stoppa tidigt ger ofta bättre generalisering. Att öka antalet iterationer förbättrar anpassningen, med risk för överanpassande.
För Startvärde för slumptal kan du ange ett heltalsvärde som ska användas som startvärde. Vi rekommenderar att du använder ett seed om du vill säkerställa reproducerbarhet för experimentet mellan körningar.
Välj alternativet Tillåt okända kategoriska nivåer för att skapa en grupp för okända värden i tränings- och valideringsuppsättningarna. Modellen kan vara mindre exakt för kända värden, men den kan ge bättre förutsägelser för nya (okända) värden.

Om du avmarkerar det här alternativet kan modellen bara acceptera de värden som finns i träningsdata.
Anslut en datauppsättning för träning och en av utbildningsmodulerna:
- Om du ställer in läget Skapa utbildarepå Enkel parameter använder du modulen Träna modell.
- Om du ställer in läget Skapa utbildarepå Parameterintervall använder du modulen Hyperparametrar för finjusteringsmodell .
Anteckning

Om du skickar ett parameterintervall till Train Model (Träna modell) används bara det första värdet i listan med parameterintervall.

Om du skickar en enda uppsättning parametervärden till modulen Hyperparameters för tune model ignoreras värdena och standardvärdena för learner används när ett antal inställningar för varje parameter förväntas.

Om du väljer alternativet Parameterintervall och anger ett enda värde för en parameter används det enskilda värde som du angav under hela omfånget, även om andra parametrar ändras över ett värdeintervall.

Resultat

När träningen är klar:

Om du vill se en sammanfattning av modellens parametrar, tillsammans med funktionsvikterna som lärts in från träningen, högerklickar du på utdata från Träningsmodell eller Finjustera modellens hyperparametrar.

Exempel

Exempel på hur den här inlärningsalgoritmen används finns i Azure AI Gallery:

Korsvalidering för exempel på binära klassificerare: Jämför flera klassificeringsmodeller.

Teknisk information

Det här avsnittet innehåller implementeringsinformation, tips och svar på vanliga frågor.

Användningstips

För den här modelltypen är det bästa praxis att normalisera datauppsättningar innan du använder dem för att träna klassificeraren. Normaliseringsalternativ finns i Normalisera data.

Den genomsnittliga perceptronmodellen är en tidig och förenklad version av neurala nätverk. Därför fungerar det bra på enkla datauppsättningar när målet är hastighet över noggrannhet. Men om du inte får önskat resultat kan du prova någon av följande modeller:

Modulparametrar

Name	Intervall	Typ	Standardvärde	Description
Inlärningstakt	>=double. Epsilon	Float	1.0	Den inledande inlärningstakten för optimeringen av Stochastic Gradient Descent.
Maximalt antal iterationer	>= 1	Integer	10	Antalet iterationer av Stochastic Gradient Descent som ska utföras över träningsdatamängden.
Startnummer för slumptal	Valfri	Integer		Start seed för slumptalsgeneratorn som används av modellen. Lämna det tomt som standard.
Tillåt okända kategoriska nivåer	Valfri	Boolesk	Sant	Om det är Sant skapas ytterligare en nivå för varje kategorisk kolumn. Alla nivåer i testdatamängden som inte är tillgängliga i träningsdatamängden mappas till den här ytterligare nivån.

Utdata

Namn	Typ	Description
Ej tränad modell	ILearner-gränssnitt	En otränad binär klassificeringsmodell som kan anslutas till modulerna En-mot-alla – multiklass , Träna modell eller Kors validera modell.

Se även

Klassificering
A-Z-modullista