Förbättra modeller med hyperparametrar

Slutförd

Enkla modeller med små datamängder får ofta plats i ett enda steg, medan större datamängder och mer komplexa modeller måste vara lämpliga genom att upprepade gånger använda modellen med träningsdata och jämföra utdata med den förväntade etiketten. Om förutsägelsen är tillräckligt korrekt anser vi att modellen är tränad. Annars justerar vi modellen något och loopar igen.

Hyperparametrar är värden som ändrar hur modellen passar under dessa loopar. Inlärningsfrekvensen är till exempel en hyperparameter som anger hur mycket en modell justeras under varje träningscykel. En hög inlärningsfrekvens innebär att en modell kan tränas snabbare. men om den är för hög kan justeringarna vara så stora att modellen aldrig är "finjusterad" och inte optimal.

Förbearbeta data

Förbearbetning refererar till ändringar som du gör i dina data innan de skickas till modellen. Vi har tidigare läst att förbearbetning kan innebära att rensa datamängden. Även om detta är viktigt kan förbearbetning även omfatta ändring av dataformatet så att det blir enklare för modellen att använda. Data som beskrivs som "röd", "orange", "gul", "kalk" och "grön" kan till exempel fungera bättre om de konverteras till ett format som är mer inbyggt i datorer, till exempel siffror som anger mängden rött och mängden grönt.

Skalningsfunktioner

Det vanligaste förbearbetningssteget är att skala funktioner så att de hamnar mellan noll och ett. Till exempel kan vikten på en cykel och avståndet en person färdas på en cykel vara två mycket olika tal, men genom att skala båda talen till mellan noll och en kan modeller lära sig mer effektivt från data.

Använda kategorier som funktioner

Inom maskininlärning kan du också använda kategoriska funktioner som "cykel", "skateboard" eller "bil". Dessa funktioner representeras av 0 eller 1 värden i en-heta vektorer; vektorer som har 0 eller 1 för varje möjligt värde. Cykel, skateboard och bil kan till exempel vara (1,0,0), (0,1,0) respektive (0,0,1).