Maskininlärningsmoduler i Azure Machine Learning Studio (klassisk)

Det typiska arbetsflödet för maskininlärning omfattar många faser:

  • Identifiera ett problem att lösa och ett mått för att mäta resultat.

  • Hitta, rensa och förbereda lämpliga data.

  • Identifiera de bästa funktionerna och skapa nya funktioner.

  • Skapa, utvärdera och justera modeller.

  • Använda modeller för att generera förutsägelser, rekommendationer och andra resultat.

Modulerna i det här avsnittet innehåller verktyg för de sista faserna i maskininlärning, där du tillämpar en algoritm på data för att träna en modell. I de här sista faserna genererar du även poäng och utvärderar sedan modellens noggrannhet och användbarhet.

Anteckning

Gäller för: Machine Learning Studio (klassisk)

Det här innehållet gäller endast Studio (klassisk). Liknande dra-och släpp moduler har lagts till i Azure Machine Learning designer. Mer information i den här artikeln är att jämföra de två versionerna.

Lista över maskininlärningsuppgifter efter kategori

  • Initiera modell

    Välj bland en mängd olika anpassningsbara maskininlärningsalgoritmer, inklusive modellerför klustring, regression,klassificering och avvikelseidentifiering.

  • Träna

    Ange dina data till den konfigurerade modellen för att lära dig av mönster och skapa statistik som kan användas för förutsägelser.

  • Poäng

    Skapa förutsägelser med hjälp av tränade modeller.

  • Utvärdera

    Mät noggrannheten för en tränad modell eller jämför flera modeller.

En detaljerad beskrivning av det här experimentella arbetsflödet finns i genomgången av kreditrisklösningen.

Förutsättningar

Innan du kommer till den roliga delen av att skapa en modell krävs vanligtvis en hel del förberedelser. Det här avsnittet innehåller länkar till verktyg i Machine Learning Studio (klassisk) som kan hjälpa dig att rensa data, förbättra kvaliteten på indata och förhindra körningsfel.

Datagranskning och datakvalitet

Se till att dina data är rätt typ av data, rätt kvantitet och rätt kvalitet för algoritmen som du har valt. Förstå hur mycket data du har och hur de distribueras. Finns det avvikande värden? Hur genererades de och vad betyder de? Finns det dubblettposter?

Hantera saknade värden

Saknade värden kan påverka resultatet på många sätt. Till exempel ignorerar nästan alla statistiska metoder fall med saknade värden. Som standard följer Machine Learning dessa regler när den påträffar rader med saknade värden:

  • Om data som används för att träna en modell har saknade värden hoppas alla rader med saknade värden över.

  • Om data som används som indata vid bedömning mot en modell saknar värden används de saknade värdena som indata, men null-värden sprids. Det innebär vanligtvis att ett null-värde infogas i resultatet i stället för en giltig förutsägelse.

Se till att kontrollera dina data innan du tränar din modell. Använd den här modulen för att imputera saknade värden eller korrigera dina data:

Välja funktioner och minska dimensionaliteten

Machine Learning Studio (klassisk) kan hjälpa dig att gå igenom dina data för att hitta de mest användbara attributen.

Välja en lämplig algoritm

Det problem som du försöker lösa avgör både valet av data som ska användas i analysen och valet av en algoritm.

Mer information finns i Så här väljer du en algoritm i Azure Machine Learning.

Exempel

Exempel på maskininlärning i praktiken finns i Azure AI Gallery.

Tips och en genomgång av några vanliga dataförberedelseaktiviteter finns i Genomgångarsom kör Team Data Science Process .

Se även