Grunderna i datavetenskap för maskininlärning

Nybörjare
Medel
AI Engineer
Data Scientist
Developer
Student
Azure

Microsoft Learn tillhandahåller flera interaktiva sätt att få en introduktion till klassisk maskininlärning. Utbildningsvägarna gör dig produktiv på egen hand och är också en utmärkt grund för att gå vidare till djupinlärningsämnen.

Från de mest grundläggande klassiska maskininlärningsmodellerna till undersökande dataanalys och anpassning av arkitekturer, kommer du att vägledas av ett konceptuellt innehåll som är enkelt att förstå och interaktiva notebook-filer i Jupyter, utan att behöva lämna webbläsaren.

Välj din egen väg beroende på din utbildningsbakgrund och dina intressen.

✔ Alternativ 1: Hela kursen: Grunderna i datavetenskap för maskininlärning

Det här är det rekommenderade alternativet för de flesta. Den innehåller samma moduler som de andra två utbildningsvägarna, med ett anpassat flöde som maximerar förstärkningen av begrepp. Om du vill lära dig om både de underliggande begreppen och hur du kommer in i att skapa modeller med de vanligaste maskininlärningsverktygen är det här vägen för dig. Det är också den bästa vägen om du planerar att gå vidare från klassisk maskininlärning och få en utbildning i djupinlärning och neurala nätverk, vilket vi bara introducerar här.

✔ Du är just nu på den här sökvägen. Bläddra nedåt för att börja.

Alternativ 2: Utbildningsvägen Förstå datavetenskap för maskininlärning

Om du vill förstå hur maskininlärning fungerar och inte har så mycket matematisk bakgrund, passar den här vägen dig. Den förutsätter inte att du har någon tidigare utbildning (annat än en lätt förtrogenhet med kodningsbegrepp) och lär ut med koder, metaforer och bilder som ger dig en aha-upplevelse. Den är praktisk, men fokuserar mer på att förstå grunderna och mindre på kraften i de verktyg och bibliotek som finns tillgängliga.

Alternativ 3: Utbildningsvägen Skapa maskininlärningsmodeller

Om du redan har en uppfattning om vad maskininlärning handlar om eller om du har en stark matematisk bakgrund, kan det vara klokt att gå direkt in på utbildningsvägen Skapa maskininlärningsmodeller. De här modulerna lär ut några maskininlärningsbegrepp, men rör sig snabbt vidare till att använda verktyg som scikit-learn, TensorFlow och PyTorch. Utbildningsvägen är också den bästa för dig om du vill ha tillräckligt med kunskap för att förstå maskininlärningsexempel för produkter som Azure ML eller Azure Databricks.

Förutsättningar

Ingen

Moduler i den här utbildningsvägen

En övergripande översikt över maskininlärning för dig som har små eller inga kunskaper inom datavetenskap och statistik. Du introduceras för några viktiga begrepp, utforskar data och går interaktivt igenom livscykeln för maskininlärning – med hjälp av Python för att träna, spara och använda en maskininlärningsmodell, precis som i verkligheten.

Övervakad inlärning är en form av maskininlärning där en algoritm lär sig från exempel på data. Vi målar successivt upp en bild av hur man med övervakad inlärning automatiskt kan generera en modell som gör förutsägelser om den verkliga världen. Vi tar också upp hur dessa modeller testas och svårigheter som kan uppstå vid träning av dem.

För att maskininlärningsmodeller ska fungera behöver de tränas med data. Genom innehåll och övningar utforskar vi hur du förstår dina data, hur du kodar dem så att datorn kan tolka dem korrekt, hur du rensar eventuella fel och tips som hjälper dig att skapa modeller med höga prestanda.

Datautforskning och analys är kärnan i datavetenskap. Dataexperter kräver kunskaper i programmeringsspråk som Python för att utforska, visualisera och manipulera data.

Regression är utan tvekan den maskininlärningsteknik som används mest, bland annat inom forskning, affärsplanering och börsanalys. I det här utbildningsmaterialet tar vi en närmare titt på några vanliga regressionsanalyser, både enkla och mer komplexa, och du får en inblick i hur du kan utvärdera modellens prestanda.

När vi tänker på maskininlärning fokuserar vi ofta på träningsprocessen. En liten mängd förberedelser innan den här processen kan inte bara påskynda och förbättra inlärningen, utan också ge oss lite förtroende för hur väl våra modeller kommer att fungera när vi ställs inför data som vi aldrig har sett tidigare.

Regression är en vanlig typ av maskininlärning för att förutsäga numeriska värden.

Klassificering innebär att tilldela objekt i kategorier, eller kan även tänkas på automatiserat beslutsfattande. Här introducerar vi klassificeringsmodeller via logistisk regression, vilket ger dig en språngbräda mot mer komplexa och spännande klassificeringsmetoder.

Effektiviteten hos mer komplexa modeller kan ofta förbättras genom en manuell anpassning. Med hjälp av övningar och förklarande innehåll utforskar vi hur ändringar av arkitekturen i mer komplexa modeller kan ge mer effektiva resultat.

Hur vet vi om en modell är bra eller dålig på att klassificera våra data? Datorers sätt att utvärdera modellprestanda kan ibland vara svårt för oss att förstå eller ge en överdrivet förenklad bild av hur modellen kommer att bete sig i verkligheten. För att vi ska kunna skapa modeller som fungerar på ett tillfredsställande sätt måste vi hitta intuitiva sätt att utvärdera dem och förstå hur dessa mått kan ge upphov till bias.

ROC-kurvor (Receiver Operator Characteristic) är ett kraftfullt sätt att utvärdera och finjustera tränade klassificeringsmodeller. Vi introducerar och förklarar de här kurvorna genom utbildningsmaterial och praktiska övningar.

Klassificering är en typ av maskininlärning som används för att kategorisera objekt i klasser.

Klustring är en typ av maskininlärning som används för att gruppera liknande objekt i kluster.

Djupinlärning är en avancerad form av maskininlärning som emulerar hur den mänskliga hjärnan lär sig genom nätverk av anslutna neuroner.