A gépi tanulás adattudományi alapjai
A Microsoft Learn számos interaktív módszert kínál a klasszikus gépi tanulás bemutatására. Ezek a képzési tervek önmagukban is eredményesek lesznek, és kiváló kiindulópontok a mélytanulási témakörökre való áttéréshez.
A legalapvetőbb klasszikus gépi tanulási modellektől kezdve a feltáró jellegű adatelemzésen és az architektúrák testreszabásán át a fogalmi tartalmak és az interaktív Jupyter-notebookok könnyen emészthetők, mindezt a böngésző elhagyása nélkül.
Az oktatási háttértől és érdeklődési köröktől függően válassza ki a saját útját.
✔ 1. lehetőség: A teljes kurzus: Az adatelemzés alapjai a gépi tanuláshoz
Ez az ajánlott lehetőség a legtöbb ember számára. Ugyanazokkal a modulokkal rendelkezik, mint a másik két képzési terv, és olyan egyéni folyamattal rendelkezik, amely maximalizálja a fogalmak megerősítését. Ha szeretné megismerni a mögöttes fogalmakat, valamint azt, hogyan hozhat létre modelleket a leggyakoribb gépi tanulási eszközökkel, ez az ön számára elérhető út. Ez a legjobb út, ha túl szeretne lépni a klasszikus gépi tanuláson, és mélytanulási és neurális hálózatokon tanul, amit csak itt mutatunk be.
✔ Jelenleg ezen az útvonalon jár, görgessen le a kezdéshez.
2. lehetőség: Az adatelemzés ismertetése a gépi tanulási képzési tervhez
Ha szeretné megérteni, hogyan működik a gépi tanulás, és nincs sok matematikai háttere, akkor ez az útvonal önnek szól. Nem feltételezi a korábbi oktatást (kivéve a kódolási fogalmak világos ismeretét), és kóddal, metaforával és vizualizációval tanít, amelyek ah ha pillanatot adnak. Ez gyakorlati megoldás, de inkább az alapok megértésére összpontosít, és kevésbé a rendelkezésre álló eszközök és kódtárak erejére.
3. lehetőség: Gépi tanulási modellek létrehozása képzési terv
Ha már van elképzelése arról, hogy miről szól a gépi tanulás, vagy erős matematikai háttérrel rendelkezik, akkor a legjobb, ha közvetlenül a Gépi tanulási modellek létrehozása képzési tervbe ugrik. Ezek a modulok néhány gépi tanulási fogalmat tanítanak, de gyorsan mozognak, hogy kihasználhassák az olyan eszközök használatát, mint a scikit-learn, a TensorFlow és a PyTorch. Ez a képzési terv akkor is a legjobb, ha elég jártasságot keres az olyan termékek gépi tanulási példáinak megértéséhez, mint az Azure ML vagy az Azure Databricks.
Előfeltételek
None
A képzési terv moduljai
A gépi tanulás átfogó bemutatása azok számára, akik kevéssé, vagy egyáltalán nem járatosak a számítástudományban és a statisztikában. Megismerkedhet a leglényegesebb fogalmakkal, adatokat tárhat fel, és interaktívan végigkísérheti a gépi tanulás életciklusát – miközben a Pythonnal ugyanúgy betanít, ment és felhasznál egy gépi tanulási modellt, ahogyan a valós életben tenné.
A felügyelt betanítás a gépi tanulásnak az a formája, amikor egy algoritmus példaadatokból tanul. Fokozatosan képet kapunk arról, ahogyan a felügyelt betanítás automatikusan generál egy, a valós világról előrejelzéseket tenni képes modellt. Azt is megvizsgáljuk, hogyan tesztelik ezeket a modelleket, és milyen nehézségek merülhetnek fel a betanításuk során.
A gépi tanulási modellek hatékonyságát a betanításukhoz használt adatok adják. Az átadott tartalmon és gyakorlatokon keresztül ismerkedhet meg az adatok értelmezésével, a számítógép által megfelelően értelmezhető kódolásával, és a hibáktól való megtisztításával, valamint tippeket kap a jó teljesítményt nyújtó modellek készítéséhez.
Az adatfeltárás és -elemzés az adatelemzés középpontjában áll. Az adatelemzőknek olyan nyelvekre van szükségük, mint a Python az adatok feltárásához, megjelenítéséhez és kezeléséhez.
Meglehet, hogy a regresszió a leggyakrabban használt gépi tanulási technika, amely gyakran áll a tudományos felfedezések, az üzleti tervezés és a tőzsdei piacelemzések hátterében. Ez a képzési anyag néhány gyakori regressziós elemzést mutat be, egyszerűeket és összetettebbeket egyaránt, és betekintést nyújt a modellek teljesítményének felmérésébe is.
Ha a gépi tanulásra gondolunk, gyakran a betanítási eljárás van az előtérben. Az ezt az eljárást megelőző csekély előkészülettel a betanítás nem csupán felgyorsítható és javítható, de általa magabiztosabbak lehetünk a modellek majdani teljesítményével kapcsolatban, amikor korábban nem látott adatokkal szembesülnek.
A besorolás azt jelenti, hogy elemeket rendelünk kategóriákhoz, vagy akár automatizált döntéshozatalra is gondolhatunk. Itt logisztikai regresszión keresztül mutatjuk be a besorolási modelleket, az összetettebb és izgalmasabb besorolási módszerek megismerésének kiindulópontjaként.
Az összetettebb modelleket gyakran manuálisan is testre lehet szabni, hogy javítsák azok hatékonyságát. Gyakorlatokon és magyarázó tartalmon keresztül tudhatjuk meg, hogyan vezethet hatékonyabb eredményekhez az összetettebb modellek architektúrájának megváltoztatása.
Honnan tudhatjuk, hogy egy modell jól vagy rosszul sorolja be az adatainkat? Az, ahogyan a számítógépek értékelik ki a modell teljesítményét, számunkra sokszor nehezen érthető, vagy éppen túl egyszerűen képzeljük el a modell működését a valós világban. Megfelelően működő modellek készítéséhez intuitív módot kell találnunk azok értékelésére, és tisztában kell lennünk azzal, ahogyan ezek a metrikák eltorzíthatják az ítéletünket.
A vevő működési karakterisztika (ROC) görbék a betanított besorolási modellek kiértékelésének és finomhangolásának hatékony eszközei. Ezeknek a görbéknek a hasznosságát mutatjuk be és magyarázzuk el képzési anyagok és gyakorlatok segítségével.