Gépi tanulási modulok a ML Studio (klasszikus) moduljaiban

Fontos

A (klasszikus) Machine Learning Studio támogatása 2024. augusztus 31-én megszűnik. Javasoljuk, hogy addig térjen át az Azure Machine Learning használatára.

2021. december 1-től kezdve nem fog tudni létrehozni új (klasszikus) Machine Learning Studio-erőforrásokat. 2024. augusztus 31-ig továbbra is használhatja a meglévő (klasszikus) Machine Learning Studio-erőforrásokat.

A (klasszikus) ML Studio dokumentációjának kivezetése folyamatban van, és a jövőben nem várható a frissítése.

A gépi tanulás tipikus munkafolyamata számos fázisból áll:

  • A megoldani szükséges probléma azonosítása és az eredmények mérésére vonatkozó metrika.

  • A megfelelő adatok megkeresása, tisztítása és előkészítése.

  • A legjobb funkciók azonosítása és az új funkciók mérnöki tevékenységének azonosítása.

  • Modellek kiépítése, értékelése és finomhangolása.

  • Modellek használata előrejelzések, javaslatok és egyéb eredmények létrehozásához.

Az ebben a szakaszban található modulok eszközöket biztosítanak a gépi tanulás végső fázisaihoz, amelyekben egy algoritmust alkalmaz az adatokra a modell betanítása érdekében. Ezekben az utolsó fázisban pontszámokat is elő fog hozni, majd kiértékeli a modell pontosságát és hasznosságát.

Megjegyzés

A következőkre vonatkozik: Machine Learning Studio (klasszikus)

Hasonló húzással használható modulok érhetők el Azure Machine Learning tervezőben.

Gépi tanulási feladatok listája kategória szerint

A kísérleti munkafolyamat részletes leírását a hitelkockázati megoldás bemutatóban láthatja.

Előfeltételek

A modellek elkészítésének szórakoztató részéhez általában sok előkészületre van szükség. Ez a szakasz a Machine Learning Studio (klasszikus) eszközeire mutató hivatkozásokat tartalmaz, amelyek segíthetnek az adatok tisztításában, a bemenet minőségének javításában és a futásidővel kapcsolatos hibák megelőzésében.

Adatfeltárás és adatminőség

Győződjön meg arról, hogy az adatok a megfelelő adatok, a megfelelő mennyiség és a választott algoritmusnak megfelelő minőség. Tudja meg, mennyi adata van, és hogyan oszlik el. Vannak ki- és betekerők? Hogyan generálták ezeket, és mit jelentenek? Vannak duplikált rekordok?

Hiányzó értékek kezelés

A hiányzó értékek sokféleképpen befolyásolhatják az eredményeket. Például szinte minden statisztikai metódus elveti a hiányzó értékekkel kapcsolatos eseteket. Alapértelmezés szerint a Machine Learning a következő szabályokat követi, ha hiányzó értékkel lévő sorokkal találkozik:

  • Ha a modell betanítása által használt adatokból hiányoznak értékek, a rendszer kihagyja a hiányzó értékeket tartalmazó sorokat.

  • Ha egy modell pontozásakor bemenetként használt adatokból hiányoznak értékek, a rendszer a hiányzó értékeket használja bemenetként, de a null értékeket propagálja. Ez általában azt jelenti, hogy érvényes előrejelzés helyett null érték lesz beszúrva az eredményekbe.

A modell betanítása előtt ellenőrizze az adatokat. A hiányzó értékek beiklására vagy az adatok kijavítására használja ezt a modult:

Funkciók kiválasztása és dimenziócsökkentés

Machine Learning Studio (klasszikus) segítségével átszitálhatja az adatokat, hogy megtalálja a leghasznosabb attribútumokat.

Példák

A gépi tanulás gyakorlati példáiért lásd a Azure AI Gallery.

Tippekért és néhány tipikus adat-előkészítő feladat bemutatójért lásd: Útmutató a csapat adattudományi folyamatának végrehajtásához.

Lásd még