Modell betanítása

Cikk
05/06/2019

Fontos

A (klasszikus) Machine Learning Studio támogatása 2024. augusztus 31-én megszűnik. Javasoljuk, hogy addig térjen át az Azure Machine Learning használatára.

2021. december 1-től kezdve nem fog tudni létrehozni új (klasszikus) Machine Learning Studio-erőforrásokat. 2024. augusztus 31-ig továbbra is használhatja a meglévő (klasszikus) Machine Learning Studio-erőforrásokat.

További információ a gépi tanulási projektek a ML Studióból a klasszikusból a Azure Machine Learning.
További információ a Azure Machine Learning.

A (klasszikus) ML Studio dokumentációjának kivezetése folyamatban van, és a jövőben nem várható a frissítése.

Besorolási vagy regressziós modell felügyelt módon történő beképzása

Kategória: Machine Learning / Betanítás

Megjegyzés

A következőkre vonatkozik: Machine Learning Studio (klasszikus)

Hasonló húzással használható modulok érhetők el Azure Machine Learning tervezőben.

A modul áttekintése

Ez a cikk azt ismerteti, hogyan használható a Machine Learning Studio Modell betanítása modulja egy besorolási vagy regressziós modell betanítására. A betanítás azután történik, hogy definiált egy modellt és beállította annak paramétereit, és címkézett adatokat igényel. A Train Model (Modell betanítása) lehetőség használatával újra betaníthat egy meglévő modellt új adatokkal.

A betanítási folyamat működése

A Machine Learning gépi tanulási modell létrehozása és használata általában három lépésből áll.

A modellt egy adott algoritmustípus kiválasztásával, valamint a paraméterek vagy hiperparaméterek meghatározásával konfigurálhatja. Válassza ki az alábbi modelltípusok bármelyikét:
- Neurális hálózatokon, döntési fákon, döntési erdőkön és más algoritmuson alapuló besorolási modellek.
- Regressziós modellek, amelyek standard lineáris regressziót tartalmazhatnak, vagy más algoritmusokat, például neurális hálózatokat és Bays-regressziót használhatnak.
Adjon meg egy címkével jelölt adatkészletet, amely az algoritmussal kompatibilis adatokkal rendelkezik. Csatlakozás az adatokat és a modellt is a modell betanítása érdekében.

A betanítás egy adott bináris formátumot hoz létre, az iLearnert, amely az adatokból megtanult statisztikai mintákat beágyazza. Ezt a formátumot nem módosíthatja vagy olvashatja közvetlenül; A Studio többi modulja (klasszikus) azonban használhatja ezt a betanított modellt.

A modell tulajdonságait is megtekintheti. További információkért lásd az Eredmények szakaszt .
A betanítás befejezése után használja a betanított modellt az egyik pontozási modullal , hogy előrejelzéseket készítsen az új adatokról.

Megjegyzés

Más speciális gépi tanulási feladatokhoz különböző betanító módszerekre van szükség, és a Studio (klasszikus) külön képzési modulokat biztosít számukra. Például a képészlelés, a fürtözés és az anomáliadetektálás mind egyéni betanítési módszereket használ. A Train Model (Modell betanítása) csak regressziós és besorolási modellekkel való használatra szolgál.

Felügyelt és felügyelet nélküli képzés

Lehet, hogy hallotta már a felügyelt vagy a felügyelet nélküli tanulás kifejezéseket. Egy besorolási vagy regressziós modell betanítása a Modell betanítása segítségével klasszikus példa a felügyelt gépi tanulásra. Ez azt jelenti, hogy meg kell adnia egy adatkészletet, amely előzményadatokat tartalmaz, amelyekből mintákat tanulhat. Az adatoknak tartalmaznia kell az előrejelezni próbált eredményt (címkét) és a kapcsolódó tényezőket (változókat). A gépi tanulási modellnek szüksége van az eredményekre az eredmények legjobb előrejelzéséhez szükséges jellemzők meghatározásához.

A betanítási folyamat során az adatok eredmények szerint vannak rendezve, és az algoritmus statisztikai mintákat von ki a modell felépítéséhez.

A nem felügyelet nélküli tanulás azt jelzi, hogy az eredmény ismeretlen, vagy ha úgy dönt, hogy nem használ ismert címkéket. A fürtözési algoritmusok például általában nem felügyelet nélküli tanulási módszereket alkalmaznak, de használhatnak címkéket, ha elérhetők. Egy másik példa a témakörmodellezés az LDA használatával. Ezekkel az algoritmusokkal nem használható a Modell betanítása.

Tipp

Még csak most tanulja a gépi tanulást? Ez az oktatóanyag végigvezeti az adatok beszerzésének, az algoritmus konfigurálásának, a betanításnak és a modell használatának folyamatán: Az első gépi tanulási kísérlet létrehozása

Modell betanításának használata

A Machine Learning Studióban (klasszikus) konfigurálja a besorolási modellt vagy a regressziós modellmodelleket.

Az R-modell létrehozása használatával létrehozott egyéni modellt is betaníthat.
Adja hozzá a kísérlethez a Train Model (Modell betanítása) modult. Ezt a modult a következő kategóriában találja Machine Learning kategóriában. Bontsa ki a Betanítás bontsa ki, majd húzza a kísérletbe a Modell betanítása modult.
A bal oldali bemeneten csatolja a nem képezett módot. Csatolja a betanítás adatkészletet a Train Model (Modell betanítása) jobb oldali bemenetéhez.

A betanítás adatkészletének tartalmaznia kell egy címkeoszlopot. A rendszer figyelmen kívül hagyja a címkék nélküli sorokat.
A Címke oszlop esetében kattintson az Oszlopválasztó indítása elemre, és válasszon ki egyetlen oszlopot, amely a modell által a betanításhoz használható eredményeket tartalmazza.
- Besorolási problémák esetén a címkeoszlopnak kategorikus vagy különálló értékeket kell tartalmaznia . Néhány példa lehet az igen/nem minősítés, a betegség osztályozási kódja vagy neve, vagy egy bevételi csoport. Ha nem kategorikus oszlopot választ, a modul hibát ad vissza a betanítás során.
- Regressziós problémák esetén a címkeoszlopnak a válaszváltozónak megfelelő numerikus adatokat kell tartalmaznia. Ideális esetben a numerikus adatok folyamatos skálát képviselnek.
Ilyen lehet például a hitelkockázati pontszám, a merevlemez meghibásodásának előre jelzett ideje, vagy egy adott napon vagy időpontban a hívóközpont felé intézett hívások előre jelzett száma. Ha nem numerikus oszlopot választ, hibaüzenetet kap.
- Ha nem adja meg, hogy melyik címkeoszlopot használja, Machine Learning az adatkészlet metaadatai alapján megpróbálja kiveszni, hogy melyik a megfelelő címkeoszlop. Ha nem a megfelelő oszlopot választja ki, az oszlopválasztóval javítsa ki.
Tipp

Ha problémája van az oszlopválasztó használatával, tippekért tekintse meg a Select Columns in Dataset ( Adatkészlet oszlopainak kijelölése) cikket. Ismertet néhány gyakori forgatókönyvet és tippet a WITH RULES és a BY NAME beállítások használatához .
Futtassa a kísérletet. Ha sok adata van, ez egy kis ideig is el fog tetsszen.

Results (Eredmények)

A modell betanítás után:

A modellparaméterek és a jellemzősúlyok megtekintéséhez kattintson a jobb gombbal a kimenetre, és válassza a Képi megjelenítés lehetőséget.
Ha más kísérletekben is használni kívánt modellt, kattintson a jobb gombbal a modellre, és válassza a Modell mentése lehetőséget. Adja meg a modell nevét.

Ez olyan pillanatképként menti a modellt, amelyet nem frissít a kísérlet ismételt futtatása.
Ha a modellt új értékek előrejelzéséhez szeretne használni, csatlakoztassa a Modell pontozása modulhoz az új bemeneti adatokkal együtt.

Ha olyan modellt kell betanítanunk, amelyet a Modell betanítás nem támogat, több lehetőség közül választhat:

Hozzon létre egy egyéni pontozási metódust R-szkript használatával, vagy használja az elérhető számos R pontozási csomag valamelyikét.
- R-modell létrehozása
- R-szkript végrehajtása
Írjon egy saját Python-szkriptet egy modell betanítához és pontozásához, vagy használjon egy meglévő Python-kódtárat:
- Python-szkript futtatása
Anomáliadetektálási modellek
- Az Anomáliadetektálási modell betanítése a Studio (klasszikus) anomáliadetektálási moduljait támogatja.
Javaslatmodellek
- Ha a modell az Machine Learning által ajánlott Matchboxot használja, használja a Train Matchbox Recommender modult.
- Ha más algoritmust használ a market basket elemzéshez vagy javaslathoz, használja a betanítás módszereit R-szkriptben vagy Python-szkriptben.
Fürtözési modellek
- A mellékelt K-means algoritmushoz használja a Fürtözési modell betanítása algoritmust.
- Más fürtözési modellek esetében R-szkript vagy Python-szkriptmodulok használatával konfigurálhatja és betaníthatja a modelleket.

Példák

A Modell betanítás modul machine learning-kísérletekben való használatára vonatkozó példákért tekintse meg ezeket a kísérleteket a Azure AI Gallery:

Kiskereskedelmi előrejelzés: Bemutatja, hogyan lehet több modellt összeépíteni, betanítani és összehasonlítani.
Repülőjárat késésének előrejelzése: Bemutatja, hogyan lehet több kapcsolódó besorolási modellt betanítani.

Várt bemenetek

Név	Típus	Description
Nem képezett modell	ILearner interfész	Nem képezett tanuló
Adathalmaz	Adattábla	Betanítási adatok

Modulparaméterek

Name	Tartomány	Típus	Alapértelmezett	Description
Felirat oszlop	bármelyik	ColumnSelection (Oszlopválasztás)		Válassza ki azt az oszlopot, amely a címke vagy az eredmény oszlopot tartalmazza

Kimenetek

Név	Típus	Description
Betanított modell	ILearner interfész	Betanított tanuló

Kivételek

A modulhibák listájáért lásd: Modul hibakódok.

Kivétel	Description
0032-es hiba	Kivétel akkor fordul elő, ha az argumentum nem szám.
0033-as hiba	Kivétel akkor fordul elő, ha az argumentum végtelen.
0083-as hiba	Kivétel akkor fordul elő, ha a betanításhoz használt adatkészlet nem használható konkrét tanulótípushoz.
0035-ös hiba	Kivétel akkor fordul elő, ha nem biztosítanak szolgáltatásokat egy adott felhasználóhoz vagy elemhez.
0003-as hiba	Kivétel akkor fordul elő, ha egy vagy több bemenet null vagy üres.
0020-as hiba	Kivétel akkor fordul elő, ha a modulnak átadott egyes adatkészletek oszlopainak száma túl kicsi.
0021-es hiba	Kivétel akkor fordul elő, ha a modulnak átadott egyes adathalmazok sorai túl kicsik.
0013-as hiba	Kivétel akkor fordul elő, ha a modul tanulója számára átadott típus érvénytelen.

Lásd még

Modell értékelése
A-Z modullista