Oktatóanyag: Besorolási modell betanítása kód nélküli AutoML-vel az Azure Machine Tanulás Studióban

Megtudhatja, hogyan taníthat be egy besorolási modellt kód nélküli AutoML-vel az Azure Machine Tanulás automatizált gépi tanulással az Azure Machine Tanulás studióban. Ez a besorolási modell azt jelzi előre, hogy az ügyfél előfizet-e egy pénzügyi intézménynél rögzített lejáratú betétre.

Az automatizált gépi tanulással automatizálhatja az időigényes feladatokat. Az automatizált gépi tanulás gyorsan iterálja az algoritmusok és hiperparaméterek számos kombinációját, hogy segítsen megtalálni a legjobb modellt a választott sikermetrika alapján.

Ebben az oktatóanyagban nem fog kódot írni, a stúdió felületével fogja elvégezni a betanítást. Megtudhatja, hogyan végezheti el a következő feladatokat:

  • Azure Machine Tanulás-munkaterület létrehozása.
  • Automatizált gépi tanulási kísérlet futtatása.
  • A modell részleteinek megismerése.
  • Telepítse a javasolt modellt.

Próbálja ki az automatizált gépi tanulást is az alábbi modelltípusokhoz:

Előfeltételek

  • Azure-előfizetés. Ha nem rendelkezik Azure-előfizetéssel, hozzon létre egy ingyenes fiókot.

  • Töltse le a bankmarketing_train.csv adatfájlt. Az y oszlop azt jelzi, hogy egy ügyfél előfizetett-e egy rögzített lejáratú betétre, amely később az oktatóanyag előrejelzéseinek céloszlopaként lesz azonosítva.

Munkaterület létrehozása

Az Azure Machine Tanulás-munkaterület egy alapvető erőforrás a felhőben, amelyet gépi tanulási modellek kísérletezésére, betanítására és üzembe helyezésére használ. Az Azure-előfizetést és az erőforráscsoportot egy könnyen felhasznált objektumhoz konfigurálja a szolgáltatásban.

Ebben az oktatóanyagban végezze el a következő lépéseket egy munkaterület létrehozásához és az oktatóanyag folytatásához.

  1. Bejelentkezés az Azure Machine Tanulás Studióba

  2. Válassza a Munkaterület létrehozása lehetőséget

  3. Adja meg a következő információkat az új munkaterület konfigurálásához:

Mező Leírás
Munkaterület neve Adjon meg egy egyedi nevet, amely azonosítja a munkaterületet. A neveknek egyedinek kell lenniük az erőforráscsoportban. Olyan nevet használjon, amely könnyen visszahívható, és megkülönböztethető a mások által létrehozott munkaterületektől. A munkaterület neve nem érzéketlen.
Előfizetés Válassza ki a használni kívánt Azure-előfizetést.
Erőforráscsoport Az előfizetés valamelyik meglévő erőforráscsoportját használja, vagy adjon meg egy nevet új erőforráscsoport létrehozásához. Az erőforráscsoportok egy Azure-megoldáshoz kapcsolódó erőforrásokat tárolnak. Meglévő erőforráscsoport használatához közreműködői vagy tulajdonosi szerepkörre van szükség. A hozzáféréssel kapcsolatos további információkért tekintse meg az Azure Machine-Tanulás-munkaterülethez való hozzáférés kezelését ismertető témakört.
Régió Válassza ki a felhasználókhoz legközelebbi Azure-régiót és az adaterőforrásokat a munkaterület létrehozásához.
  1. A munkaterület létrehozásához válassza a Létrehozás lehetőséget

Az Azure-erőforrásokról a jelen cikkben ismertetett lépésekben talál további információt: Erőforrások létrehozása az első lépésekhez.

Ha más módon szeretne munkaterületet létrehozni az Azure-ban, az Azure Machine Tanulás munkaterületek kezelése a portálon vagy a Python SDK-val (v2).

Automatizált gép Tanulás feladat létrehozása

A következő kísérlet beállítási és futtatási lépéseit az Azure Machine Tanulás Studióban https://ml.azure.comhajthatja végre egy konszolidált webes felületen, amely gépi tanulási eszközöket tartalmaz az adatelemzési forgatókönyvek elvégzéséhez az adatelemzési szakemberek számára minden készségszinten. A stúdió nem támogatott az Internet Explorer böngészőkben.

  1. Válassza ki az előfizetést és a létrehozott munkaterületet.

  2. A bal oldali panelen válassza az Automatizált gépi tanulás lehetőséget a Szerzői szakasz alatt.

    Mivel ez az első automatizált gépi tanulási kísérlete, egy üres lista és a dokumentációra mutató hivatkozások jelennek meg.

    Get started page

  3. Válassza az +Új automatizált gépi tanulási feladat lehetőséget.

Adathalmaz létrehozása és betöltése adategységként

A kísérlet konfigurálása előtt töltse fel az adatfájlt a munkaterületre egy Azure Machine Tanulás adategység formájában. Ebben az oktatóanyagban egy adategységet tekinthet az AutoML-feladat adatkészletének. Ezzel biztosíthatja, hogy az adatok megfelelően legyenek formázva a kísérlethez.

  1. Hozzon létre egy új adategységet a helyi fájlokból lehetőséget választva a +Adategység létrehozása legördülő listában.

    1. Az Alapszintű információs űrlapon adjon nevet az adategységnek, és adjon meg egy opcionális leírást. Az automatizált gépi tanulási felület jelenleg csak a TabularDataset-eket támogatja, ezért az adathalmaz típusának alapértelmezés szerint táblázatosnak kell lennie.

    2. A bal alsó sarokban válassza a Tovább gombot

    3. Az Adattár és a fájlkijelölési űrlapon válassza ki az alapértelmezett adattárat, amely automatikusan be lett állítva a munkaterület létrehozásakor, a workspaceblobstore (Azure Blob Storage) szolgáltatásban. Itt töltheti fel az adatfájlt, hogy elérhetővé tegye a munkaterületen.

    4. Válassza a Fájlok feltöltése lehetőséget a Feltöltés legördülő listában.

    5. Válassza ki a bankmarketing_train.csv fájlt a helyi számítógépen. Ez az előfeltételként letöltött fájl.

    6. A bal alsó sarokban található Tovább gombra kattintva feltöltheti azt a munkaterület létrehozása során automatikusan beállított alapértelmezett tárolóba.

      Amikor a feltöltés befejeződött, a Gépház és az előnézeti űrlap előre ki lesz töltve a fájltípus alapján.

    7. Ellenőrizze, hogy az adatok megfelelően formázva van-e a sémaűrlapon keresztül. Az adatokat az alábbiak szerint kell kitölteni. Miután ellenőrizte, hogy az adatok pontosak-e, válassza a Tovább gombot.

      Mező Leírás Az oktatóanyag értéke
      Fájlformátum Meghatározza a fájlban tárolt adatok elrendezését és típusát. Tagolt
      Elválasztókarakter Egy vagy több karakter a különálló, független régiók közötti határ megadásához egyszerű szöveges vagy más adatfolyamokban. Vessző
      Kódolás Meghatározza, hogy milyen bitet használjon a sématábla az adathalmaz olvasásához. UTF-8
      Oszlopfejlécek Azt jelzi, hogy az adathalmaz fejlécei (ha vannak ilyenek) hogyan lesznek kezelve. Minden fájl fejléce azonos
      Sorok kihagyása Azt jelzi, hogy a program hány sort hagy ki az adathalmazból, ha vannak ilyenek. Egyik sem
    8. A sémaűrlap lehetővé teszi a kísérlet adatainak további konfigurálását. Ebben a példában válassza ki a day_of_week kapcsolót, hogy ne vegye fel. Válassza a Tovább lehetőséget. Schema form

    9. A Részletek megerősítése űrlapon ellenőrizze, hogy az adatok megegyeznek-e az Alapadatok, az Adattár és a fájlkijelölés, valamint a Gépház és az előnézeti űrlapokon korábban kitöltött adatokkal.

    10. Válassza a Létrehozás lehetőséget az adathalmaz létrehozásának befejezéséhez.

    11. Jelölje ki az adathalmazt, amint megjelenik a listában.

    12. Tekintse át az adatokat úgy, hogy kiválasztja az adategységet, és megtekinti a feltöltött előnézeti lapot, hogy meggyőződjön arról, hogy nem tartalmazott day_of_week, majd válassza a Bezárás lehetőséget.

    13. Válassza a Tovább lehetőséget.

Feladat konfigurálása

Az adatok betöltése és konfigurálása után beállíthatja a kísérletet. Ez a beállítás magában foglalja a kísérlettervezési feladatokat, például a számítási környezet méretének kiválasztását és az előrejelezni kívánt oszlop megadását.

  1. Válassza az Új rádió létrehozása gombot.

  2. Töltse ki a Feladat konfigurálása űrlapot az alábbiak szerint:

    1. Adja meg a kísérlet nevét: my-1st-automl-experiment

    2. Válassza az y lehetőséget céloszlopként, amit előre szeretne jelezni. Ez az oszlop azt jelzi, hogy az ügyfél előfizetett-e a lekötött betétre.

    3. Számítási típusként válassza ki a számítási fürtöt .

    4. A számítási cél egy helyi vagy felhőalapú erőforrás-környezet, amely a betanítási szkript futtatására vagy a szolgáltatás üzembe helyezésének üzemeltetésére szolgál. Ebben a kísérletben kipróbálhat egy felhőalapú kiszolgáló nélküli számítást (előzetes verzió), vagy létrehozhat saját felhőalapú számítást.

      1. A kiszolgáló nélküli számítás használatához engedélyezze az előzetes verziójú funkciót, válassza a Kiszolgáló nélküli lehetőséget, és hagyja ki a többi lépést.
      2. Saját számítási cél létrehozásához válassza az +Új lehetőséget a számítási cél konfigurálásához.
        1. Töltse ki a Virtuális gép kiválasztása űrlapot a számítás beállításához.

          Mező Leírás Az oktatóanyag értéke
          Hely A régió, ahonnan futtatni szeretné a gépet USA 2. nyugati régiója
          Virtuálisgép-szint Válassza ki, hogy milyen prioritással kell rendelkeznie a kísérletnek Dedikált
          Virtuális gép típusa Válassza ki a virtuális gép típusát a számításhoz. CPU (központi feldolgozó egység)
          Virtuális gép mérete Válassza ki a virtuális gép méretét a számításhoz. Az ajánlott méretek listája az adatok és a kísérlet típusa alapján érhető el. Standard_DS12_V2
        2. Válassza a Tovább lehetőséget a Beállítások konfigurálása űrlap kitöltéséhez.

          Mező Leírás Az oktatóanyag értéke
          Számítási név Egyedi név, amely azonosítja a számítási környezetet. automl-compute
          Minimális / maximális csomópontok A profiladatokhoz 1 vagy több csomópontot kell megadnia. Minimális csomópontok: 1
          Maximális csomópontok: 6
          Tétlenség másodperccel a leskálázás előtt Üresjárati idő, mielőtt a fürt automatikusan leskálázható a minimális csomópontszámra. 120 (alapértelmezett)
          Speciális beállítások Gépház virtuális hálózat konfigurálásához és engedélyezéséhez a kísérlethez. Egyik sem
        3. Válassza a Létrehozás lehetőséget a számítási cél létrehozásához.

          Ez néhány percet vesz igénybe.

          Settings page

        4. A létrehozás után válassza ki az új számítási célt a legördülő listából.

    5. Válassza a Tovább lehetőséget.

  3. A Feladat és beállítások kiválasztása űrlapon végezze el az automatizált gépi tanulási kísérlet beállítását a gépi tanulási feladat típusának és konfigurációs beállításainak megadásával.

    1. Válassza a Besorolás lehetőséget gépi tanulási feladattípusként.

    2. Válassza a További konfigurációs beállítások megtekintése lehetőséget, és töltse ki a mezőket az alábbiak szerint. Ezekkel a beállításokkal jobban szabályozható a betanítási feladat. Ellenkező esetben az alapértelmezett értékek a kísérlet kiválasztása és az adatok alapján lesznek alkalmazva.

      További beállítások Leírás Az oktatóanyag értéke
      Elsődleges metrika Kiértékelési mérőszám, amellyel a gépi tanulási algoritmust mérni fogja. AUC_weighted
      A legjobb modell ismertetése Automatikusan megjeleníti az automatizált gépi tanulás által létrehozott legjobb modell magyarázatát. Engedélyezés
      Letiltott algoritmusok A betanítási feladatból kizárni kívánt algoritmusok Egyik sem
      További besorolási beállítások Ezek a beállítások segítenek a modell pontosságának javításában Pozitív osztálycímke: Nincs
      Kilépési feltétel Ha egy feltétel teljesül, a betanítási feladat leáll. Betanítási feladat ideje (óra): 1
      Metrikapont küszöbértéke: Nincs
      Egyidejűség Az iterációnként végrehajtott párhuzamos iterációk maximális száma Maximális egyidejű iterációk: 5

      Válassza a Mentés lehetőséget.

    3. Válassza a Következő lehetőséget.

  4. Az [Opcionális] Érvényesítési és tesztelési űrlapon:

    1. Válassza a k-fold keresztérvényesítést érvényesítési típusként.
    2. Válassza a 2 lehetőséget a keresztérvényesítések számaként.
  5. A kísérlet futtatásához válassza a Befejezés lehetőséget. Megnyílik a Feladat részletei képernyő, felül pedig a feladat állapota a kísérlet előkészítésekor. Ez az állapot a kísérlet előrehaladásával frissül. Az értesítések a stúdió jobb felső sarkában is megjelennek, hogy tájékoztassák a kísérlet állapotáról.

Fontos

A kísérlet futtatásának előkészítése 10–15 percet vesz igénybe. A futtatás után 2-3 percet vesz igénybe az egyes iterációk.

Éles környezetben valószínűleg elsétál egy kicsit. Ebben az oktatóanyagban azonban azt javasoljuk, hogy kezdje el felfedezni a tesztelt algoritmusokat a Modellek lapon, miközben a többiek még futnak.

Modellek felfedezése

Lépjen a Modellek lapra a tesztelt algoritmusok (modellek) megtekintéséhez. A modelleket alapértelmezés szerint a metrika pontszáma rendezi a befejezésük során. Ebben az oktatóanyagban az a modell áll a lista tetején, amely a kiválasztott AUC_weighted metrika alapján a legmagasabb pontszámot adja.

Amíg az összes kísérletmodell befejeződik, válassza ki a kész modell algoritmusnevét a teljesítmény részleteinek megismeréséhez.

Az alábbiakban a Részletek és a Metrikák lapon tekintheti meg a kiválasztott modell tulajdonságait, metrikáit és teljesítménydiagramjait.

Run iteration detail

Modellmagyarázatok

Amíg megvárja, amíg a modellek befejeződnek, áttekintheti a modell magyarázatait, és megnézheti, hogy mely (nyers vagy mérnöki) adatszolgáltatások befolyásolták egy adott modell előrejelzéseit.

Ezek a modellmagyarázatok igény szerint hozhatók létre, és a Magyarázatok (előzetes verzió) lap részét képező modellmagyarázat-irányítópulton foglalhatók össze.

Modellmagyarázatok létrehozásához

  1. Válassza a felül található 1 . feladatot a Modellek képernyőre való visszalépéshez.

  2. Válassza a Modellek lapot.

  3. Ebben az oktatóanyagban válassza ki az első MaxAbsScaler, LightGBM modellt.

  4. Válassza a modell magyarázata gombot a tetején. A jobb oldalon megjelenik a Modell magyarázata panel.

  5. Válassza ki a korábban létrehozott automl-számítást . Ez a számítási fürt egy gyermekfeladatot kezdeményez a modell magyarázatainak létrehozásához.

  6. Válassza a Létrehozás elemet az alján. Zöld sikerüzenet jelenik meg a képernyő tetején.

    Feljegyzés

    A magyarázó feladat végrehajtása körülbelül 2-5 percet vesz igénybe.

  7. Válassza a Magyarázatok (előzetes verzió) gombot. Ez a lap a magyarázhatósági futtatás befejeződése után töltődik fel.

  8. A bal oldalon bontsa ki az ablaktáblát, és válassza ki a Szolgáltatások területen a nyersen megjelenő sort.

  9. Válassza az Összesítés funkció fontossága lapot a jobb oldalon. Ez a diagram azt mutatja be, hogy mely adatfunkciók befolyásolták a kiválasztott modell előrejelzéseit.

    Ebben a példában úgy tűnik, hogy az időtartam befolyásolja a leginkább a modell előrejelzéseit.

    Model explanation dashboard

A legjobb modell üzembe helyezése

Az automatizált gépi tanulási felület lehetővé teszi a legjobb modell webszolgáltatásként való üzembe helyezését néhány lépésben. Az üzembe helyezés a modell integrációja, hogy előre jelezhesse az új adatokat, és azonosíthassa a lehetséges lehetőségeket.

Ebben a kísérletben a webszolgáltatásban való üzembe helyezés azt jelenti, hogy a pénzügyi intézmény most már iteratív és skálázható webes megoldással rendelkezik a lehetséges rögzített lejáratú betéti ügyfelek azonosítására.

Ellenőrizze, hogy a kísérlet futtatása befejeződött-e. Ehhez lépjen vissza a szülőfeladat lapjára a képernyő tetején található 1. feladat kiválasztásával. A képernyő bal felső részén megjelenik a Kész állapot.

A kísérlet futtatása után a Részletek lap egy legjobb modell összefoglaló szakaszával lesz feltöltve. Ebben a kísérletkörnyezetben a VotingEnsemble a legjobb modell a AUC_weighted metrika alapján.

Ezt a modellt üzembe helyezzük, de javasoljuk, hogy az üzembe helyezés körülbelül 20 percet vesz igénybe. Az üzembe helyezési folyamat több lépést is magában foglal, többek között a modell regisztrálását, az erőforrások generálását és a webszolgáltatáshoz való konfigurálását.

  1. Válassza a VotingEnsemble lehetőséget a modellspecifikus oldal megnyitásához.

  2. A bal felső sarokban válassza az Üzembe helyezés menüt, és válassza az Üzembe helyezés webszolgáltatásban lehetőséget.

  3. Töltse ki a Modell üzembe helyezése panelt az alábbiak szerint:

    Mező Érték
    Üzemelő példány neve my-automl-deploy
    Üzembe helyezés leírása Az első automatizált gépi tanulási kísérlet üzembe helyezése
    Számítási típus Az Azure Container Instance (ACI) kiválasztása
    Hitelesítés engedélyezése Letiltás.
    Egyéni üzemelő példányok használata Letiltás. Lehetővé teszi az alapértelmezett illesztőfájl (pontozási szkript) és a környezeti fájl automatikus generálásához.

    Ebben a példában a Speciális menüben megadott alapértelmezett értékeket használjuk.

  4. Válassza az Üzembe helyezés lehetőséget.

    Zöld sikerüzenet jelenik meg a Feladat képernyő tetején, és a Modell összegzése panelen megjelenik egy állapotüzenet az Üzembe helyezés állapot alatt. Az üzembe helyezés állapotának ellenőrzéséhez válassza a Rendszeres frissítés lehetőséget.

Most már rendelkezik egy operatív webszolgáltatással, amely előrejelzéseket hoz létre.

A következő lépésekkel többet tudhat meg az új webszolgáltatás használatáról, és tesztelheti az előrejelzéseket a Power BI beépített Azure Machine-Tanulás-támogatásával.

Az erőforrások eltávolítása

Az üzembehelyezési fájlok nagyobbak, mint az adatok és a kísérletfájlok, ezért többe kerülnek a tárolásuk. Csak az üzembehelyezési fájlokat törölje a fiók költségeinek minimalizálása érdekében, vagy ha meg szeretné tartani a munkaterületet és a kísérletfájlokat. Ellenkező esetben törölje a teljes erőforráscsoportot, ha egyik fájlt sem szeretné használni.

Az üzembe helyezési példány törlése

Törölje csak az üzembe helyezési példányt az Azure Machine-Tanulás, https://ml.azure.com/ha meg szeretné tartani az erőforráscsoportot és a munkaterületet más oktatóanyagokhoz és feltáráshoz.

  1. Nyissa meg az Azure Machine Tanulás. Lépjen a munkaterületre, és az Eszközök panel bal oldalán válassza a Végpontok lehetőséget.

  2. Jelölje ki a törölni kívánt üzembe helyezést, és válassza a Törlés lehetőséget.

  3. Válassza a Folytatás lehetőséget.

Az erőforráscsoport törlése

Fontos

A létrehozott erőforrások előfeltételként használhatók más Azure Machine-Tanulás oktatóanyagokhoz és útmutatókhoz.

Ha nem tervezi használni a létrehozott erőforrások egyikét sem, törölje őket, hogy ne járjon költséggel:

  1. Az Azure Portalon válassza az Erőforráscsoportok lehetőséget a bal szélen.

  2. A listából válassza ki a létrehozott erőforráscsoportot.

  3. Válassza az Erőforráscsoport törlése elemet.

    Screenshot of the selections to delete a resource group in the Azure portal.

  4. Adja meg az erőforráscsoport nevét. Ezután válassza a Törlés elemet.

Következő lépések

Ebben az automatizált gépi tanulási oktatóanyagban az Azure Machine Tanulás automatizált ML-felületét használta besorolási modell létrehozásához és üzembe helyezéséhez. További információkért és a következő lépésekért tekintse meg ezeket a cikkeket:

Feljegyzés

Ez a banki marketingadatkészlet a Creative Commons (CCO: Public Domain) licenc alatt érhető el. Az adatbázis egyes tartalmaira vonatkozó jogosultságok az Adatbázis tartalma licenc alapján vannak licencelve, és a Kaggleon érhetők el. Ez az adatkészlet eredetileg az UCI Machine Tanulás Database-ben volt elérhető.

[Moro et al., 2014] S. Moro, P. Cortez és P. Rita. Adatvezérelt megközelítés a banki telemarketing sikerességének előrejelzéséhez. Döntéstámogatási rendszerek, Elsevier, 62:22-31, 2014. június.