Oktatóanyag: Besorolási modell betanítása kód nélküli AutoML-lel a Azure Machine Learning stúdió

Megtudhatja, hogyan taníthat be egy besorolási modellt kód nélküli AutoML használatával Azure Machine Learning automatizált ML a Azure Machine Learning stúdió. Ez a besorolási modell előrejelzi, hogy az ügyfél előfizet-e egy pénzügyi intézménynél rögzített lejáratú betétre.

Az automatizált ML automatizálhatja az időigényes feladatokat. Az automatizált gépi tanulás gyorsan iterálja az algoritmusok és hiperparaméterek számos kombinációját, hogy könnyebben megtalálja a legjobb modellt a választott sikermetrika alapján.

Ebben az oktatóanyagban nem fog kódot írni, a studio felület használatával fogja elvégezni a betanítást. A következő feladatok elvégzését sajátíthatja el:

  • Hozzon létre egy Azure Machine Learning-munkaterületet.
  • Automatizált gépi tanulási kísérlet futtatása.
  • A modell részleteinek megismerése.
  • Helyezze üzembe az ajánlott modellt.

Próbálja ki az automatizált gépi tanulást is az alábbi modelltípusokhoz:

Előfeltételek

  • Azure-előfizetés. Ha nem rendelkezik Azure-előfizetéssel, hozzon létre egy ingyenes fiókot.

  • Töltse le a bankmarketing_train.csv adatfájlt. Az y oszlop azt jelzi, hogy egy ügyfél előfizetett-e egy rögzített összegű betétre, amelyet később az oktatóanyag előrejelzéseinek céloszlopaként azonosítunk.

Munkaterület létrehozása

A Azure Machine Learning-munkaterület egy alapvető erőforrás a felhőben, amelyet gépi tanulási modellek kipróbálására, betanítására és üzembe helyezésére használhat. Az Azure-előfizetést és az erőforráscsoportot egy könnyen használható objektumhoz ékesi a szolgáltatásban.

A munkaterületek létrehozásának számos módja van. Ebben az oktatóanyagban egy munkaterületet hoz létre a Azure Portal, amely egy webalapú konzol az Azure-erőforrások kezeléséhez.

  1. Jelentkezzen be a Azure Portal az Azure-előfizetés hitelesítő adataival.

  2. A Azure Portal bal felső sarkában válassza a három sávot, majd az erőforrás létrehozása lehetőséget.

    Screenshot showing + Create a resource.

  3. A Machine Learning kereséséhez használja a keresősávot.

  4. Válassza a Machine Learning lehetőséget.

    Screenshot shows search results to select Machine Learning.

  5. A Machine Learning panelen válassza a Létrehozás lehetőséget a kezdéshez.

  6. Adja meg a következő információkat az új munkaterület konfigurálásához:

    Mező Leírás
    Munkaterület neve Adjon meg egy egyedi nevet, amely azonosítja a munkaterületet. Ebben a példában a docs-ws függvényt használjuk. A neveknek egyedinek kell lenniük az erőforráscsoportban. Olyan nevet használjon, amely könnyen visszahívható, és megkülönböztethető a mások által létrehozott munkaterületektől.
    Előfizetés Válassza ki a használni kívánt Azure-előfizetést.
    Erőforráscsoport Használjon egy meglévő erőforráscsoportot az előfizetésben, vagy adjon meg egy nevet egy új erőforráscsoport létrehozásához. Az erőforráscsoportok egy Azure-megoldáshoz kapcsolódó erőforrásokat tárolnak. Ebben a példában a docs-aml parancsot használjuk.
    Hely Válassza ki a felhasználókhoz legközelebb eső helyet és az adaterőforrásokat a munkaterület létrehozásához.
  7. A munkaterület konfigurálásának befejezése után válassza az Áttekintés + Létrehozás lehetőséget.

  8. A munkaterület létrehozásához válassza a Létrehozás lehetőséget.

    Figyelmeztetés

    A munkaterület létrehozása a felhőben több percet is igénybe vehet.

    Ha a folyamat befejeződött, megjelenik egy sikeres üzembe helyezésről szóló üzenet.

  9. Az új munkaterület megtekintéséhez válassza az Erőforrás megnyitása lehetőséget.

  10. A munkaterület portálnézetében válassza a Launch studio lehetőséget a Azure Machine Learning stúdió megnyitásához.

Fontos

Jegyezze fel a munkaterületet és az előfizetést. Ezekre azért lesz szüksége, hogy a megfelelő helyen hozza létre a kísérletet.

Bejelentkezés a stúdióba

A következő kísérlet beállítási és futtatási lépéseit a Azure Machine Learning stúdióhttps://ml.azure.com, egy összevont webes felületen hajthatja végre, amely gépi tanulási eszközöket tartalmaz az adatelemzési forgatókönyvek végrehajtásához minden képzettségi szinten dolgozó adatelemzési szakemberek számára. A studio nem támogatott az Internet Explorer böngészőkben.

  1. Jelentkezzen be a Azure Machine Learning stúdió.

  2. Válassza ki az előfizetését és a létrehozott munkaterületet.

  3. Válassza a Első lépések lehetőséget.

  4. A bal oldali panelen válassza az Automatizált ML lehetőséget a Szerző szakaszban.

    Mivel ez az első automatizált ML kísérlete, üres listát és dokumentációra mutató hivatkozásokat fog látni.

    Get started page

  5. Válassza az +Új automatikus ML futtatás lehetőséget.

Adatkészlet létrehozása és betöltése

A kísérlet konfigurálása előtt töltse fel az adatfájlt a munkaterületre egy Azure Machine Learning adatkészlet formájában. Ezzel biztosíthatja, hogy az adatok megfelelően legyenek formázva a kísérlethez.

  1. Hozzon létre egy új adatkészletet a +Create dataset (Adathalmaz létrehozása) legördülő menü Helyi fájlokból elemének kiválasztásával.

    1. Az Alapszintű információ űrlapon adjon nevet az adathalmaznak, és adjon meg egy opcionális leírást. Az automatizált ML felület jelenleg csak a TabularDatasets típusokat támogatja, ezért az adathalmaz típusának alapértelmezés szerint táblázatosnak kell lennie.

    2. Válassza a Tovább gombot a bal alsó sarokban

    3. Az Adattár és a fájlkijelölési űrlapon válassza ki azt az alapértelmezett adattárat, amely automatikusan be lett állítva a munkaterület létrehozásakor, a workspaceblobstore (Azure Blob Storage). Itt töltheti fel az adatfájlt, hogy elérhetővé tegye a munkaterület számára.

    4. Válassza a Fájlok feltöltése lehetőséget a Feltöltés legördülő listában.

    5. Válassza ki a bankmarketing_train.csv fájlt a helyi számítógépen. Ez az előfeltételként letöltött fájl.

    6. A bal alsó sarokban található Tovább gombra kattintva feltöltheti azt a munkaterület létrehozásakor automatikusan beállított alapértelmezett tárolóba.

      Amikor a feltöltés befejeződött, a Gépház és az előnézeti űrlap előre ki lesz töltve a fájltípus alapján.

    7. Ellenőrizze, hogy a Gépház és az előnézeti űrlap az alábbiak szerint van-e kitöltve, és válassza a Tovább gombot.

      Mező Leírás Oktatóanyag értéke
      Fájlformátum Meghatározza a fájlban tárolt adatok elrendezését és típusát. Tagolt
      Elválasztó Egy vagy több karakter a különálló, független régiók közötti határ megadásához egyszerű szövegben vagy más adatfolyamokban. Vessző
      Encoding Azonosítja az adathalmaz olvasásához használandó bit–karakter sématáblát. UTF-8
      Oszlopfejlécek Azt jelzi, hogy a rendszer hogyan kezeli az adathalmaz fejléceit ( ha vannak ilyenek). Minden fájlnak ugyanaz a fejléce
      Sorok kihagyása Azt jelzi, hogy hány (ha van) sor kihagyva az adathalmazból. None
    8. A sémaűrlap lehetővé teszi az adatok további konfigurálását ehhez a kísérlethez. Ebben a példában válassza ki a day_of_week kapcsolót, hogy ne vegye fel. Kattintson a Tovább gombra. Schema form

    9. A Részletek megerősítése űrlapon ellenőrizze, hogy az adatok megegyeznek-e az Alapszintű adatok, az Adattár és a fájlkijelölés,valamint a Gépház és az előnézeti űrlapokon korábban feltöltött adatokkal.

    10. Válassza a Létrehozás lehetőséget az adathalmaz létrehozásának befejezéséhez.

    11. Jelölje ki az adathalmazt, amint az megjelenik a listában.

    12. Tekintse át az adatok előnézetét , és győződjön meg arról, hogy nem day_of_week, majd válassza a Bezárás lehetőséget.

    13. Kattintson a Tovább gombra.

Futtatás konfigurálása

Miután betöltötte és konfigurálta az adatokat, beállíthatja a kísérletet. Ez a beállítás olyan kísérleti tervezési feladatokat tartalmaz, mint például a számítási környezet méretének kiválasztása és az előrejelezni kívánt oszlop megadása.

  1. Válassza az Új választógomb létrehozása gombot.

  2. Töltse ki a Futtatás konfigurálása űrlapot az alábbiak szerint:

    1. Adja meg a kísérlet nevét: my-1st-automl-experiment

    2. Válassza ki az y-t céloszlopként, és azt, hogy mit szeretne előrejelezni. Ez az oszlop azt jelzi, hogy az ügyfél előfizetett-e egy letéti időszakra, vagy sem.

    3. Számítási típusként válassza ki a számítási fürtöt .

    4. +Új a számítási cél konfigurálásához. A számítási cél egy helyi vagy felhőalapú erőforrás-környezet, amely a betanítási szkript futtatására vagy a szolgáltatás üzembe helyezésének üzemeltetésére szolgál. Ebben a kísérletben egy felhőalapú számítást használunk.

      1. Töltse ki a Virtuális gép kiválasztása űrlapot a számítás beállításához.

        Mező Leírás Oktatóanyag értéke
        Hely A régió, ahonnan futtatni szeretné a gépet USA 2. nyugati régiója
        Virtuálisgép-szint Válassza ki, milyen prioritással kell rendelkeznie a kísérletnek Dedikált
        Virtuális gép típusa Válassza ki a számításhoz tartozó virtuálisgép-típust. CPU (központi feldolgozó egység)
        Virtuális gép mérete Válassza ki a virtuális gép méretét a számításhoz. Az ajánlott méretek listája az adatok és a kísérlet típusa alapján érhető el. Standard_DS12_V2
      2. Válassza a Tovább gombot a Beállítások konfigurálása űrlap kitöltéséhez.

        Mező Leírás Oktatóanyag értéke
        Számítási név A számítási környezetet azonosító egyedi név. automl-compute
        Minimális / maximális csomópontok Az adatok profilkészítéséhez 1 vagy több csomópontot kell megadnia. Minimális csomópontok: 1
        Maximális csomópontok: 6
        Tétlen másodpercek a leskálázás előtt Üresjárati idő, mielőtt a fürt automatikusan leskálázható a minimális csomópontszámra. 120 (alapértelmezett)
        Speciális beállítások Gépház virtuális hálózat konfigurálásához és engedélyezéséhez a kísérlethez. None
      3. Válassza a Létrehozás lehetőséget a számítási cél létrehozásához.

        Ez néhány percet vesz igénybe.

        Settings page

      4. A létrehozás után válassza ki az új számítási célt a legördülő listából.

    5. Kattintson a Tovább gombra.

  3. A Feladat és beállítások kiválasztása űrlapon végezze el az automatizált ML kísérlet beállítását a gépi tanulási feladat típusának és konfigurációs beállításainak megadásával.

    1. Válassza a Besorolást gépi tanulási feladattípusként.

    2. Válassza a További konfigurációs beállítások megtekintése lehetőséget, és töltse ki a mezőket az alábbiak szerint. Ezekkel a beállításokkal jobban szabályozható a betanítási feladat. Ellenkező esetben az alapértelmezett értékek a kísérlet kiválasztása és az adatok alapján lesznek alkalmazva.

      További konfigurációk Description Oktatóanyag értéke
      Elsődleges metrika Kiértékelési metrika, amellyel a gépi tanulási algoritmust mérni fogja. AUC_weighted
      A legjobb modell magyarázata Automatikusan megjeleníti az automatizált ML által létrehozott legjobb modell magyarázatát. Engedélyezés
      Letiltott algoritmusok A betanítási feladatból kizárni kívánt algoritmusok None
      További besorolási beállítások Ezek a beállítások segítenek a modell pontosságának javításában Pozitív osztálycímke: Nincs
      Kilépési feltétel Ha egy feltétel teljesül, a betanítási feladat leáll. Betanítási feladat ideje (óra): 1
      Metrikapont küszöbértéke: Nincs
      Egyidejűség Az iterációnként végrehajtott párhuzamos iterációk maximális száma Egyidejű iterációk maximális kihasználása: 5

      Kattintson a Mentés gombra.

    3. Kattintson a Tovább gombra.

  4. A [Nem kötelező] Érvényesítési és tesztelési űrlapon:

    1. Az érvényesítési típusként válassza a k-fold keresztérvényesítést.
    2. Válassza a 2 lehetőséget a keresztérvényesítések számaként.
  5. A kísérlet futtatásához válassza a Befejezés lehetőséget. Ekkor megnyílik a Futtatás részletei képernyő a kísérlet előkészítésének kezdetekor a futtatás állapotával . Ez az állapot a kísérlet előrehaladásával frissül. Az értesítések a stúdió jobb felső sarkában is megjelennek, hogy tájékoztassák a kísérlet állapotáról.

Fontos

A kísérlet futtatásának előkészítése 10–15 percet vesz igénybe. A futtatás után 2–3 percet vesz igénybe az egyes iterációk.

Éles környezetben valószínűleg elsétál egy kicsit. Ebben az oktatóanyagban azonban azt javasoljuk, hogy kezdje meg a tesztelt algoritmusok felfedezését a Modellek lapon, miközben a többiek még futnak.

Modellek megismerése

Lépjen a Modellek lapra a tesztelt algoritmusok (modellek) megtekintéséhez. Alapértelmezés szerint a modellek metrikapont szerint vannak rendezve a befejezésükkor. Ebben az oktatóanyagban a kiválasztott AUC_weighted metrika alapján a legmagasabb pontszámot elérő modell a lista tetején található.

Amíg az összes kísérletmodell befejeződik, válassza ki a befejezett modell algoritmusnevét a teljesítmény részleteinek megismeréséhez.

Az alábbiakban a Részletek és a Metrikák lapon tekintheti meg a kiválasztott modell tulajdonságait, metrikáit és teljesítménydiagramjait.

Run iteration detail

Modellmagyarázatok

Miközben megvárja a modellek befejezését, áttekintheti a modell magyarázatait, és megtekintheti, hogy mely (nyers vagy megtervezett) adatfunkciók befolyásolták egy adott modell előrejelzéseit.

Ezek a modellmagyarázatok igény szerint hozhatók létre, és a Magyarázatok (előzetes verzió) lap részét képező modellmagyarázat-irányítópulton vannak összefoglalva.

Modellmagyarázatok létrehozásához

  1. Válassza az 1. futtatás lehetőséget a felső sarokban a Modellek képernyőre való visszalépéshez.

  2. Válassza a Modellek lapot.

  3. Ebben az oktatóanyagban válassza ki az első MaxAbsScaler, LightGBM modellt.

  4. Válassza a modell magyarázata gombot a lap tetején. A jobb oldalon megjelenik a Modell magyarázata panel.

  5. Válassza ki a korábban létrehozott automl-számítást . Ez a számítási fürt gyermekfuttatást kezdeményez a modell magyarázatainak létrehozásához.

  6. Válassza a Lenti Létrehozás lehetőséget . A képernyő tetején egy zöld sikerüzenet jelenik meg.

    Megjegyzés

    A magyarázhatósági futtatás körülbelül 2–5 percet vesz igénybe.

  7. Válassza a Magyarázatok (előzetes verzió) gombot. Ez a lap a magyarázhatósági futtatás befejeződése után töltődik fel.

  8. A bal oldalon bontsa ki az ablaktáblát, és válassza ki a Nyers feliratú sort a Szolgáltatások területen.

  9. Válassza az Összesítés funkció fontossága lapot a jobb oldalon. Ez a diagram azt mutatja be, hogy mely adatfunkciók befolyásolták a kiválasztott modell előrejelzéseit.

    Ebben a példában úgy tűnik, hogy az időtartam befolyásolja a legnagyobb mértékben a modell előrejelzéseit.

    Model explanation dashboard

A legjobb modell üzembe helyezése

Az automatizált gépi tanulási felülettel néhány lépésben üzembe helyezheti a legjobb modellt webszolgáltatásként. Az üzembe helyezés a modell integrációja, így előrejelezheti az új adatokat, és azonosíthatja a lehetséges lehetőségeket.

Ebben a kísérletben a webszolgáltatásba való üzembe helyezés azt jelenti, hogy a pénzügyi intézmény most már iteratív és skálázható webes megoldással rendelkezik a potenciális rögzített lejáratú betétügyfelek azonosításához.

Ellenőrizze, hogy a kísérlet futtatása befejeződött-e. Ehhez lépjen vissza a szülőfuttatási lapra a képernyő tetején található 1. futtatás lehetőség kiválasztásával. A képernyő bal felső részén megjelenik a Kész állapot.

Ha a kísérlet futtatása befejeződött, a Részletek lap egy legjobb modell összefoglaló szakaszával lesz feltöltve. Ebben a kísérletkörnyezetben a VotingEnsemble a legjobb modell a AUC_weighted metrika alapján.

Ezt a modellt üzembe helyezzük, de javasoljuk, hogy az üzembe helyezés körülbelül 20 percet vesz igénybe. Az üzembehelyezési folyamat több lépésből áll, többek között a modell regisztrálásával, az erőforrások létrehozásával és a webszolgáltatáshoz való konfigurálásával.

  1. Válassza a VotingEnsemble lehetőséget a modellspecifikus oldal megnyitásához.

  2. Válassza a bal felső sarokban található Üzembe helyezés menüt, és válassza az Üzembe helyezés webszolgáltatásban lehetőséget.

  3. Töltse fel a Modell üzembe helyezése panelt az alábbiak szerint:

    Mező Érték
    Üzembe helyezés neve my-automl-deploy
    Az üzembe helyezés leírása Az első automatizált gépi tanulási kísérlet üzembe helyezése
    Számítási típus Az Azure Container Instance (ACI) kiválasztása
    Hitelesítés engedélyezése Letiltás lehetőséget.
    Egyéni üzemelő példányok használata Letiltás lehetőséget. Lehetővé teszi, hogy az alapértelmezett illesztőprogram-fájl (pontozási szkript) és a környezeti fájl automatikusan létrejönjön.

    Ebben a példában a Speciális menüben megadott alapértelmezett értékeket használjuk.

  4. Válassza az Üzembe helyezés lehetőséget.

    A Futtatás képernyő tetején egy zöld sikeres üzenet jelenik meg, a Modell összegzése panelen pedig az Üzembe helyezés állapot alatt egy állapotüzenet jelenik meg. Az üzembe helyezés állapotának ellenőrzéséhez válassza a Rendszeres frissítés lehetőséget.

Most már rendelkezik egy operatív webszolgáltatással az előrejelzések létrehozásához.

A következő lépésekkel többet tudhat meg az új webszolgáltatás használatáról, és tesztelheti az előrejelzéseket Power BI beépített Azure Machine Learning támogatásával.

Az erőforrások eltávolítása

Az üzembehelyezési fájlok nagyobbak, mint az adat- és kísérletfájlok, ezért többe kerülnek az adatok tárolása. Csak az üzembehelyezési fájlokat törölje a fiók költségeinek minimalizálása érdekében, vagy ha meg szeretné tartani a munkaterületet és a kísérleti fájlokat. Ellenkező esetben törölje a teljes erőforráscsoportot, ha egyik fájlt sem tervezi használni.

Az üzembe helyezési példány törlése

Törölje csak az üzembe helyezési példányt a Azure Machine Learning, https://ml.azure.com/ha meg szeretné tartani az erőforráscsoportot és a munkaterületet más oktatóanyagokhoz és feltáráshoz.

  1. Lépjen a Azure Machine Learning. Lépjen a munkaterületre, és az Eszközök panel bal oldalán válassza a Végpontok lehetőséget.

  2. Jelölje ki a törölni kívánt üzemelő példányt, és válassza a Törlés lehetőséget.

  3. Válassza a Folytatás lehetőséget.

Az erőforráscsoport törlése

Fontos

A létrehozott erőforrások más Azure Machine Learning oktatóanyagok és útmutatók előfeltételeiként használhatók.

Ha nem tervezi a létrehozott erőforrások egyikét sem használni, törölje őket, hogy ne kelljen díjat fizetnie:

  1. Az Azure Portalon válassza az Erőforráscsoportok lehetőséget a bal szélen.

  2. Válassza ki a létrehozott erőforráscsoportot a listából.

  3. Válassza az Erőforráscsoport törlése elemet.

    Screenshot of the selections to delete a resource group in the Azure portal.

  4. Írja be az erőforráscsoport nevét. Ezután válassza a Törlés elemet.

Következő lépések

Ebben az automatizált gépi tanulási oktatóanyagban Azure Machine Learning automatizált ML felületét használta besorolási modell létrehozásához és üzembe helyezéséhez. További információkért és a következő lépésekért tekintse meg ezeket a cikkeket:

Megjegyzés

Ez a Bank Marketing adatkészlet a Creative Commons (CCO: Public Domain) licenc alapján érhető el. Az adatbázis egyes tartalmainak jogosultságai az Adatbázis tartalma licenc alapján licencelhetők, és a Kaggleen érhetők el. Ez az adatkészlet eredetileg az UCI Machine Learning Database-ben volt elérhető.

[Moro et al., 2014] S. Moro, P. Cortez és P. Rita. A Data-Driven Approach to Predict the Success of Bank Telemarketing. (Adatvezérelt megközelítés a banki telemarketing sikerességének előrejelzéséhez.) Decision Support Systems, Elsevier, 62:22-31, 2014. június