Oktatóanyag: Besorolási modell betanítás kód nélkül AutoML-lel a Azure Machine Learning Studióban

Megtudhatja, hogyan betaníthatja a besorolási modellt kód Azure Machine Learning AutoML használatával ML a Azure Machine Learning studióban. Ez a besorolási modell előrejelzi, hogy az ügyfél előfizet-e egy pénzügyi intézetnél történő fix időtartamú befizetésre.

Az automatizált ML segítségével automatizálhatja az időigényes feladatokat. Az automatizált gépi tanulás gyorsan iterál algoritmusok és hiperparaméterek számos kombinációján, hogy segítsen megtalálni a legjobb modellt a választott sikeresség mérőszáma alapján.

Ebben az oktatóanyagban nem fog kódot írni, a Studio felületét fogja használni a betanítás elvégzéséhez. A következő feladatok elvégzésével ismerkedik meg:

  • Hozzon létre egy Azure Machine Learning munkaterületet.
  • Automatizált gépi tanulási kísérlet futtatása.
  • Ismerkedés a modell részleteivel.
  • Az ajánlott modell üzembe helyezése.

Az automatizált gépi tanulást is kipróbálhatja az alábbi modelltípusokhoz:

Előfeltételek

  • Azure-előfizetés. Ha nem rendelkezik Azure-előfizetéssel, hozzon létre egy ingyenes fiókot.

  • Töltse le bankmarketing_train.csv fájlt. Az y oszlop jelzi, hogy egy ügyfél feliratkozott-e egy fix távú befizetésre, amelyet később az előrejelzések céloszlopaként azonosítunk ebben az oktatóanyagban.

Munkaterület létrehozása

A Azure Machine Learning munkaterület egy alaperőforrás a felhőben, amely a gépi tanulási modellek kísérletezésre, betanításra és üzembe helyezésére használható. Az Azure-előfizetést és -erőforráscsoportot a szolgáltatás egy könnyen felhasznált objektumához használja.

A munkaterületek többféleképpen is létrehozhatóak. Ebben az oktatóanyagban létrehoz egy munkaterületet a Azure Portal használatával, amely egy webalapú konzol az Azure-erőforrások kezeléséhez.

  1. Jelentkezzen be a Azure Portal az Azure-előfizetés hitelesítő adataival.

  2. A bal felső sarokban válassza Azure Portal három sávot, majd az + Erőforrás létrehozása lehetőséget.

    Képernyőkép az + Erőforrás létrehozása ről.

  3. A keresősáv használatával keresse meg a Machine Learning.

  4. Válassza a Machine Learning lehetőséget.

    Képernyőkép a találatok kiválasztására Machine Learning.

  5. A Machine Learning válassza a Létrehozás lehetőséget a kezdéshez.

  6. Adja meg a következő információkat az új munkaterület konfiguráláshoz:

    Mező Leírás
    Munkaterület neve Adjon meg egy egyedi nevet, amely azonosítja a munkaterületet. Ebben a példában a docs-ws-t használjuk. A neveknek egyedinek kell lennie az erőforráscsoporton belül. Olyan nevet használjon, amely könnyen felidézhető, és megkülönböztethető a mások által létrehozott munkaterületektől.
    Előfizetés Válassza ki a használni kívánt Azure-előfizetést.
    Erőforráscsoport Használjon egy meglévő erőforráscsoportot az előfizetésében, vagy adjon meg egy nevet egy új erőforráscsoport létrehozásához. Az erőforráscsoport egy Azure-megoldás kapcsolódó erőforrásait tartalmazza. Ebben a példában a docs-aml-t használjuk.
    Hely Válassza ki a felhasználókhoz legközelebb eső helyet és az adatforrásokat a munkaterület létrehozásához.
  7. Miután befejezte a munkaterület konfigurálását, válassza az Áttekintés + létrehozás lehetőséget.

  8. A munkaterület létrehozásához válassza a Létrehozás lehetőséget.

    Figyelmeztetés

    A munkaterület létrehozása a felhőben több percig is eltarthat.

    Ha a folyamat befejeződött, megjelenik az üzembe helyezés sikerességével kapcsolatos üzenet.

  9. Az új munkaterület megtekintéséhez válassza az Erőforrás megnyitása lehetőséget.

  10. A munkaterület portálnézetében válassza a Studio indítása lehetőséget a munkaterület Azure Machine Learning stúdió.

Fontos

Jegyezze fel a munkaterületét és előfizetését. Ezekre azért van szükség, hogy a megfelelő helyen hozza létre a kísérletet.

Bejelentkezés a studióba

A következő kísérlet beállítási és futtatás lépéseit a Azure Machine Learning Studio webhelyen végezheti el, amely egy összevont webes felület, amely gépi tanulási eszközöket tartalmaz adattudományi forgatókönyvek végrehajtásához az adattudományi szakemberek számára minden https://ml.azure.com készségszinten. A studio nem támogatott a Internet Explorer böngészőkben.

  1. Jelentkezzen be a Azure Machine Learning studióba.

  2. Válassza ki az előfizetését és a létrehozott munkaterületet.

  3. Válassza az Első lépések lehetőséget.

  4. A bal oldali panelen válassza az Automatizált ML a Szerző szakaszban.

    Mivel ez az első automatizált ML kísérlete, egy üres lista és a dokumentációra mutató hivatkozások megjelenik.

    Első lépések lap

  5. Válassza az +Új automatizált ML a futtatásához.

Adatkészlet létrehozása és betöltése

A kísérlet konfigurálása előtt töltse fel az adatfájlt a munkaterületre egy Azure Machine Learning formájában. Ezzel biztosíthatja, hogy az adatok a kísérletnek megfelelően legyen formázva.

  1. Hozzon létre egy új adatkészletet a +Adatkészlet létrehozása legördülő menü Helyi fájlokból lehetőségének kiválasztásával.

    1. Az Alapszintű információ űrlapon nevezze el az adatkészletet, és adjon meg egy leírást (nem kötelező). Az automatizált ML felület jelenleg csak a TabularDatasets adatkészleteket támogatja, ezért az adatkészlet típusának alapértelmezés szerint Táblázatosnak kell lennie.

    2. A bal alsó sarokban válassza a Tovább lehetőséget

    3. Az Adattár és fájlkiválasztási űrlapon válassza ki a munkaterület létrehozása során automatikusan beállított alapértelmezett adattárat(workspaceblobstore (Azure Blob Storage). Itt töltheti fel az adatfájlt, hogy elérhetővé tegye a munkaterület számára.

    4. Válassza a Tallózás lehetőséget.

    5. Válassza ki abankmarketing_train.csv fájlt a helyi számítógépen. Ezt a fájlt letöltötte előfeltételként.

    6. Adjon meg egy egyedi nevet az adatkészletnek, és adjon meg egy leírást (nem kötelező).

    7. A bal alsó sarokban található Tovább gombra választva töltse fel azt a munkaterület létrehozása során automatikusan beállított alapértelmezett tárolóba.

      Ha a feltöltés befejeződött, a Gépház előnézeti űrlapja előre ki lesz töltve a fájltípus alapján.

    8. Ellenőrizze, hogy a Gépház és az előnézeti űrlap az alábbiak szerint van-e kitöltve, majd válassza a Tovább lehetőséget.

      Mező Leírás Az oktatóanyag értéke
      Fájlformátum A fájlban tárolt adatok elrendezését és típusát határozza meg. Tagolt
      Elválasztó Egy vagy több karakter a különálló, független régiók közötti határ egyszerű szövegként vagy más   adatfolyamban való megadásához. Vessző
      Encoding Meghatározza, hogy melyik bit–karakter sématáblát kell használni az adatkészlet beolvassa. UTF-8
      Oszlopfejlécek Azt jelzi, hogy a rendszer hogyan kezeli az adatkészlet fejlécét (ha van ilyen). Minden fájl azonos fejlécekkel
      Sorok kihagyása Azt jelzi, hogy a rendszer hány sort hagy ki az adathalmazban, ha van ilyen. None
    9. A Séma űrlap lehetővé teszi az adatok további konfigurálást ehhez a kísérlethez. Ebben a példában válassza a kapcsolót a day_of_week, hogy ne tartalmazza. Kattintson a Tovább gombra. Sémaűrlap

    10. A Részletek megerősítése űrlapon ellenőrizze, hogy az adatok megegyeznek-e az Alapszintű adatok, az Adattár és a fájlkiválasztás, valamint a Gépház és az előnézeti űrlapokon korábban kitöltött adatokkal.

    11. Az adatkészlet létrehozásának befejezéséhez válassza a Létrehozás lehetőséget.

    12. Válassza ki az adatkészletet, amint az megjelenik a listában.

    13. Tekintse át az Adatelőnézetet, és győződjön meg arról, hogy nem day_of_week, majd válassza a Bezárás lehetőséget.

    14. Válassza a Tovább lehetőséget.

Futtatás konfigurálása

Az adatok betöltése és konfigurálása után beállíthatja a kísérletet. Ez a beállítás kísérleti tervezési feladatokat tartalmaz, például a számítási környezet méretének kiválasztását és az előrejelezni kívánt oszlop megadását.

  1. Válassza az Új létrehozása választógombot.

  2. Töltse ki a Futtatás konfigurálása űrlapot az alábbiak szerint:

    1. Adja meg a kísérlet nevét: my-1st-automl-experiment

    2. Céloszlopként válassza az y lehetőséget, amit előre szeretne jelezni. Ez az oszlop jelzi, hogy az ügyfél előfizetett-e egy időtartamra, vagy sem.

    3. Válassza az +Új számítás létrehozása lehetőséget, és konfigurálja a számítási célt. A számítási cél egy helyi vagy felhőalapú erőforráskörnyezet, amely a betanító szkript futtatására vagy a szolgáltatás üzemelő példányának futtatására használható. Ehhez a kísérlethez felhőalapú számítást használunk.

      1. Töltse ki a virtuális gép űrlapját a számítás beállításhoz.

        Mező Leírás Az oktatóanyag értéke
            Virtuálisgép-prioritás Válassza ki a kísérlet prioritását Dedikált
        Virtuális   gép   típusa Válassza ki a virtuális gép típusát a számításhoz. CPU (központi feldolgozási egység)
        Virtuális   gép   mérete Válassza ki a virtuális gép méretét a számításhoz. A javasolt méretek listája az adatok és a kísérlet típusától függ. Standard_DS12_V2
      2. A Beállítások konfigurálása űrlap kitöltéséhez válassza a Tovább lehetőséget.

        Mező Leírás Az oktatóanyag értéke
        Számítási név A számítási környezetet azonosító egyedi név. automl-compute
        Minimális/ maximális csomópontok Az adatok profiljainak megadásához 1 vagy több csomópontot kell megadnia. Minimális csomópontok: 1
        Maximális csomópontok: 6
        Üresjárati idő (másodpercben) a leskálás előtt Üresjárati idő a fürt automatikus leskálálása előtt a minimális csomópontszámra. 1800 (alapértelmezett)
        Speciális beállítások Gépház konfigurálhatja és engedélyezheti a kísérlet virtuális hálózatát. None
      3. A számítási cél létrehozásához válassza a Létrehozás lehetőséget.

        Ez eltarthat néhány percig.

        Beállítások lap

      4. A létrehozás után válassza ki az új számítási célt a legördülő listából.

    4. Kattintson a Tovább gombra.

  3. A Feladat és beállítások kiválasztása űrlapon a gépi tanulási feladat típusának és konfigurációs beállításainak megadásával ML az automatizált tanulási kísérlet beállítását.

    1. Gépi tanulási feladattípusként válassza a Besorolás lehetőséget.

    2. Válassza a További konfigurációs beállítások megtekintése lehetőséget, és töltse ki a mezőket az alábbiak szerint. Ezek a beállítások a betanítás feladatának jobb szabályozása érdekében vannak megszabadva. Ellenkező esetben az alapértelmezések a kísérletek kiválasztása és az adatok alapján vannak alkalmazva.

      További   konfigurációk Description Az   oktatóanyag   értéke
      Elsődleges metrika Kiértékelési metrika, amely alapján a gépi tanulási algoritmus mérése történik. AUC_weighted
      A legjobb modell magyarázata Automatikusan megjeleníti az automatizált modell által létrehozott legjobb modell ML. Engedélyezés
      Letiltott algoritmusok A betanítás feladatból kizárni kívánt algoritmusok None
      Kilépési feltétel Ha egy feltétel teljesül, a betanítás le lesz állítva. Betanítás     feladatának ideje (óra): 1
       Metrika pontszám   küszöbértéke: Nincs
      Érvényesítés Válassza ki a keresztellenőrzés típusát és a tesztek számát. Érvényesítés típusa:
       K-szoros   keresztvalyikálás

      Ellenőrzések száma: 2
      Egyidejűség Az iterációnként végrehajtott párhuzamos iterációk maximális száma Egyidejű     iterációk maximális száma: 5

      Kattintson a Mentés gombra.

  4. A kísérlet futtatásához válassza a Befejezés lehetőséget. Megnyílik a Futtatás részletei képernyő, tetején a Futtatás állapot látható a kísérlet előkészítésének megkezdésekor. Ez az állapot a kísérlet előrehaladtával frissül. A kísérlet állapotáról a studio jobb felső sarkában értesítések is megjelennek.

Fontos

A kísérlet futtatásának előkészítése 10–15 percet vesz igénybe. A futtatása után az egyes iterációk esetén 2–3 percet vesz igénybe.

Éles környezetben valószínűleg egy kicsit távolról fog járni. Ebben az oktatóanyagban azonban azt javasoljuk, hogy miközben a többi még fut, kezdje el a tesztelt algoritmusok felfedezését a Modellek lapon azok befejezése közben.

Ismerkedés a modellekkel

Lépjen a Modellek lapra, és tekintse meg a tesztelt algoritmusokat (modelleket). Alapértelmezés szerint a modellek a metrika pontszáma szerint vannak megrendelve, amint befejeződnek. Ebben az oktatóanyagban a lista tetején található az a modell, amely a kiválasztott AUC_weighted metrika alapján a legmagasabb pontszámokat tartalmazza.

Amíg megvárja, amíg az összes kísérleti modell befejeződik, válassza egy befejezett modell algoritmusnevét a teljesítmény részleteinek felfedezéséhez.

Az alábbi lépésekkel a Részletek és a Metrikák lapon megtekintheti a kiválasztott modell tulajdonságait, metrikákat és teljesítménydiagramokat.

Futtatási iteráció részletei

Modell magyarázatai

Amíg megvárja, amíg a modellek befejeződnek, a modell magyarázatait is láthatja, és láthatja, hogy mely adat jellemzők (nyers vagy megtervezett) befolyásolták egy adott modell előrejelzéseit.

Ezek a modell magyarázatai igény szerint generálhatóak, és a Magyarázatok (előzetes verzió) lap részét képezi a modell magyarázatai irányítópulton összegezve.

A modell magyarázatának létrehozásához:

  1. Válassza a felül található Run 1 (1. futtatás) lehetőséget a Models (Modellek) képernyőre való vissza navigáláshoz.

  2. Válassza a Modellek lapot.

  3. Ebben az oktatóanyagban válassza az első MaxAbsScaler, LightGBM modellt.

  4. Válassza a felül található Modell magyarázata gombot. A jobb oldalon megjelenik a Modell magyarázata panel.

  5. Válassza ki a korábban létrehozott automl-compute et. Ez a számítási fürt elindít egy gyermekfutatot a modell magyarázatának létrehozásához.

  6. Válassza az alul található Létrehozás lehetőséget. A képernyő felső részén megjelenik egy zöld sikert olvasó üzenet.

    Megjegyzés

    Az elmagyarázhatósági futtatás körülbelül 2–5 percet vesz igénybe.

  7. Válassza a Magyarázatok (előzetes verzió) gombot. Ez a lap az elmagyarázhatósági futtatás befejezése után lesz feltöltve.

  8. A bal oldalon bontsa ki a panelt, és válassza ki a Szolgáltatások alatt a raw (nyers) sort.

  9. Válassza az Összesítés funkció fontossága lapot a jobb oldalon. Ezen a diagramon látható, hogy mely adat jellemzők befolyásolták a kiválasztott modell előrejelzéseit.

    Ebben a példában úgy tűnik, hogy az időtartam befolyásolja a leginkább a modell előrejelzéseit.

    Modell magyarázata irányítópult

A legjobb modell üzembe helyezése

Az automatizált gépi tanulási felülettel néhány lépésben üzembe helyezheti a legjobb modellt webszolgáltatásként. Az üzembe helyezés a modell integrációja, amely képes előrejelezni az új adatokat, és azonosítani a lehetőségek lehetséges területeit.

Ebben a kísérletben a webszolgáltatásban való üzembe helyezés azt jelenti, hogy a pénzügyi intézet egy iteratív és skálázható webes megoldással azonosítja a lehetséges, fix időszakú elhelyezéssel kapcsolatos ügyfeleket.

Ellenőrizze, hogy a kísérlet futtatása befejeződött-e. A képernyő tetején található Futtatás 1 lehetőség kiválasztásával lépjen vissza a szülő futtatás lapjára. A befejezve állapot a képernyő bal felső részén jelenik meg.

Ha a kísérlet futtatása befejeződött, a Részletek lap a Legjobb modell összegzése szakaszsal lesz feltöltve. Ebben a kísérletkörnyezetben a VotingEnsemble a legjobb modellnek számít a AUC_weighted alapján.

Ezt a modellt üzembe helyezjük, de az üzembe helyezés körülbelül 20 percet vesz igénybe. Az üzembe helyezési folyamat több lépésből áll, beleértve a modell regisztrálását, az erőforrások generálását és a webszolgáltatáshoz való konfigurálását.

  1. Válassza a VotingEnsemble lehetőséget a modellspecifikus oldal megnyitásához.

  2. Válassza az Üzembe helyezés gombot a bal felső sarokban.

  3. Töltse ki a Modell üzembe helyezése panelt a következőképpen:

    Mező Érték
    Üzemelő példány neve my-automl-deploy
    Üzembe helyezés leírása Az első automatizált gépi tanulási kísérletem üzembe helyezése
    Számítási típus A Azure Compute (ACI) kiválasztása
    Hitelesítés engedélyezése Letiltás lehetőséget.
    Egyéni központi telepítések használata Letiltás lehetőséget. Lehetővé teszi az alapértelmezett illesztőprogram-fájl (pontozószkprogram) és a környezeti fájl automatikus generálása.

    Ebben a példában a Speciális menüben megadott alapértelmezett értékeket használjuk.

  4. Válassza az Üzembe helyezés lehetőséget.

    A Run (Futtatás) képernyő tetején megjelenik egy zöld, sikeresnek megfelelő üzenet, a Modell összegzése panelen pedig megjelenik egy állapotüzenet az Üzembe helyezés állapota alatt. Az üzembe helyezés állapotának rendszeres ellenőrzéséhez válassza a Frissítés lehetőséget.

Most már van egy működő webszolgáltatása, amely előrejelzéseket hoz létre.

Folytassa a Következő lépésekkel, ha többet szeretne megtudni az új webszolgáltatás fogyasztásával kapcsolatban, és tesztelje az előrejelzéseket az Power BI beépített Azure Machine Learning használatával.

Az erőforrások eltávolítása

Az üzembe helyezési fájlok nagyobbak, mint az adat- és kísérleti fájlok, ezért többe kerül a tárolás. Csak az üzembe helyezési fájlokat törölje a fiók költségeinek minimalizálása érdekében, vagy ha meg szeretné tartani a munkaterületet és a kísérleti fájlokat. Ellenkező esetben törölje a teljes erőforráscsoportot, ha nem tervezi a fájlok használatát.

Az üzembe helyezési példány törlése

Csak az üzembe helyezési példányt törölje Azure Machine Learning https: /ml.azure.com/ címről, ha meg szeretné tartani az erőforráscsoportot és a munkaterületet más / oktatóanyagokhoz és feltáráshoz.

  1. Ugrás a Azure Machine Learning. Lépjen a munkaterületre, és a bal oldalon, az Eszközök panelen válassza a Végpontok lehetőséget.

  2. Válassza ki a törölni kívánt központi telepítést, majd válassza a Törlés lehetőséget.

  3. Válassza a Folytatás lehetőséget.

Az erőforráscsoport törlése

Fontos

A létrehozott erőforrások előfeltételként is használhatók más Azure Machine Learning oktatóanyagokban és útmutatókban.

Ha nem tervezi a létrehozott erőforrások használatát, törölje őket, így nem kell díjat fizetniük:

  1. Az Azure Portalon válassza az Erőforráscsoportok lehetőséget a bal szélen.

  2. Válassza ki a létrehozott erőforráscsoportot a listából.

  3. Válassza az Erőforráscsoport törlése elemet.

    Az Azure Portalon található erőforráscsoport törlését ábrázoló képernyőkép.

  4. Írja be az erőforráscsoport nevét. Ezután válassza a Törlés elemet.

Következő lépések

Ebben az automatizált gépi tanulási oktatóanyagban egy Azure Machine Learning automatizált ML használt besorolási modell létrehozásához és üzembe helyezéséhez. További információt és a következő lépéseket az alábbi cikkekben talál:

Megjegyzés

Ez a bank marketing-adatkészlet a Creative Commons (TARTOMÁNYVEZÉRLŐ: nyilvános tartomány)licenc keretében érhető el. Az adatbázis egyes tartalmaiban található jogosultságok a Database Contents License (Adatbázis tartalma) licenccel vannak licenccel, és a Kaggle-on érhetők el. Ez az adatkészlet eredetileg elérhető volt az UCI-adatbázisban Machine Learning adatbázisban.

[Moro et al., 2014] S. Moro, P. Cortez és P. Rita. A Data-Driven Approach to Predict the Success of Bank Telemarketing. (Adatvezérelt megközelítés a banki telemarketing sikerességének előrejelzéséhez.) Decision Support Systems, Elsevier, 62:22-31, 2014. június