Share via


Gépi tanulási folyamatok létrehozása és futtatása összetevők használatával az Azure Machine Tanulás Studióval

ÉRVÉNYES:Azure CLI ml-bővítmény 2-es verzió (aktuális)

Ebből a cikkből megtudhatja, hogyan hozhat létre és futtathat gépi tanulási folyamatokat az Azure Machine Tanulás studio és components használatával. A folyamatokat összetevők használata nélkül is létrehozhatja, de az összetevők nagyobb rugalmasságot és újrafelhasználást biztosítanak. Az Azure Machine Tanulás Pipelines definiálható a YAML-ben, és futtatható a parancssori felületről, python nyelven, vagy az Azure Machine Tanulás Studio Tervező egy húzással használható felhasználói felülettel. Ez a dokumentum az Azure Machine Tanulás studio designer felhasználói felületére összpontosít.

Előfeltételek

  • Ha még nincs Azure-előfizetése, kezdés előtt hozzon létre egy ingyenes fiókot. Próbálja ki az Azure Machine Tanulás ingyenes vagy fizetős verzióját.

  • Azure Machine Tanulás munkaterületi erőforrások létrehozása.

  • Telepítse és állítsa be a Machine Tanulás Azure CLI-bővítményét.

  • Klónozza a példák adattárát:

    git clone https://github.com/Azure/azureml-examples --depth 1
    cd azureml-examples/cli/jobs/pipelines-with-components/
    

Feljegyzés

Tervező kétféle összetevőt támogat, a klasszikus előre összeállított összetevőket (v1) és az egyéni összetevőket (v2). Ez a két összetevőtípus NEM kompatibilis.

A klasszikus előre összeállított összetevők elsősorban az adatfeldolgozáshoz és a hagyományos gépi tanulási feladatokhoz, például a regresszióhoz és a besoroláshoz biztosítanak előre összeállított összetevőket. Ez az összetevőtípus továbbra is támogatott marad, de nem lesznek új összetevők hozzáadva.

Az egyéni összetevők lehetővé teszik, hogy a saját kódját összetevőként csomagolja. Támogatja az összetevők munkaterületek közötti megosztását és a közvetlen létrehozást a stúdió, a CLI v2 és az SDK v2-felületeken.

Új projektek esetén javasoljuk, hogy egyéni összetevőt használjon, amely kompatibilis az AzureML V2-vel, és folyamatosan új frissítéseket fog kapni.

Ez a cikk egyéni összetevőkre vonatkozik.

Összetevő regisztrálása a munkaterületen

Ahhoz, hogy a folyamat összetevőket használjon a felhasználói felületen, először regisztrálnia kell az összetevőket a munkaterületen. A felhasználói felület, a parancssori felület vagy az SDK használatával regisztrálhatja az összetevőket a munkaterületen, így megoszthatja és újra felhasználhatja az összetevőt a munkaterületen belül. A regisztrált összetevők támogatják az automatikus verziószámozást, így frissítheti az összetevőt, de biztosíthatja, hogy a régebbi verziót igénylő folyamatok továbbra is működjenek.

Az alábbi példa felhasználói felületen regisztrálja az összetevőket, és az összetevő forrásfájljai azazureml-examplescli/jobs/pipelines-with-components/basics/1b_e2e_registered_componentsadattár könyvtárában találhatók. Először klónoznia kell az adattárat a helyire.

  1. Az Azure Machine Tanulás munkaterületen lépjen az Összetevők lapra, és válassza az Új összetevő lehetőséget (a két stíluslap egyike megjelenik).

Képernyőkép a bejegyzés regisztrálása gombról az összetevőlapon.

Képernyőkép a regisztrációs bejegyzés gombról az összetevőlapon, amely tartalmazza az archívumot.

Ez a példa a címtárban találhatótrain.yml. A YAML-fájl határozza meg az összetevő nevét, típusát, felületét, beleértve a bemeneteket és kimeneteket, a kódot, a környezetet és az összetevő parancsát. Az összetevő train.py kódja a mappa alatt ./train_src található, amely az összetevő végrehajtási logikáját írja le. Az összetevősémával kapcsolatos további információkért tekintse meg a parancsösszetevő YAML-sémareferenciáját.

Feljegyzés

Ha összetevőket regisztrál a felhasználói felületen, code az összetevő YAML-fájljában meghatározottak csak arra a mappára mutathatnak, amelyben a YAML-fájl található vagy az almappák, ami azt jelenti, hogy nem adható meg ../code , mert a felhasználói felület nem ismeri fel a szülőkönyvtárat. additional_includes csak az aktuális vagy almappára mutathat. A felhasználói felület jelenleg csak típussal command támogatja az összetevők regisztrálását.

  1. Válassza a Feltöltés mappából lehetőséget, és válassza ki a 1b_e2e_registered_components feltölteni kívánt mappát. Válasszon train.yml a legördülő listából.

Képernyőkép a helyi mappából való feltöltésről.

  1. Kattintson a Tovább gombra az alján, és megerősítheti ennek az összetevőnek a részleteit. Miután megerősítette, válassza a Létrehozás lehetőséget a regisztrációs folyamat befejezéséhez.

  2. Ismételje meg az előző lépéseket a Score és az Eval összetevő regisztrálásához és használatával score.ymleval.yml is.

  3. A három összetevő sikeres regisztrálása után az összetevők megjelennek a studio felhasználói felületén.

Képernyőkép a regisztrált összetevőről az összetevőlapon.

Folyamat létrehozása regisztrált összetevővel

  1. Hozzon létre egy új folyamatot a tervezőben. Ne felejtse el kiválasztani az Egyéni lehetőséget.

    Képernyőkép az új folyamat tervezői kezdőlapon való létrehozásáról.

  2. Adjon értelmes nevet a folyamatnak az automatikusan létrehozott név mellett a ceruza ikon kiválasztásával.

    A folyamat átnevezését bemutató képernyőkép.

  3. A tervezőeszköztárban megtekintheti az Adatok, a Modell és az Összetevők lapot. Váltson az Összetevők lapra, és láthatja az előző szakaszban regisztrált összetevőket. Ha túl sok összetevő van, az összetevő nevével kereshet.

    Képernyőkép a regisztrált összetevőről az eszköztárban.

    Keresse meg az előző szakaszban regisztrált vonat-, pontszám- és eval-összetevőket, majd húzza őket a vászonra. Alapértelmezés szerint az összetevő alapértelmezett verzióját használja, és az összetevő jobb oldali ablaktábláján egy adott verzióra válthat. Az összetevő jobb oldali ablaktábláját az összetevőre duplán kattintva hívja meg a rendszer.

    Képernyőkép az összetevő verziójának módosításáról.

    Ebben a példában az elérési út alatti mintaadatokat fogjuk használni. Regisztrálja az adatokat a munkaterületen a tervezőeszköztár Hozzáadás ikonjának kiválasztásával –> Adat lap, Típus = Mappa(uri_folder) beállítás, majd a varázslót követve regisztrálja az adatokat. Az adattípusnak uri_folder kell lennie a betanítási összetevő definíciójával való összhangban.

    Képernyőkép az adatok hozzáadásáról.

    Ezután húzza az adatokat a vászonra. A folyamatnak most az alábbi képernyőképhez hasonlóan kell kinéznie.

    Képernyőkép a folyamat piszkozatról.

  4. Csatlakozás az adatokat és összetevőket a vásznon lévő kapcsolatok húzásával.

    A folyamat csatlakoztatását ábrázoló gif.

  5. Kattintson duplán egy összetevőre, és megjelenik egy jobb oldali panel, ahol konfigurálhatja az összetevőt.

    Képernyőkép az összetevőparaméter-beállításokról.

    Az olyan primitív típusú bemenetekkel rendelkező összetevők esetében, mint a szám, az egész szám, a sztring és a logikai érték, az összetevők részletes paneljén, a Bemenetek szakaszban módosíthatja az ilyen bemenetek értékeit .

    A jobb oldali panelen módosíthatja a kimeneti beállításokat (az összetevő kimenetének tárolási helyét), és futtathatja a beállításokat (számítási cél az összetevő futtatásához).

    Most előléptetjük a vonatösszetevő max_epocs bemenetét folyamatszintű bemenetre. Így a folyamat elküldése előtt minden alkalommal hozzárendelhet egy másik értéket ehhez a bemenethez.

    Képernyőkép az összetevő bemenetének folyamatbemenetre való előléptetéséről.

Feljegyzés

Az egyéni összetevők és a tervező klasszikus előre összeállított összetevői nem használhatók együtt.

Folyamat elküldése

  1. A folyamat elküldéséhez válassza a Konfigurálás > Küldés lehetőséget a jobb felső sarokban.

    A Konfigurálás és küldés gomb képernyőképe.

  2. Ezután megjelenik egy lépésenkénti varázsló, amely a varázslót követve küldi el a folyamatfeladatot.

Képernyőkép a beküldési varázslóról.

Az Alapszintű lépésekben konfigurálhatja a kísérletet, a feladat megjelenítendő nevét, a feladat leírását stb.

A Bemenetek és kimenetek lépésben konfigurálhatja a folyamatszintre előléptetett bemeneteket/kimeneteket. Az előző lépésben előléptettük a folyamatbemenetbe való betanítási összetevő max_epocs, így itt láthatja és hozzárendelheti az értéket max_epocs.

A futtatókörnyezet beállításaiban konfigurálhatja a folyamat alapértelmezett adattárát és alapértelmezett számítását. Ez a folyamat összes összetevőjének alapértelmezett adattára/számítása. Vegye figyelembe azonban, hogy ha explicit módon állít be egy másik számítási vagy adattárat egy összetevőhöz, a rendszer tiszteletben tartja az összetevőszint-beállítást. Ellenkező esetben a folyamat alapértelmezett értékét használja.

A Felülvizsgálat + Küldés lépés az utolsó lépés az összes konfiguráció áttekintéséhez a küldés előtt. A varázsló emlékszik a legutóbbi konfigurálásra, ha valaha is beküldi a folyamatot.

A folyamatfeladat elküldése után a tetején egy üzenet jelenik meg, amely a feladat részleteire mutató hivatkozást tartalmaz. Erre a hivatkozásra kattintva áttekintheti a feladat részleteit.

Képernyőkép a beküldési üzenetről.

Következő lépések