Share via


Azure Machine Tanulás modellek futtatása a Fabricből kötegelt végpontok használatával (előzetes verzió)

ÉRVÉNYES:Azure CLI ml-bővítmény v2 (aktuális)Python SDK azure-ai-ml v2 (aktuális)

Ebből a cikkből megtudhatja, hogyan használhatja fel az Azure Machine-Tanulás Kötegelt üzembe helyezéseket a Microsoft Fabricből. Bár a munkafolyamat kötegelt végpontokon üzembe helyezett modelleket használ, támogatja a Batch-folyamatok Fabricből történő üzembe helyezését is.

Fontos

Ez a funkció jelenleg nyilvános előzetes verzióban érhető el. Ez az előzetes verzió szolgáltatásszintű szerződés nélkül érhető el, és éles számítási feladatokhoz nem javasoljuk. Előfordulhat, hogy néhány funkció nem támogatott, vagy korlátozott képességekkel rendelkezik.

For more information, see Supplemental Terms of Use for Microsoft Azure Previews.

Előfeltételek

  • Microsoft Fabric-előfizetés lekérése. Vagy regisztráljon egy ingyenes Microsoft Fabric-próbaverzióra.
  • Jelentkezzen be a Microsoft Fabricbe.
  • Azure-előfizetés. Ha még nincs Azure-előfizetése, kezdés előtt hozzon létre egy ingyenes fiókot. Próbálja ki az Azure Machine Tanulás ingyenes vagy fizetős verzióját.
  • Egy Azure Machine Learning-munkaterület. Ha nincs ilyenje, a munkaterületek kezelésének lépéseit követve hozzon létre egyet.
    • Győződjön meg arról, hogy rendelkezik a következő engedélyekkel a munkaterületen:
      • Batch-végpontok és -üzemelő példányok létrehozása/kezelése: Szerepkörök használata Tulajdonos, közreműködő vagy egyéni szerepkör engedélyezése.Microsoft.MachineLearningServices/workspaces/batchEndpoints/*
      • ARM-üzemelő példányok létrehozása a munkaterület erőforráscsoportjában: Szerepkörök használata Tulajdonos, közreműködő vagy egyéni szerepkör használata, amely lehetővé teszi Microsoft.Resources/deployments/write abban az erőforráscsoportban, ahol a munkaterület üzembe van helyezve.
  • Batch-végponton üzembe helyezett modell. Ha nincs ilyenje, a modellek üzembe helyezésének lépéseivel pontozást hozhat létre a kötegelt végpontokon .
  • Töltse le a heart-unlabeled.csv mintaadatkészletet a pontozáshoz.

Architektúra

Az Azure Machine Tanulás nem férnek hozzá közvetlenül a Fabric OneLake-ben tárolt adatokhoz. A OneLake funkciójával azonban parancsikonokat hozhat létre a Lakehouse-ban az Azure Data Lake Gen2-ben tárolt adatok olvasásához és írásához. Mivel az Azure Machine Tanulás támogatja az Azure Data Lake Gen2-tárolót, ez a beállítás lehetővé teszi a Fabric és az Azure Machine Tanulás együttes használatát. Az adatarchitektúra a következő:

A diagram showing how Azure Storage accounts are used to connect Fabric with Azure Machine Learning.

Adathozzáférés konfigurálása

Ha lehetővé szeretné tenni, hogy a Fabric és az Azure Machine Tanulás másolás nélkül olvassa és írja ugyanazokat az adatokat, használhatja a OneLake-billentyűparancsokat és az Azure Machine Tanulás adattárakat. Ha egy OneLake-parancsikont és egy adattárat ugyanarra a tárfiókra mutat, gondoskodhat arról, hogy a Fabric és az Azure Machine Tanulás ugyanarra a mögöttes adatra olvassanak és írjanak.

Ebben a szakaszban létrehoz vagy azonosít egy tárfiókot, amely a batch végpont által használt információk tárolására szolgál, és amelyeket a Fabric-felhasználók látni fognak a OneLake-ben. A Fabric csak a hierarchikus neveket engedélyező tárfiókokat támogatja, például az Azure Data Lake Gen2-t.

OneLake-parancsikon létrehozása a tárfiókhoz

  1. Nyissa meg a Synapse adatmérnök ing felületet a Fabricben.

  2. A bal oldali panelen válassza ki a Háló munkaterületet a megnyitásához.

  3. Nyissa meg a lakehouse-t, amellyel konfigurálhatja a kapcsolatot. Ha még nem rendelkezik tóházzal, lépjen a adatmérnök élményre, hogy létrehozhasson egy tóházat. Ebben a példában egy megbízható nevű tóházat használ.

  4. A bal oldali navigációs sávon nyisson meg további fájlbeállításokat, majd válassza az Új parancsikont a varázsló megnyitásához.

    A screenshot showing how to create a new shortcut in a lakehouse.

  5. Válassza az Azure Data Lake Storage Gen2 lehetőséget.

    A screenshot showing how to create an Azure Data Lake Storage Gen2 shortcut.

  6. A Csatlakozás ion-beállítások szakaszban illessze be az Azure Data Lake Gen2 tárfiókhoz társított URL-címet.

    A screenshot showing how to configure the URL of the shortcut.

  7. A Csatlakozás ion hitelesítő adatok szakaszában:

    1. A Csatlakozás ion esetében válassza az Új kapcsolat létrehozása lehetőséget.
    2. A Csatlakozás ion neve esetén tartsa meg az alapértelmezett kitöltött értéket.
    3. Hitelesítési típus esetén válassza a szervezeti fiókot a csatlakoztatott felhasználó hitelesítő adatainak az OAuth 2.0-s verzióján keresztül történő használatához.
    4. A bejelentkezéshez válassza a Bejelentkezés lehetőséget.
  8. Válassza a Következő lehetőséget.

  9. Szükség esetén konfigurálja a parancsikon elérési útját a tárfiókhoz képest. Ezzel a beállítással konfigurálhatja azt a mappát, amelyre a parancsikon mutat.

  10. Konfigurálja a parancsikon nevét . Ez a név egy útvonal lesz a tóparton belül. Ebben a példában nevezze el a parancsikon-adathalmazokat.

  11. Save the changes.

Tárfiókra mutató adattár létrehozása

  1. Nyissa meg az Azure Machine Tanulás studiót.

  2. Nyissa meg az Azure Machine Tanulás-munkaterületet.

  3. Lépjen az Adatok szakaszra.

  4. Válassza az Adattárak lapot.

  5. Select Create.

  6. Konfigurálja az adattárat az alábbiak szerint:

    1. Az adattár neveként adja meg a trusted_blob.

    2. A Datastore típushoz válassza az Azure Blob Storage lehetőséget.

      Tipp.

      Miért érdemes az Azure Blob Storage-t konfigurálni az Azure Data Lake Gen2 helyett? A Batch-végpontok csak Blob Storage-fiókokba írhatnak előrejelzéseket. Azonban minden Azure Data Lake Gen2-tárfiók egyben blobtároló fiók is; ezért felcserélhetőek.

    3. Válassza ki a tárfiókot a varázslóból az Előfizetés azonosítója, a Tárfiók és a Blob-tároló (fájlrendszer) használatával.

      A screenshot showing how to configure the Azure Machine Learning data store.

    4. Select Create.

  7. Győződjön meg arról, hogy a kötegelt végpontot futtató számítás rendelkezik engedéllyel az adatok csatlakoztatására ebben a tárfiókban. Bár a végpontot megindító identitás továbbra is hozzáférést biztosít, a kötegelt végpont futtatásához szükséges számításnak engedéllyel kell rendelkeznie a megadott tárfiók csatlakoztatásához. További információ: Hozzáférés a tárolási szolgáltatásokhoz.

Mintaadatkészlet feltöltése

Töltsön fel néhány mintaadatot a végponthoz bemenetként való használatra:

  1. Lépjen a Háló munkaterületre.

  2. Válassza ki azt a tóházat, ahol létrehozta a parancsikont.

  3. Lépjen az adathalmazok parancsikonjához .

  4. Hozzon létre egy mappát a pontozáshoz használni kívánt mintaadatkészlet tárolásához. Nevezze el a mappát uci-heart-unlabeled.

  5. Használja az Adatok lekérése lehetőséget, és válassza a Fájlok feltöltése lehetőséget a heart-unlabeled.csv mintaadatkészlet feltöltéséhez.

    A screenshot showing how to upload data to an existing folder in OneLake.

  6. Töltse fel a mintaadatkészletet.

    A screenshot showing how to upload a file to OneLake.

  7. A mintafájl készen áll a használatra. Jegyezze fel annak a helynek az elérési útját, ahol mentette.

Háló létrehozása a következtetési folyamat kötegeléséhez

Ebben a szakaszban létrehoz egy Háló–köteg következtetési folyamatot a meglévő Fabric-munkaterületen, és meghívja a kötegvégpontokat.

  1. Térjen vissza a adatmérnök felületre (ha már ellépett tőle), a kezdőlap bal alsó sarkában található felületválasztó ikonnal.

  2. Nyissa meg a Fabric-munkaterületet.

  3. A kezdőlap Új szakaszában válassza az Adatfolyamat lehetőséget.

  4. Nevezze el a folyamatot, és válassza a Létrehozás lehetőséget.

    A screenshot showing where to select the data pipeline option.

  5. Válassza a Tevékenységek lapot a tervezővásznon lévő eszköztárról.

  6. A lap végén válassza ki a további lehetőségeket, majd válassza az Azure Machine Tanulás lehetőséget.

    A screenshot showing how to add the Azure Machine Learning activity to a pipeline.

  7. Lépjen a Gépház lapra, és konfigurálja a tevékenységet az alábbiak szerint:

    1. Válassza az Új lehetőséget az Azure Machine Tanulás kapcsolat mellett, ha új kapcsolatot szeretne létrehozni az Üzembe helyezést tartalmazó Azure Machine Tanulás-munkaterülethez.

      A screenshot of the configuration section of the activity showing how to create a new connection.

    2. A létrehozási varázsló Csatlakozás ion beállítások szakaszában adja meg az előfizetés azonosítójának, az erőforráscsoport nevének és a munkaterület nevének értékeit, ahol a végpont telepítve van.

      A screenshot showing examples of the values for subscription ID, resource group name, and workspace name.

    3. A Csatlakozás ion hitelesítő adatok szakaszban válassza a Szervezeti fiókot a kapcsolat hitelesítési típusának értékeként. A szervezeti fiók a csatlakoztatott felhasználó hitelesítő adatait használja. Másik lehetőségként használhatja a szolgáltatásnevet. Az éles beállításokban azt javasoljuk, hogy szolgáltatásnevet használjon. A hitelesítési típustól függetlenül győződjön meg arról, hogy a kapcsolathoz társított identitás jogosult meghívni az üzembe helyezett kötegelt végpontot.

      A screenshot showing how to configure the authentication mechanism in the connection.

    4. Mentse a kapcsolatot. A kapcsolat kiválasztása után a Háló automatikusan feltölti a kijelölt munkaterületen elérhető kötegvégpontokat.

  8. Batch-végpont esetén válassza ki a meghívni kívánt kötegvégpontot. Ebben a példában válassza ki a szívosztályozót-....

    A screenshot showing how to select an endpoint once a connection is configured.

    A Batch üzembe helyezési szakasza automatikusan feltöltődik a végpont alatt elérhető központi telepítésekkel.

  9. Batch-üzembe helyezés esetén szükség esetén válasszon ki egy adott üzembe helyezést a listából. Ha nem választ ki üzembe helyezést, a Fabric meghívja az alapértelmezett üzembe helyezést a végpont alatt, így a batch végpont létrehozója eldöntheti, hogy melyik üzembe helyezést hívja meg. A legtöbb esetben meg szeretné tartani ezt az alapértelmezett viselkedést.

    A screenshot showing how to configure the endpoint to use the default deployment.

Bemenetek és kimenetek konfigurálása a kötegvégponthoz

Ebben a szakaszban a kötegelt végpont bemeneteit és kimeneteit konfigurálja. A kötegvégpontok bemenetei a folyamat futtatásához szükséges adatokat és paramétereket szolgáltatják. Az Azure Machine Tanulás batch-folyamat a Fabricben támogatja a modelltelepítéseket és a folyamattelepítéseket is. A megadott bemenetek száma és típusa az üzembe helyezés típusától függ. Ebben a példában olyan modelltelepítést használ, amely pontosan egy bemenetet igényel, és egyetlen kimenetet hoz létre.

A kötegelt végpontok bemenetéről és kimenetéről további információt a Batch-végpontok bemeneteinek és kimeneteinek ismertetése című témakörben talál.

A bemeneti szakasz konfigurálása

Konfigurálja a Feladatbemenetek szakaszt az alábbiak szerint:

  1. Bontsa ki a Feladat bemenetek szakaszt .

  2. Válassza az Új lehetőséget, ha új bemenetet szeretne hozzáadni a végponthoz.

  3. Nevezze el a bemenetet input_data. Mivel modelltelepítést használ, bármilyen nevet használhat. A folyamattelepítések esetében azonban meg kell adnia a modell által várt bemenet pontos nevét.

  4. A bemeneti tulajdonság (név és érték mező) megnyitásához válassza az imént hozzáadott bemenet melletti legördülő menüt.

  5. Írja be JobInputType a Név mezőbe a létrehozott bemenet típusát.

  6. Írja be UriFolder az Érték mezőbe, hogy jelezze, hogy a bemenet egy mappa elérési útja. A mező egyéb támogatott értékei az UriFile (fájl elérési útja) vagy a Literál (bármilyen literális érték, például sztring vagy egész szám). Az üzembe helyezés által elvárt típust kell használnia.

  7. A tulajdonság melletti pluszjel kiválasztásával adjon hozzá egy másik tulajdonságot ehhez a bemenethez.

  8. Írja be Uri a Név mezőbe az adatok elérési útját.

  9. Adja meg azureml://datastores/trusted_blob/datasets/uci-heart-unlabeledaz adatok megkeresésének elérési útját az Érték mezőben. Itt egy olyan elérési utat használ, amely a OneLake in Fabrichez és az Azure Machine Tanulás társított tárfiókhoz vezet. azureml://datastores/trusted_blob/datasets/uci-heart-unlabeled a CSV-fájlok elérési útja a kötegvégponton üzembe helyezett modell várt bemeneti adataival. A tárfiók közvetlen elérési útját is használhatja, például https://<storage-account>.dfs.azure.com.

    A screenshot showing how to configure inputs in the endpoint.

    Tipp.

    Ha a bemenet literál típusú, cserélje le a tulajdonságot Uri az "Érték" értékre.

Ha a végpont több bemenetet igényel, ismételje meg mindegyiknél az előző lépéseket. Ebben a példában a modelltelepítések pontosan egy bemenetet igényelnek.

A kimeneti szakasz konfigurálása

Konfigurálja a Feladat kimenetek szakaszt az alábbiak szerint:

  1. Bontsa ki a Feladat kimenetek szakaszt .

  2. Válassza az Új lehetőséget, ha új kimenetet szeretne hozzáadni a végponthoz.

  3. A fájl neve legyen output_data. Mivel modelltelepítést használ, bármilyen nevet használhat. Folyamattelepítések esetén azonban meg kell adnia a modell által generált kimenet pontos nevét.

  4. Válassza az imént hozzáadott kimenet melletti legördülő menüt a kimenet tulajdonságának (név és érték mező) megnyitásához.

  5. Írja be JobOutputType a Név mezőbe a létrehozott kimenet típusát.

  6. Írja be UriFile az Érték mezőbe, hogy jelezze, hogy a kimenet egy fájl elérési útja. A mező másik támogatott értéke az UriFolder (mappa elérési útja). A feladatbeviteli szakasztól eltérően a literál (bármilyen literális érték, például sztring vagy egész szám) kimenetként nem támogatott.

  7. Válassza ki a tulajdonság melletti pluszjelet, ha egy másik tulajdonságot szeretne hozzáadni ehhez a kimenethez.

  8. Írja be Uri a Név mezőbe az adatok elérési útját.

  9. Adja meg @concat(@concat('azureml://datastores/trusted_blob/paths/endpoints', pipeline().RunId, 'predictions.csv')a kimenet elhelyezésének elérési útját az Érték mezőben. Az Azure Machine Tanulás kötegelt végpontok csak az adattár elérési útjait támogatják kimenetként. Mivel a kimeneteknek egyedinek kell lenniük az ütközések elkerülése érdekében, dinamikus kifejezést használt az @concat(@concat('azureml://datastores/trusted_blob/paths/endpoints', pipeline().RunId, 'predictions.csv')elérési út létrehozásához.

    A screenshot showing how to configure outputs in the endpoint

Ha a végpont több kimenetet ad vissza, ismételje meg mindegyiknél az előző lépéseket. Ebben a példában a modelltelepítések pontosan egy kimenetet hoznak létre.

(Nem kötelező) A feladatbeállítások konfigurálása

A feladatbeállításokat a következő tulajdonságok hozzáadásával is konfigurálhatja:

Modelltelepítések esetén:

Beállítás Description
MiniBatchSize A köteg mérete.
ComputeInstanceCount Az üzembe helyezésből kérendő számítási példányok száma.

Folyamattelepítések esetén:

Beállítás Description
ContinueOnStepFailure Azt jelzi, hogy a folyamat leállítja-e a csomópontok feldolgozását egy hiba után.
DefaultDatastore A kimenetekhez használni kívánt alapértelmezett adattárat jelzi.
ForceRun Azt jelzi, hogy a folyamatnak az összes összetevő futtatására kell-e kényszerítenie, még akkor is, ha a kimenet egy korábbi futtatásból származtatható.

A konfigurálás után tesztelheti a folyamatot.