バッチエンドポイントを使用してパイプラインをデプロイする方法

[アーティクル]
11/15/2023

適用対象:Azure CLI ml extension v2 (現行)Python SDK azure-ai-ml v2 (現行)

Azure Machine Learning で操作するための便利な方法が提供されるため、パイプラインコンポーネントをバッチエンドポイントの下にデプロイできます。この記事では、単純なパイプラインを含むバッチデプロイを作成する方法について説明します。次のことを学習します。

パイプラインコンポーネントを作成して登録する
バッチエンドポイントを作成してパイプラインコンポーネントをデプロイする
展開をテスト

この例の概要

この例では、"hello world!" を出力する単純なコマンドジョブで構成されるパイプラインコンポーネントをデプロイします。このコンポーネントは、入力や出力を必要としない最も単純なパイプラインデプロイシナリオです。

この記事の例は、azureml-examples リポジトリに含まれているコードサンプルを基にしています。 YAML などのファイルをコピーして貼り付けることなくコマンドをローカルで実行するには、最初にリポジトリを複製してから、ディレクトリをそのフォルダーに変更します。

Azure CLI
Python

git clone https://github.com/Azure/azureml-examples --depth 1
cd azureml-examples/cli

git clone https://github.com/Azure/azureml-examples --depth 1
cd azureml-examples/sdk/python

この例のファイルは、次の場所にあります。

cd endpoints/batch/deploy-pipelines/hello-batch

Jupyter ノートブックで作業を進める

この例の Python SDK バージョンに沿って作業を進めることができます。そのためには、複製されたリポジトリで sdk-deploy-and-test.ipynb ノートブックを開きます。

前提条件

この記事の手順に従う前に、次の前提条件が満たされていることをご確認ください。

Azure サブスクリプション。 Azure サブスクリプションをお持ちでない場合は、開始する前に無料アカウントを作成してください。無料版または有料版の Azure Machine Learning をお試しください。
Azure Machine Learning ワークスペース。準備できていない場合は、Microsoft Azure Machine Learning ワークスペースの管理に関する記事の手順を使用して作成します。
ワークスペースに次のアクセス許可があることを確認します。
- バッチエンドポイントとバッチデプロイを作成または管理する: 所有者または共同作成者のロール、あるいは Microsoft.MachineLearningServices/workspaces/batchEndpoints/* を許可するカスタムロールを使用します。
- ワークスペースリソースグループに ARM デプロイを作成する: 所有者または共同作成者のロール、あるいはワークスペースがデプロイされているリソースグループで Microsoft.Resources/deployments/write を許可するカスタムロールを使用します。
Azure Machine Learning を使用するには、次のソフトウェアをインストールする必要があります。
- Azure CLI
- Python
Azure CLI と mlAzure Machine Learning 用の拡張機能。
```
az extension add -n ml
```
注意

Batch エンドポイントのパイプラインコンポーネントデプロイは、Azure CLI 用 ml 拡張機能のバージョン 2.7 で導入されました。 az extension update --name ml を使用して、最新バージョンを取得します。
Azure Machine Learning SDK for Python。
```
pip install azure-ai-ml
```
注意

クラス ModelBatchDeployment と PipelineComponentBatchDeployment は、SDK のバージョン 1.7.0 で導入されました。 pip install -U azure-ai-ml を使用して、最新バージョンを取得します。

ワークスペースに接続する

ワークスペースは、Azure Machine Learning の最上位のリソースで、Azure Machine Learning を使用するときに作成するすべての成果物を操作するための一元的な場所を提供します。このセクションでは、デプロイタスクを実行するワークスペースに接続します。

Azure CLI
Python

次のコードで、サブスクリプション ID、ワークスペース、場所、リソースグループの値を渡します。

az account set --subscription <subscription>
az configure --defaults workspace=<workspace> group=<resource-group> location=<location>

必要なライブラリをインポートします。

from azure.ai.ml import MLClient, Input, load_component
from azure.ai.ml.entities import BatchEndpoint, ModelBatchDeployment, ModelBatchDeploymentSettings, PipelineComponentBatchDeployment, Model, AmlCompute, Data, BatchRetrySettings, CodeConfiguration, Environment, Data
from azure.ai.ml.constants import AssetTypes, BatchDeploymentOutputAction
from azure.ai.ml.dsl import pipeline
from azure.identity import DefaultAzureCredential

ワークスペースの詳細を構成し、ワークスペースへのハンドルを取得します。

次のコードで、サブスクリプション ID、ワークスペース、リソースグループの値を渡します。
```
subscription_id = "<subscription>"
resource_group = "<resource-group>"
workspace = "<workspace>"

ml_client = MLClient(DefaultAzureCredential(), subscription_id, resource_group, workspace)
```

パイプラインコンポーネントを作成する

バッチエンドポイントでは、モデルまたはパイプラインコンポーネントをデプロイできます。パイプラインコンポーネントは再利用可能であり、共有レジストリを使用してこれらのコンポーネントをワークスペース間で移動することで、MLOps プラクティスを効率化できます。

この例のパイプラインコンポーネントには、ログに "hello world" メッセージのみを出力する 1 つのステップが含まれています。入力や出力は必要ありません。

hello-component/hello.yml ファイルには、パイプラインコンポーネントの構成が含まれています。

hello-component/hello.yml

$schema: https://azuremlschemas.azureedge.net/latest/pipelineComponent.schema.json
name: hello_batch
display_name: Hello Batch component
version: 1
type: pipeline
jobs:
  main_job:
    type: command
    component:
      code: src
      environment: azureml://registries/azureml/environments/sklearn-1.0/labels/latest
      command: >-
        python hello.py

コンポーネントを登録します。

Azure CLI
Python

az ml component create -f hello-component/hello.yml

hello_batch = load_component(source="hello-component/hello.yml")
hello_batch_registered = ml_client.components.create_or_update(hello_batch)

バッチエンドポイントを作成する

エンドポイントの名前を指定します。バッチエンドポイントの名前は、呼び出し URI の構成に使用されるため、各リージョンで一意である必要があります。一意性を確保するために、次のコードで指定する名前に末尾文字を追加します。
- Azure CLI
- Python
```
ENDPOINT_NAME="hello-batch"
```
```
endpoint_name = "hello-batch"
```

エンドポイントを構成します。

Azure CLI
Python

endpoint.yml ファイルには、エンドポイントの構成が含まれます。

endpoint.yml

$schema: https://azuremlschemas.azureedge.net/latest/batchEndpoint.schema.json
name: hello-batch
description: A hello world endpoint for component deployments.
auth_mode: aad_token

endpoint = BatchEndpoint(
    name=endpoint_name,
    description="A hello world endpoint for component deployments",
)

エンドポイントを作成します。

Azure CLI
Python

az ml batch-endpoint create --name $ENDPOINT_NAME  -f endpoint.yml

ml_client.batch_endpoints.begin_create_or_update(endpoint).result()

エンドポイント URI にクエリを実行します。

Azure CLI
Python

az ml batch-endpoint show --name $ENDPOINT_NAME

endpoint = ml_client.batch_endpoints.get(name=endpoint_name)
print(endpoint)

パイプラインコンポーネントをデプロイする

パイプラインコンポーネントをデプロイするには、バッチデプロイを作成する必要があります。デプロイは、実際の作業を行うアセットをホスティングするために必要なリソースのセットです。

コンピューティングクラスターを作成します。バッチエンドポイントとバッチデプロイは、コンピューティングクラスター上で実行されます。これらは、ワークスペースに既に存在する任意の Azure Machine Learning コンピューティングクラスター上で実行できます。したがって、複数のバッチデプロイが同じコンピューティングインフラストラクチャを共有できます。この例では、batch-cluster という名前の Azure Machine Learning コンピューティングクラスター上で作業します。ワークスペースにコンピューティングが存在することを確認し、存在しない場合は作成します。
- Azure CLI
- Python
```
az ml compute create -n batch-cluster --type amlcompute --min-instances 0 --max-instances 5
```
```
compute_name = "batch-cluster"
if not any(filter(lambda m: m.name == compute_name, ml_client.compute.list())):
    compute_cluster = AmlCompute(
        name=compute_name,
        description="Batch endpoints compute cluster",
        min_instances=0,
        max_instances=5,
    )
    ml_client.begin_create_or_update(compute_cluster).result()
```

デプロイを構成します。

Azure CLI
Python

deployment.yml ファイルには、デプロイの構成が含まれます。追加のプロパティについては、完全なバッチエンドポイント YAML スキーマを確認してください。

deployment.yml

$schema: https://azuremlschemas.azureedge.net/latest/pipelineComponentBatchDeployment.schema.json
name: hello-batch-dpl
endpoint_name: hello-pipeline-batch
type: pipeline
component: azureml:hello_batch@latest
settings:
    default_compute: batch-cluster

deployment = PipelineComponentBatchDeployment(
    name="hello-batch-dpl",
    description="A hello world deployment with a single step.",
    endpoint_name=endpoint.name,
    component=hello_batch,
    settings={"continue_on_step_failure": False, "default_compute": compute_name},
)

デプロイを作成します。
- Azure CLI
- Python
次のコードを実行して、バッチエンドポイントの下にバッチデプロイを作成し、それを既定のデプロイとして設定します。
```
az ml batch-deployment create --endpoint $ENDPOINT_NAME -f deployment.yml --set-default
```
ヒント

この新しいデプロイが既定になったことを示すために --set-default フラグが使用されていることに注目してください。
このコマンドは、デプロイの作成を開始し、デプロイの作成が続行されている間に確認応答を返します。
```
ml_client.batch_deployments.begin_create_or_update(deployment).result()
```
作成したら、この新しいデプロイを既定として構成します。
```
endpoint = ml_client.batch_endpoints.get(endpoint_name)
endpoint.defaults.deployment_name = deployment.name
ml_client.batch_endpoints.begin_create_or_update(endpoint).result()
```
デプロイを使用する準備が整いました。

展開をテスト

デプロイが作成されると、ジョブを受け取る準備が整います。次のように、既定のデプロイを呼び出すことができます。

Azure CLI
Python

JOB_NAME=$(az ml batch-endpoint invoke -n $ENDPOINT_NAME --query name -o tsv)

job = ml_client.batch_endpoints.invoke(
    endpoint_name=endpoint.name,
)

ヒント

この例では、パイプラインに入力または出力がありません。ただし、このパイプラインコンポーネントにいくつか入力や出力が必要な場合は、呼び出し時に指示できます。入力と出力を指示する方法について詳しく確認するには、「バッチエンドポイントのジョブと入力データを作成する」を参照するか、「前処理を使用してバッチスコアリングを実行するパイプラインをデプロイする方法 (プレビュー)」に関するチュートリアルをご参照ください。

次を使用して、ログの表示およびストリーミングの進行状況を監視できます。

Azure CLI
Python

az ml job stream -n $JOB_NAME

ml_client.jobs.get(job.name)

ジョブが完了するまで待つには、次のコードを実行します。

ml_client.jobs.stream(name=job.name)

リソースをクリーンアップする

完了したら、関連付けられているリソースをワークスペースから削除します。

Azure CLI
Python

次のコードを実行して、バッチエンドポイントとその基になっているデプロイを削除します。 --yes は、削除を確認するために使用します。

az ml batch-endpoint delete -n $ENDPOINT_NAME --yes

エンドポイントを削除します:

ml_client.batch_endpoints.begin_delete(endpoint_name).result()

(オプション) 後のデプロイでコンピューティングクラスターを再利用する予定がない場合は、コンピューティングを削除します。

Azure CLI
Python

az ml compute delete -n batch-cluster

ml_client.compute.begin_delete(name="batch-cluster")

バッチエンドポイントを使用してパイプラインをデプロイする方法

この例の概要

Jupyter ノートブックで作業を進める

前提条件

ワークスペースに接続する

パイプラインコンポーネントを作成する

バッチエンドポイントを作成する

パイプラインコンポーネントをデプロイする

展開をテスト

リソースをクリーンアップする

次のステップ

その他のリソース

バッチ エンドポイントを使用してパイプラインをデプロイする方法

この例の概要

Jupyter ノートブックで作業を進める

前提条件

ワークスペースに接続する

パイプライン コンポーネントを作成する

バッチ エンドポイントを作成する

パイプライン コンポーネントをデプロイする

展開をテスト

リソースをクリーンアップする

次のステップ

その他のリソース

バッチエンドポイントを使用してパイプラインをデプロイする方法

パイプラインコンポーネントを作成する

バッチエンドポイントを作成する

パイプラインコンポーネントをデプロイする