Python SDK を詳しく見る

完了

重要

現在、Python SDK には、バージョン 1 (v1) とバージョン 2 (v2) の 2 つのバージョンがあります。 新しいプロジェクトでは v2 を使用すべきであるため、このユニットの内容は v2 のみを対象としていますv1 または v2 の決定に関する詳細を確認してください。

データ サイエンティストは、Azure Machine Learning を使って機械学習モデルをトレーニング、追跡、管理できます。 データ サイエンティストは、ほとんどの場合、機械学習ワークロード用の Azure Machine Learning ワークスペース内の資産を操作します。

ほとんどのデータ サイエンティストは Python に精通しているため、Azure Machine Learning には、Python を使ってワークスペースと対話できるようにソフトウェア開発キット (SDK) が用意されています。

Azure Machine Learning 用 Python SDK は、任意の Python 環境で使用できるデータ サイエンティストにとって最適なツールです。 普段作業するのが Jupyter ノートブックでも、Visual Studio Code でも、Python SDK をインストールしてワークスペースに接続できます。

Python SDK のインストール

お使いの Python 環境に Python SDK をインストールするには、Python 3.7 以降が必要です。 pip を使ってパッケージをインストールできます。

pip install azure-ai-ml

Note

Azure Machine Learning スタジオ内でノートブックを操作する際、Python 3.10 以降を使用する場合は、新しい Python SDK が既にインストールされています。 以前のバージョンの Python でも Python SDK v2 を使用できますが、最初にインストールする必要があります。

ワークスペースに接続する

Python SDK をインストールしたら、ワークスペースに接続する必要があります。 接続することで、環境を認証し、ワークスペースと対話して資産とリソースを作成および管理するようにします。

認証するには、次の 3 つの必要なパラメーターの値が必要です。

  • subscription_id: サブスクリプション ID。
  • resource_group: リソース グループの名前。
  • workspace_name: ワークスペースの名前。

次に、以下のコードを使って認証を定義できます。

from azure.ai.ml import MLClient
from azure.identity import DefaultAzureCredential

ml_client = MLClient(
    DefaultAzureCredential(), subscription_id, resource_group, workspace
)

認証を定義した後、環境がワークスペースに接続されるように MLClient を呼び出す必要があります。 ワークスペース内で資産やリソースを作成または更新したいときは、いつでも MLClient を呼び出します。

たとえば、モデルをトレーニングするための新しいジョブを作成するときに、ワークスペースに接続します。

from azure.ai.ml import command

# configure job
job = command(
    code="./src",
    command="python train.py",
    environment="AzureML-sklearn-0.24-ubuntu18.04-py37-cpu@latest",
    compute="aml-cluster",
    experiment_name="train-model"
)

# connect to workspace and submit job
returned_job = ml_client.create_or_update(job)

リファレンス ドキュメントを使う

Python SDK を効率的に使用するには、リファレンス ドキュメントを使う必要があります。 リファレンス ドキュメントには、Python SDK 内で使用可能なすべてのクラス、メソッド、パラメーターが記載されています。

MLClient クラスのリファレンス ドキュメントには、ワークスペースとの接続と対話に使用できるメソッドが含まれています。 さらに、各種エンティティに対して実行できる操作へのリンクもあります。たとえば、ワークスペース内の既存のデータストアを一覧表示する方法などです。

リファレンス ドキュメントには、操作できるすべてのエンティティのクラスの一覧も含まれています。 たとえば、Azure Blob Storage に、または Azure Data Lake Gen 2 にリンクするデータストアを作成する場合は、個別のクラスが存在します。

エンティティの一覧から AmlCompute のような特定のクラスを選択すると、クラスの使用方法や指定できるパラメーターに関する詳細なページを表示できます。