データストアの作成

適用対象:Azure CLI ml extension v2 (現行)Python SDK azure-ai-ml v2 (現行)

この記事では、Azure Machine Learning データストアを使用して Azure データ ストレージ サービスに接続する方法について説明します。

前提条件

Note

Machine Learning データストアでは、基になるストレージ アカウント リソースは作成されません。 代わりに、Machine Learning で使用するために "既存" のストレージ アカウントがリンクされます。 Machine Learning データストアは必要ありません。 基になるデータにアクセスできる場合は、ストレージ URI を直接使用できます。

Azure BLOB データストアを作成する

from azure.ai.ml.entities import AzureBlobDatastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureBlobDatastore(
    name="",
    description="",
    account_name="",
    container_name=""
)

ml_client.create_or_update(store)

Azure Data Lake Storage Gen2 データストアを作成する

from azure.ai.ml.entities import AzureDataLakeGen2Datastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureDataLakeGen2Datastore(
    name="",
    description="",
    account_name="",
    filesystem=""
)

ml_client.create_or_update(store)

Azure Files データストアを作成する

from azure.ai.ml.entities import AzureFileDatastore
from azure.ai.ml.entities import AccountKeyConfiguration
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureFileDatastore(
    name="file_example",
    description="Datastore pointing to an Azure File Share.",
    account_name="mytestfilestore",
    file_share_name="my-share",
    credentials=AccountKeyConfiguration(
        account_key= "XXXxxxXXXxXXXXxxXXXXXxXXXXXxXxxXxXXXxXXXxXXxxxXXxxXXXxXxXXXxxXxxXXXXxxxxxXXxxxxxxXXXxXXX"
    ),
)

ml_client.create_or_update(store)

Azure Data Lake Storage Gen1 データストアを作成する

from azure.ai.ml.entities import AzureDataLakeGen1Datastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureDataLakeGen1Datastore(
    name="",
    store_name="",
    description="",
)

ml_client.create_or_update(store)

OneLake (Microsoft Fabric) データストア (プレビュー) を作成する

このセクションでは、OneLake データストアを作成するためのさまざまなオプションについて説明します。 OneLake データストアは Microsoft Fabric の一部です。 現在、Machine Learning では、フォルダーまたはファイルおよび Amazon S3 ショートカットを含む Microsoft Fabric レイクハウスの成果物への接続がサポートされています。 レイクハウスの詳細については、「Microsoft Fabric のレイクハウスとは?」を参照してください。

OneLake データストアの作成には、Microsoft Fabric インスタンスからの次の情報が必要です。

  • エンドポイント
  • ファブリック ワークスペース名または GUID
  • 成果物名または GUID

次の 3 つのスクリーンショットは、Microsoft Fabric インスタンスから必要なこれらの情報リソースを取得する様子を示しています。

OneLake ワークスペース名

Microsoft Fabric インスタンスでは、このスクリーンショットに示すように、ワークスペースの情報を見つけることができます。 GUID 値または "フレンドリ名" のいずれかを使用して Machine Learning OneLake データストアを作成できます。

Microsoft Fabric UI の Microsoft Fabric ワークスペースの詳細を示すスクリーンショット。

OneLake エンドポイント

このスクリーンショットは、Microsoft Fabric インスタンスでエンドポイントの情報を検索する方法を示したものです。

Microsoft Fabric UI の Microsoft Fabric エンドポイントの詳細を示すスクリーンショット。

OneLake 成果物名

次のスクリーンショットは、Microsoft Fabric インスタンスで成果物の情報を検索する方法を示したものです。 このスクリーンショットでは、GUID 値またはフレンドリ名を使って Machine Learning OneLake データストアを作成する方法も示されています。

Microsoft Fabric UI の Microsoft Fabric レイクハウス成果物の詳細を取得する方法を示すスクリーンショット。

OneLake データストアを作成する

from azure.ai.ml.entities import OneLakeDatastore, OneLakeArtifact
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = OneLakeDatastore(
    name="onelake_example_id",
    description="Datastore pointing to an Microsoft fabric artifact.",
    one_lake_workspace_name="AzureML_Sample_OneLakeWS",
    endpoint="msit-onelake.dfs.fabric.microsoft.com"
    artifact = OneLakeArtifact(
        name="AzML_Sample_LH",
        type="lake_house"
    )
)

ml_client.create_or_update(store)

次のステップ