Membuat datastore

BERLAKU UNTUK:Ekstensi ml Azure CLI v2 (saat ini)Python SDK azure-ai-ml v2 (saat ini)

Dalam artikel ini, Anda mempelajari cara menyambungkan ke layanan penyimpanan data Azure dengan penyimpanan data Azure Pembelajaran Mesin.

Prasyarat

Catatan

Pembelajaran Mesin datastore tidak membuat sumber daya akun penyimpanan yang mendasar. Sebagai gantinya, mereka menautkan akun penyimpanan yang ada untuk penggunaan Pembelajaran Mesin. Pembelajaran Mesin datastore tidak diperlukan. Jika Anda memiliki akses ke data yang mendasar, Anda dapat menggunakan URI penyimpanan secara langsung.

Membuat datastore Azure Blob

from azure.ai.ml.entities import AzureBlobDatastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureBlobDatastore(
    name="",
    description="",
    account_name="",
    container_name=""
)

ml_client.create_or_update(store)

Membuat datastore Azure Data Lake Storage Gen2

from azure.ai.ml.entities import AzureDataLakeGen2Datastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureDataLakeGen2Datastore(
    name="",
    description="",
    account_name="",
    filesystem=""
)

ml_client.create_or_update(store)

Membuat datastore Azure Files

from azure.ai.ml.entities import AzureFileDatastore
from azure.ai.ml.entities import AccountKeyConfiguration
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureFileDatastore(
    name="file_example",
    description="Datastore pointing to an Azure File Share.",
    account_name="mytestfilestore",
    file_share_name="my-share",
    credentials=AccountKeyConfiguration(
        account_key= "XXXxxxXXXxXXXXxxXXXXXxXXXXXxXxxXxXXXxXXXxXXxxxXXxxXXXxXxXXXxxXxxXXXXxxxxxXXxxxxxxXXXxXXX"
    ),
)

ml_client.create_or_update(store)

Membuat datastore Azure Data Lake Storage Gen1

from azure.ai.ml.entities import AzureDataLakeGen1Datastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureDataLakeGen1Datastore(
    name="",
    store_name="",
    description="",
)

ml_client.create_or_update(store)

Membuat datastore OneLake (Microsoft Fabric) (pratinjau)

Bagian ini menjelaskan berbagai opsi untuk membuat datastore OneLake. Datastore OneLake adalah bagian dari Microsoft Fabric. Saat ini, Pembelajaran Mesin mendukung koneksi ke artefak Lakehouse Microsoft Fabric yang menyertakan folder atau file dan pintasan Amazon S3. Untuk informasi selengkapnya tentang lakehouse, lihat Apa itu lakehouse di Microsoft Fabric?.

Pembuatan datastore OneLake memerlukan informasi berikut dari instans Microsoft Fabric Anda:

  • Titik akhir
  • Nama ruang kerja fabric atau GUID
  • Nama artefak atau GUID

Tiga cuplikan layar berikut menjelaskan pengambilan sumber daya informasi yang diperlukan ini dari instans Microsoft Fabric Anda.

Nama ruang kerja OneLake

Dalam instans Microsoft Fabric, Anda dapat menemukan informasi ruang kerja, seperti yang ditunjukkan pada cuplikan layar ini. Anda dapat menggunakan nilai GUID atau "nama yang mudah diingat" untuk membuat Pembelajaran Mesin datastore OneLake.

Cuplikan layar yang memperlihatkan detail ruang kerja Microsoft Fabric di UI Microsoft Fabric.

Titik akhir OneLake

Cuplikan layar ini menunjukkan bagaimana Anda dapat menemukan informasi titik akhir di instans Microsoft Fabric Anda.

Cuplikan layar yang memperlihatkan detail titik akhir Microsoft Fabric di UI Microsoft Fabric.

Nama artefak OneLake

Cuplikan layar ini menunjukkan bagaimana Anda dapat menemukan informasi artefak di instans Microsoft Fabric Anda. Cuplikan layar juga memperlihatkan bagaimana Anda dapat menggunakan nilai GUID atau nama yang mudah diingat untuk membuat Pembelajaran Mesin datastore OneLake.

Cuplikan layar yang menunjukkan cara mendapatkan detail artefak Microsoft Fabric lakehouse di UI Microsoft Fabric.

Membuat datastore OneLake

from azure.ai.ml.entities import OneLakeDatastore, OneLakeArtifact
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = OneLakeDatastore(
    name="onelake_example_id",
    description="Datastore pointing to an Microsoft fabric artifact.",
    one_lake_workspace_name="AzureML_Sample_OneLakeWS",
    endpoint="msit-onelake.dfs.fabric.microsoft.com"
    artifact = OneLakeArtifact(
        name="AzML_Sample_LH",
        type="lake_house"
    )
)

ml_client.create_or_update(store)

Langkah berikutnya