Creare archivi dati

SI APPLICA A:Estensione ML dell'interfaccia della riga di comando di Azure v2 (corrente)Python SDK azure-ai-ml v2 (corrente)

Questo articolo illustra come connettersi ai servizi di archiviazione dati di Azure con gli archivi dati di Azure Machine Learning.

Prerequisiti

Nota

Gli archivi dati di Azure Machine Learning non creano le risorse dell'account di archiviazione sottostanti. Collegano invece un account di archiviazione esistente per l'uso di Azure Machine Learning. Gli archivi dati di Azure Machine Learning non sono quindi necessari. Se si ha accesso ai dati sottostanti, è possibile usare direttamente gli URI di archiviazione.

Creare un archivio dati di BLOB di Azure

from azure.ai.ml.entities import AzureBlobDatastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureBlobDatastore(
    name="",
    description="",
    account_name="",
    container_name=""
)

ml_client.create_or_update(store)

Creare un archivio dati di Azure Data Lake Gen2

from azure.ai.ml.entities import AzureDataLakeGen2Datastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureDataLakeGen2Datastore(
    name="",
    description="",
    account_name="",
    filesystem=""
)

ml_client.create_or_update(store)

Creare un archivio dati di File di Azure

from azure.ai.ml.entities import AzureFileDatastore
from azure.ai.ml.entities import AccountKeyConfiguration
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureFileDatastore(
    name="file_example",
    description="Datastore pointing to an Azure File Share.",
    account_name="mytestfilestore",
    file_share_name="my-share",
    credentials=AccountKeyConfiguration(
        account_key= "XXXxxxXXXxXXXXxxXXXXXxXXXXXxXxxXxXXXxXXXxXXxxxXXxxXXXxXxXXXxxXxxXXXXxxxxxXXxxxxxxXXXxXXX"
    ),
)

ml_client.create_or_update(store)

Creare un archivio dati di Azure Data Lake Gen1

from azure.ai.ml.entities import AzureDataLakeGen1Datastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureDataLakeGen1Datastore(
    name="",
    store_name="",
    description="",
)

ml_client.create_or_update(store)

Creare un archivio dati OneLake (Microsoft Fabric) (anteprima)

Questa sezione descrive varie opzioni per creare un archivio dati di OneLake. L'archivio dati di OneLake fa parte di Microsoft Fabric. Al momento, Azure Machine Learning supporta la connessione agli artefatti di lakehouse di Microsoft Fabric, che includono cartelle/file e collegamenti ad Amazon S3. Per altre informazioni su lakehouse, vedere Che cos'è un lakehouse in Microsoft Fabric.

La creazione dell'archivio dati di OneLake richiede

  • Endpoint
  • Nome o GUID dell'area di lavoro di Fabric
  • Nome o GUID dell'artefatto

Informazioni dell'istanza di Microsoft Fabric. Questi tre screenshot descrivono il recupero di queste risorse informative dall'istanza di Microsoft Fabric:

Nome dell'area di lavoro di OneLake

Nell'istanza di Microsoft Fabric è possibile trovare le informazioni sull'area di lavoro, come illustrato in questo screenshot. È possibile usare un valore GUID o un "nome descrittivo" per creare un archivio dati di OneLake di Azure Machine Learning.

Screenshot that shows Fabric Workspace details in Microsoft Fabric UI.

Endpoint di OneLake

Questo screenshot mostra come trovare informazioni sull'endpoint nell'istanza di Microsoft Fabric:

Screenshot that shows Fabric endpoint details in Microsoft Fabric UI.

Nome dell'artefatto di OneLake

Questo screenshot mostra come trovare informazioni sull'artefatto nell'istanza di Microsoft Fabric. Lo screenshot mostra anche come usare un valore GUID o un "nome descrittivo" per creare un archivio dati di OneLake di Azure Machine Learning:

Screenshot showing how to get Fabric LH artifact details in Microsoft Fabric UI.

Creare un archivio dati di OneLake

from azure.ai.ml.entities import OneLakeDatastore, OneLakeArtifact
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = OneLakeDatastore(
    name="onelake_example_id",
    description="Datastore pointing to an Microsoft fabric artifact.",
    one_lake_workspace_name="AzureML_Sample_OneLakeWS",
    endpoint="msit-onelake.dfs.fabric.microsoft.com"
    artifact = OneLakeArtifact(
        name="AzML_Sample_LH",
        type="lake_house"
    )
)

ml_client.create_or_update(store)

Passaggi successivi