Criar arquivos de dados

APLICA-SE A:Azure CLI ml extension v2 (current)Python SDK azure-ai-ml v2 (current)

Neste artigo, você aprenderá a se conectar aos serviços de armazenamento de dados do Azure com armazenamentos de dados do Azure Machine Learning.

Pré-requisitos

Nota

Os armazenamentos de dados do Machine Learning não criam os recursos da conta de armazenamento subjacente. Em vez disso, eles vinculam uma conta de armazenamento existente para uso do Machine Learning. Os armazenamentos de dados do Machine Learning não são necessários. Se você tiver acesso aos dados subjacentes, poderá usar URIs de armazenamento diretamente.

Criar um armazenamento de dados de Blob do Azure

from azure.ai.ml.entities import AzureBlobDatastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureBlobDatastore(
    name="",
    description="",
    account_name="",
    container_name=""
)

ml_client.create_or_update(store)

Criar um armazenamento de dados do Azure Data Lake Storage Gen2

from azure.ai.ml.entities import AzureDataLakeGen2Datastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureDataLakeGen2Datastore(
    name="",
    description="",
    account_name="",
    filesystem=""
)

ml_client.create_or_update(store)

Criar um armazenamento de dados do Azure Files

from azure.ai.ml.entities import AzureFileDatastore
from azure.ai.ml.entities import AccountKeyConfiguration
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureFileDatastore(
    name="file_example",
    description="Datastore pointing to an Azure File Share.",
    account_name="mytestfilestore",
    file_share_name="my-share",
    credentials=AccountKeyConfiguration(
        account_key= "XXXxxxXXXxXXXXxxXXXXXxXXXXXxXxxXxXXXxXXXxXXxxxXXxxXXXxXxXXXxxXxxXXXXxxxxxXXxxxxxxXXXxXXX"
    ),
)

ml_client.create_or_update(store)

Criar um armazenamento de dados do Azure Data Lake Storage Gen1

from azure.ai.ml.entities import AzureDataLakeGen1Datastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureDataLakeGen1Datastore(
    name="",
    store_name="",
    description="",
)

ml_client.create_or_update(store)

Criar um armazenamento de dados OneLake (Microsoft Fabric) (visualização)

Esta seção descreve várias opções para criar um armazenamento de dados OneLake. O armazenamento de dados OneLake faz parte do Microsoft Fabric. No momento, o Machine Learning oferece suporte à conexão com artefatos lakehouse do Microsoft Fabric que incluem pastas ou arquivos e atalhos do Amazon S3. Para obter mais informações sobre lakehouses, consulte O que é uma lakehouse no Microsoft Fabric?.

A criação do armazenamento de dados do OneLake requer as seguintes informações da sua instância do Microsoft Fabric:

  • Ponto final
  • Nome ou GUID do espaço de trabalho de malha
  • Nome do artefato ou GUID

As três capturas de tela a seguir descrevem a recuperação desses recursos de informações necessários da sua instância do Microsoft Fabric.

Nome do espaço de trabalho do OneLake

Em sua instância do Microsoft Fabric, você pode encontrar as informações do espaço de trabalho, conforme mostrado nesta captura de tela. Você pode usar um valor GUID ou um "nome amigável" para criar um armazenamento de dados OneLake de Aprendizado de Máquina.

Captura de tela que mostra os detalhes do espaço de trabalho do Microsoft Fabric na interface do usuário do Microsoft Fabric.

Ponto de extremidade OneLake

Esta captura de tela mostra como você pode encontrar informações de ponto de extremidade em sua instância do Microsoft Fabric.

Captura de tela que mostra os detalhes do ponto de extremidade do Microsoft Fabric na interface do usuário do Microsoft Fabric.

Nome do artefato OneLake

Esta captura de tela mostra como você pode encontrar as informações do artefato em sua instância do Microsoft Fabric. A captura de tela também mostra como você pode usar um valor GUID ou um nome amigável para criar um armazenamento de dados OneLake de Aprendizado de Máquina.

Captura de tela que mostra como obter detalhes do artefato lakehouse do Microsoft Fabric na interface do usuário do Microsoft Fabric.

Criar um armazenamento de dados OneLake

from azure.ai.ml.entities import OneLakeDatastore, OneLakeArtifact
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = OneLakeDatastore(
    name="onelake_example_id",
    description="Datastore pointing to an Microsoft fabric artifact.",
    one_lake_workspace_name="AzureML_Sample_OneLakeWS",
    endpoint="msit-onelake.dfs.fabric.microsoft.com"
    artifact = OneLakeArtifact(
        name="AzML_Sample_LH",
        type="lake_house"
    )
)

ml_client.create_or_update(store)

Próximos passos