Создание хранилищ данных

ОБЛАСТЬ ПРИМЕНЕНИЯ:Расширение машинного обучения Azure CLI версии 2 (current)Python SDK azure-ai-ml версии 2 (current)

Из этой статьи вы узнаете, как подключиться к службам хранилища данных Azure с Машинное обучение Azure хранилищами данных.

Необходимые компоненты

Примечание.

Машинное обучение хранилища данных не создают базовые ресурсы учетной записи хранения. Вместо этого они связывают существующую учетную запись хранения для Машинное обучение использования. Машинное обучение хранилища данных не требуются. Если у вас есть доступ к базовым данным, можно использовать URI хранилища напрямую.

Создание хранилища данных BLOB-объектов Azure

from azure.ai.ml.entities import AzureBlobDatastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureBlobDatastore(
    name="",
    description="",
    account_name="",
    container_name=""
)

ml_client.create_or_update(store)

Создание хранилища данных Azure Data Lake Storage 2-го поколения

from azure.ai.ml.entities import AzureDataLakeGen2Datastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureDataLakeGen2Datastore(
    name="",
    description="",
    account_name="",
    filesystem=""
)

ml_client.create_or_update(store)

Создание хранилища данных Файлов Azure

from azure.ai.ml.entities import AzureFileDatastore
from azure.ai.ml.entities import AccountKeyConfiguration
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureFileDatastore(
    name="file_example",
    description="Datastore pointing to an Azure File Share.",
    account_name="mytestfilestore",
    file_share_name="my-share",
    credentials=AccountKeyConfiguration(
        account_key= "XXXxxxXXXxXXXXxxXXXXXxXXXXXxXxxXxXXXxXXXxXXxxxXXxxXXXxXxXXXxxXxxXXXXxxxxxXXxxxxxxXXXxXXX"
    ),
)

ml_client.create_or_update(store)

Создание хранилища данных azure Data Lake Storage 1-го поколения

from azure.ai.ml.entities import AzureDataLakeGen1Datastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureDataLakeGen1Datastore(
    name="",
    store_name="",
    description="",
)

ml_client.create_or_update(store)

Создание хранилища данных OneLake (Microsoft Fabric) (предварительная версия)

В этом разделе описаны различные параметры создания хранилища данных OneLake. Хранилище данных OneLake является частью Microsoft Fabric. В настоящее время Машинное обучение поддерживает подключение к артефактам Microsoft Fabric Lakehouse, которые включают папки или файлы и сочетания клавиш Amazon S3. Дополнительные сведения о озерах см. в статье "Что такое озеро в Microsoft Fabric?".

Для создания хранилища данных OneLake требуются следующие сведения из экземпляра Microsoft Fabric:

  • Конечная точка
  • Имя рабочей области Fabric или GUID
  • Имя артефакта или GUID

На следующих трех снимках экрана описано получение этих необходимых информационных ресурсов из экземпляра Microsoft Fabric.

Имя рабочей области OneLake

В экземпляре Microsoft Fabric можно найти сведения о рабочей области, как показано на этом снимке экрана. Для Машинное обучение создания хранилища данных OneLake можно использовать значение GUID или понятное имя.

Снимок экрана: сведения о рабочей области Microsoft Fabric в пользовательском интерфейсе Microsoft Fabric.

Конечная точка OneLake

На этом снимке экрана показано, как найти сведения о конечной точке в экземпляре Microsoft Fabric.

Снимок экрана: сведения о конечной точке Microsoft Fabric в пользовательском интерфейсе Microsoft Fabric.

Имя артефакта OneLake

На этом снимке экрана показано, как найти сведения артефакта в экземпляре Microsoft Fabric. На снимке экрана также показано, как использовать значение GUID или понятное имя для создания хранилища данных Машинное обучение OneLake.

Снимок экрана, на котором показано, как получить сведения о артефактах Microsoft Fabric lakehouse в пользовательском интерфейсе Microsoft Fabric.

Создание хранилища данных OneLake

from azure.ai.ml.entities import OneLakeDatastore, OneLakeArtifact
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = OneLakeDatastore(
    name="onelake_example_id",
    description="Datastore pointing to an Microsoft fabric artifact.",
    one_lake_workspace_name="AzureML_Sample_OneLakeWS",
    endpoint="msit-onelake.dfs.fabric.microsoft.com"
    artifact = OneLakeArtifact(
        name="AzML_Sample_LH",
        type="lake_house"
    )
)

ml_client.create_or_update(store)

Следующие шаги