Erstellen von Datenspeichern

GILT FÜR:Azure CLI ML-Erweiterung v2 (aktuell)Python SDK azure-ai-ml v2 (aktuell)

In diesem Artikel erfahren Sie, wie Sie mithilfe von Azure Machine Learning-Datenspeichern eine Verbindung mit Azure-Datenspeicherdiensten herstellen.

Voraussetzungen

Hinweis

Azure Machine Learning-Datenspeicher erstellen nicht die zugrunde liegenden Speicherkontoressourcen. Stattdessen verknüpfen sie ein vorhandenes Speicherkonto für die Verwendung von Azure Machine Learning. Azure Machine Learning-Datenspeicher sind hierfür nicht erforderlich. Wenn Sie Zugriff auf die zugrunde liegenden Daten haben, können Sie Speicher-URIs direkt verwenden.

Erstellen eines Azure-Blobdatenspeichers

from azure.ai.ml.entities import AzureBlobDatastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureBlobDatastore(
    name="",
    description="",
    account_name="",
    container_name=""
)

ml_client.create_or_update(store)

Erstellen eines Azure Data Lake Gen2-Datenspeichers

from azure.ai.ml.entities import AzureDataLakeGen2Datastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureDataLakeGen2Datastore(
    name="",
    description="",
    account_name="",
    filesystem=""
)

ml_client.create_or_update(store)

Erstellen eines Azure Files-Datenspeichers

from azure.ai.ml.entities import AzureFileDatastore
from azure.ai.ml.entities import AccountKeyConfiguration
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureFileDatastore(
    name="file_example",
    description="Datastore pointing to an Azure File Share.",
    account_name="mytestfilestore",
    file_share_name="my-share",
    credentials=AccountKeyConfiguration(
        account_key= "XXXxxxXXXxXXXXxxXXXXXxXXXXXxXxxXxXXXxXXXxXXxxxXXxxXXXxXxXXXxxXxxXXXXxxxxxXXxxxxxxXXXxXXX"
    ),
)

ml_client.create_or_update(store)

Erstellen eines Azure Data Lake Gen1-Datenspeichers

from azure.ai.ml.entities import AzureDataLakeGen1Datastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureDataLakeGen1Datastore(
    name="",
    store_name="",
    description="",
)

ml_client.create_or_update(store)

Erstellen eines OneLake (Microsoft Fabric)-Datenspeichers (Vorschau)

In diesem Abschnitt werden verschiedene Optionen zum Erstellen eines OneLake-Datenspeichers beschrieben. Der OneLake-Datenspeicher ist Teil von Microsoft Fabric. Derzeit unterstützt Azure Machine Learning die Verbindung mit Microsoft Fabric-Lakehouse-Artefakten, die Ordner/Dateien und Amazon S3-Verknüpfungen umfassen. Weitere Informationen zu Lakehouses finden Sie unter Was ist ein Lakehouse in Microsoft Fabric?.

Für die Erstellung eines OneLake-Datenspeichers ist erforderlich

  • Endpunkt
  • Name oder GUID des Fabric-Arbeitsbereichs
  • Name oder GUID des Artefakts

Informationen aus Ihrer Microsoft Fabric-Instanz. Die folgenden drei Screenshots zeigen das Abrufen dieser erforderlichen Informationsressourcen aus Ihrer Microsoft Fabric-Instanz:

OneLake-Arbeitsbereichsname

In Ihrer Microsoft Fabric-Instanz können Sie die Informationen zum Arbeitsbereich wie im folgenden Screenshot gezeigt ausfindig machen. Sie können entweder einen GUID-Wert oder einen Anzeigenamen verwenden, um einen Azure Machine Learning-OneLake-Datenspeicher zu erstellen.

Screenshot that shows Fabric Workspace details in Microsoft Fabric UI.

OneLake-Endpunkt

Dieser Screenshot zeigt, wie Sie die Informationen zum Endpunkt in Ihrer Microsoft Fabric-Instanz ausfindig machen:

Screenshot that shows Fabric endpoint details in Microsoft Fabric UI.

OneLake-Artefaktname

Dieser Screenshot zeigt, wie Sie die Artefaktinformationen in Ihrer Microsoft Fabric-Instanz ausfindig machen. Der Screenshot zeigt auch, wie Sie einen GUID-Wert oder einen Anzeigenamen verwenden, um einen Azure Machine Learning-OneLake-Datenspeicher zu erstellen:

Screenshot showing how to get Fabric LH artifact details in Microsoft Fabric UI.

Erstellen eines OneLake-Datenspeichers

from azure.ai.ml.entities import OneLakeDatastore, OneLakeArtifact
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = OneLakeDatastore(
    name="onelake_example_id",
    description="Datastore pointing to an Microsoft fabric artifact.",
    one_lake_workspace_name="AzureML_Sample_OneLakeWS",
    endpoint="msit-onelake.dfs.fabric.microsoft.com"
    artifact = OneLakeArtifact(
        name="AzML_Sample_LH",
        type="lake_house"
    )
)

ml_client.create_or_update(store)

Nächste Schritte