Vytváření úložišť dat

PLATÍ PRO:Rozšíření Azure CLI ml v2 (aktuální)Python SDK azure-ai-ml v2 (aktuální)

V tomto článku se dozvíte, jak se připojit ke službám úložiště dat Azure pomocí azure Machine Učení úložišť dat.

Požadavky

Poznámka:

Počítače Učení úložiště dat nevytvárují podkladové prostředky účtu úložiště. Místo toho propojí existující účet úložiště pro Učení počítače. Počítače Učení úložiště dat se nevyžadují. Pokud máte přístup k podkladovým datům, můžete použít identifikátory URI úložiště přímo.

Vytvoření úložiště dat objektů blob v Azure

from azure.ai.ml.entities import AzureBlobDatastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureBlobDatastore(
    name="",
    description="",
    account_name="",
    container_name=""
)

ml_client.create_or_update(store)

Vytvoření úložiště dat Azure Data Lake Storage Gen2

from azure.ai.ml.entities import AzureDataLakeGen2Datastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureDataLakeGen2Datastore(
    name="",
    description="",
    account_name="",
    filesystem=""
)

ml_client.create_or_update(store)

Vytvoření úložiště dat Azure Files

from azure.ai.ml.entities import AzureFileDatastore
from azure.ai.ml.entities import AccountKeyConfiguration
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureFileDatastore(
    name="file_example",
    description="Datastore pointing to an Azure File Share.",
    account_name="mytestfilestore",
    file_share_name="my-share",
    credentials=AccountKeyConfiguration(
        account_key= "XXXxxxXXXxXXXXxxXXXXXxXXXXXxXxxXxXXXxXXXxXXxxxXXxxXXXxXxXXXxxXxxXXXXxxxxxXXxxxxxxXXXxXXX"
    ),
)

ml_client.create_or_update(store)

Vytvoření úložiště dat Azure Data Lake Storage Gen1

from azure.ai.ml.entities import AzureDataLakeGen1Datastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureDataLakeGen1Datastore(
    name="",
    store_name="",
    description="",
)

ml_client.create_or_update(store)

Vytvoření úložiště dat OneLake (Microsoft Fabric) (Preview)

Tato část popisuje různé možnosti vytvoření úložiště dat OneLake. Úložiště dat OneLake je součástí Microsoft Fabric. V tuto chvíli machine Učení podporuje připojení k artefaktům Microsoft Fabric Lakehouse, které obsahují složky nebo soubory a zástupce Amazon S3. Další informace o lakehouses naleznete v tématu Co je lakehouse v Microsoft Fabric?.

Vytvoření úložiště dat OneLake vyžaduje následující informace z vaší instance Microsoft Fabric:

  • Koncový bod
  • Název nebo identifikátor GUID pracovního prostoru prostředků infrastruktury
  • Název artefaktu nebo identifikátor GUID

Následující tři snímky obrazovky popisují načtení těchto požadovaných informačních prostředků z vaší instance Microsoft Fabric.

Název pracovního prostoru OneLake

V instanci Microsoft Fabric najdete informace o pracovním prostoru, jak je znázorněno na tomto snímku obrazovky. K vytvoření počítače Učení úložiště dat OneLake můžete použít buď hodnotu GUID, nebo popisný název.

Snímek obrazovky znázorňující podrobnosti pracovního prostoru Microsoft Fabric v uživatelském rozhraní Microsoft Fabric

Koncový bod OneLake

Tento snímek obrazovky ukazuje, jak najít informace o koncovém bodu v instanci Microsoft Fabric.

Snímek obrazovky znázorňující podrobnosti o koncovém bodu Microsoft Fabric v uživatelském rozhraní Microsoft Fabric

Název artefaktu OneLake

Tento snímek obrazovky ukazuje, jak můžete najít informace o artefaktech v instanci Microsoft Fabric. Snímek obrazovky také ukazuje, jak můžete použít hodnotu GUID nebo popisný název k vytvoření počítače Učení úložiště dat OneLake.

Snímek obrazovky znázorňující, jak získat podrobnosti artefaktu Microsoft Fabric Lakehouse v uživatelském rozhraní Microsoft Fabric

Vytvoření úložiště dat OneLake

from azure.ai.ml.entities import OneLakeDatastore, OneLakeArtifact
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = OneLakeDatastore(
    name="onelake_example_id",
    description="Datastore pointing to an Microsoft fabric artifact.",
    one_lake_workspace_name="AzureML_Sample_OneLakeWS",
    endpoint="msit-onelake.dfs.fabric.microsoft.com"
    artifact = OneLakeArtifact(
        name="AzML_Sample_LH",
        type="lake_house"
    )
)

ml_client.create_or_update(store)

Další kroky