إنشاء مخازن البيانات

ينطبق على:ملحق ML Azure CLI v2 (الحالي)Python SDK azure-ai-ml v2 (الحالي)

في هذه المقالة، تعرف على كيفية الاتصال بخدمات تخزين بيانات Azure باستخدام مخازن البيانات التعلم الآلي Azure.

المتطلبات الأساسية

إشعار

لا تنشئ متاجر بيانات Azure التعلم الآلي موارد حساب التخزين الأساسية. بدلا من ذلك، يربطون حساب تخزين موجود لاستخدام Azure التعلم الآلي. لا يتطلب هذا مخازن بيانات Azure التعلم الآلي. إذا كان لديك حق الوصول إلى البيانات الأساسية، يمكنك استخدام عناوين URL للتخزين مباشرة.

إنشاء مخزن بيانات Azure Blob

from azure.ai.ml.entities import AzureBlobDatastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureBlobDatastore(
    name="",
    description="",
    account_name="",
    container_name=""
)

ml_client.create_or_update(store)

قم بإنشاء مخزن بيانات Azure Data Lake Gen2

from azure.ai.ml.entities import AzureDataLakeGen2Datastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureDataLakeGen2Datastore(
    name="",
    description="",
    account_name="",
    filesystem=""
)

ml_client.create_or_update(store)

قم بإنشاء مخزن بيانات Azure Files

from azure.ai.ml.entities import AzureFileDatastore
from azure.ai.ml.entities import AccountKeyConfiguration
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureFileDatastore(
    name="file_example",
    description="Datastore pointing to an Azure File Share.",
    account_name="mytestfilestore",
    file_share_name="my-share",
    credentials=AccountKeyConfiguration(
        account_key= "XXXxxxXXXxXXXXxxXXXXXxXXXXXxXxxXxXXXxXXXxXXxxxXXxxXXXxXxXXXxxXxxXXXXxxxxxXXxxxxxxXXXxXXX"
    ),
)

ml_client.create_or_update(store)

قم بإنشاء مخزن بيانات Azure Data Lake Gen1

from azure.ai.ml.entities import AzureDataLakeGen1Datastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureDataLakeGen1Datastore(
    name="",
    store_name="",
    description="",
)

ml_client.create_or_update(store)

إنشاء مخزن بيانات OneLake (Microsoft Fabric) (معاينة)

يصف هذا القسم خيارات مختلفة لإنشاء مخزن بيانات OneLake. يعد مخزن بيانات OneLake جزءا من Microsoft Fabric. في هذا الوقت، يدعم Azure التعلم الآلي الاتصال ب Microsoft Fabric Lakehouse artifacts التي تتضمن مجلدات / ملفات واختصارات Amazon S3. لمزيد من المعلومات حول Lakehouse، تفضل بزيارة What is a lakehouse في Microsoft Fabric.

يتطلب إنشاء مخزن بيانات OneLake

  • نقطة النهاية
  • اسم مساحة عمل النسيج أو GUID
  • اسم البيانات الاصطناعية أو GUID

معلومات من مثيل Microsoft Fabric الخاص بك. تصف لقطات الشاشة الثلاث هذه استرداد موارد المعلومات المطلوبة هذه من مثيل Microsoft Fabric:

اسم مساحة عمل OneLake

في مثيل Microsoft Fabric، يمكنك العثور على معلومات مساحة العمل كما هو موضح في لقطة الشاشة هذه. يمكنك استخدام قيمة GUID أو "اسم مألوف" لإنشاء مخزن بيانات Azure التعلم الآلي OneLake.

Screenshot that shows Fabric Workspace details in Microsoft Fabric UI.

نقطة نهاية OneLake

توضح لقطة الشاشة هذه كيف يمكنك العثور على معلومات نقطة النهاية في مثيل Microsoft Fabric:

Screenshot that shows Fabric endpoint details in Microsoft Fabric UI.

اسم البيانات الاصطناعية OneLake

توضح لقطة الشاشة هذه كيف يمكنك العثور على معلومات البيانات الاصطناعية في مثيل Microsoft Fabric. توضح لقطة الشاشة أيضا كيف يمكنك إما استخدام قيمة GUID أو "اسم مألوف" لإنشاء مخزن بيانات Azure التعلم الآلي OneLake:

Screenshot showing how to get Fabric LH artifact details in Microsoft Fabric UI.

إنشاء مخزن بيانات OneLake

from azure.ai.ml.entities import OneLakeDatastore, OneLakeArtifact
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = OneLakeDatastore(
    name="onelake_example_id",
    description="Datastore pointing to an Microsoft fabric artifact.",
    one_lake_workspace_name="AzureML_Sample_OneLakeWS",
    endpoint="msit-onelake.dfs.fabric.microsoft.com"
    artifact = OneLakeArtifact(
        name="AzML_Sample_LH",
        type="lake_house"
    )
)

ml_client.create_or_update(store)

الخطوات التالية