إنشاء مخازن البيانات

ينطبق على:ملحق ML Azure CLI v2 (الحالي)Python SDK azure-ai-ml v2 (الحالي)

في هذه المقالة، ستتعلم كيفية الاتصال بخدمات تخزين بيانات Azure باستخدام مخازن البيانات التعلم الآلي Azure.

المتطلبات الأساسية

إشعار

لا تنشئ مخازن البيانات التعلم الآلي موارد حساب التخزين الأساسية. بدلا من ذلك، فإنها تربط حساب تخزين موجود للاستخدام التعلم الآلي. التعلم الآلي مخازن البيانات غير مطلوبة. إذا كان لديك حق الوصول إلى البيانات الأساسية، يمكنك استخدام عناوين URL للتخزين مباشرة.

إنشاء مخزن بيانات Azure Blob

from azure.ai.ml.entities import AzureBlobDatastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureBlobDatastore(
    name="",
    description="",
    account_name="",
    container_name=""
)

ml_client.create_or_update(store)

إنشاء مخزن بيانات Azure Data Lake Storage Gen2

from azure.ai.ml.entities import AzureDataLakeGen2Datastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureDataLakeGen2Datastore(
    name="",
    description="",
    account_name="",
    filesystem=""
)

ml_client.create_or_update(store)

قم بإنشاء مخزن بيانات Azure Files

from azure.ai.ml.entities import AzureFileDatastore
from azure.ai.ml.entities import AccountKeyConfiguration
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureFileDatastore(
    name="file_example",
    description="Datastore pointing to an Azure File Share.",
    account_name="mytestfilestore",
    file_share_name="my-share",
    credentials=AccountKeyConfiguration(
        account_key= "XXXxxxXXXxXXXXxxXXXXXxXXXXXxXxxXxXXXxXXXxXXxxxXXxxXXXxXxXXXxxXxxXXXXxxxxxXXxxxxxxXXXxXXX"
    ),
)

ml_client.create_or_update(store)

إنشاء مخزن بيانات Azure Data Lake Storage Gen1

from azure.ai.ml.entities import AzureDataLakeGen1Datastore
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = AzureDataLakeGen1Datastore(
    name="",
    store_name="",
    description="",
)

ml_client.create_or_update(store)

إنشاء مخزن بيانات OneLake (Microsoft Fabric) (معاينة)

يصف هذا القسم خيارات مختلفة لإنشاء مخزن بيانات OneLake. يعد مخزن بيانات OneLake جزءا من Microsoft Fabric. في هذا الوقت، يدعم التعلم الآلي الاتصال بالأدوات Microsoft Fabric lakehouse التي تتضمن مجلدات أو ملفات واختصارات Amazon S3. لمزيد من المعلومات حول بحيرات البحيرات، راجع ما هو مستودع في Microsoft Fabric؟.

يتطلب إنشاء مخزن بيانات OneLake المعلومات التالية من مثيل Microsoft Fabric الخاص بك:

  • نقطة النهاية
  • اسم مساحة عمل النسيج أو GUID
  • اسم البيانات الاصطناعية أو GUID

تصف لقطات الشاشة الثلاث التالية استرداد موارد المعلومات المطلوبة هذه من مثيل Microsoft Fabric.

اسم مساحة عمل OneLake

في مثيل Microsoft Fabric، يمكنك العثور على معلومات مساحة العمل، كما هو موضح في لقطة الشاشة هذه. يمكنك استخدام قيمة GUID أو "اسم مألوف" لإنشاء مخزن بيانات التعلم الآلي OneLake.

لقطة شاشة تعرض تفاصيل مساحة عمل Microsoft Fabric في واجهة مستخدم Microsoft Fabric.

نقطة نهاية OneLake

توضح لقطة الشاشة هذه كيف يمكنك العثور على معلومات نقطة النهاية في مثيل Microsoft Fabric.

لقطة شاشة تعرض تفاصيل نقطة نهاية Microsoft Fabric في واجهة مستخدم Microsoft Fabric.

اسم البيانات الاصطناعية OneLake

توضح لقطة الشاشة هذه كيف يمكنك العثور على معلومات البيانات الاصطناعية في مثيل Microsoft Fabric. توضح لقطة الشاشة أيضا كيف يمكنك استخدام قيمة GUID أو اسم مألوف لإنشاء مخزن بيانات التعلم الآلي OneLake.

لقطة شاشة توضح كيفية الحصول على تفاصيل البيانات الاصطناعية ل Microsoft Fabric lakehouse في واجهة مستخدم Microsoft Fabric.

إنشاء مخزن بيانات OneLake

from azure.ai.ml.entities import OneLakeDatastore, OneLakeArtifact
from azure.ai.ml import MLClient

ml_client = MLClient.from_config()

store = OneLakeDatastore(
    name="onelake_example_id",
    description="Datastore pointing to an Microsoft fabric artifact.",
    one_lake_workspace_name="AzureML_Sample_OneLakeWS",
    endpoint="msit-onelake.dfs.fabric.microsoft.com"
    artifact = OneLakeArtifact(
        name="AzML_Sample_LH",
        type="lake_house"
    )
)

ml_client.create_or_update(store)

الخطوات التالية