Databricks Utilities with Databricks الاتصال ل Python
إشعار
تتناول هذه المقالة الاتصال Databricks لوقت تشغيل Databricks 13.0 والإصدارات الأحدث.
توضح هذه المقالة كيفية استخدام Databricks Utilities مع databricks الاتصال ل Python. تمكنك الاتصال Databricks من توصيل IDEs الشائعة وخوادم دفاتر الملاحظات والتطبيقات المخصصة إلى مجموعات Azure Databricks. راجع ما هو Databricks الاتصال؟. للحصول على إصدار Scala من هذه المقالة، راجع Databricks Utilities with Databricks الاتصال ل Scala.
إشعار
قبل البدء في استخدام الاتصال Databricks، يجب عليك إعداد عميل الاتصال Databricks.
يمكنك استخدام الاتصال Databricks للوصول إلى Databricks Utilities كما يلي:
WorkspaceClient
استخدم متغير الفئةdbutils
للوصول إلى Databricks Utilities.WorkspaceClient
تنتمي الفئة إلى Databricks SDK ل Python ويتم تضمينها في Databricks الاتصال.- استخدم
dbutils.fs
للوصول إلى الأداة المساعدة Databricks Utilities fs . - استخدم
dbutils.secrets
للوصول إلى الأداة المساعدة Databricks Utilities secrets . - لا تتوفر وظائف أدوات Databricks المساعدة بخلاف الأدوات المساعدة السابقة من خلال
dbutils
.
تلميح
يمكنك أيضا استخدام Databricks SDK المضمنة ل Python للوصول إلى أي واجهة برمجة تطبيقات Databricks REST متوفرة، وليس فقط واجهات برمجة تطبيقات Databricks Utilities السابقة. راجع databricks-sdk على PyPI.
لتهيئة WorkspaceClient
، يجب توفير معلومات كافية لمصادقة Databricks SDK مع مساحة العمل. على سبيل المثال، يمكنك:
قم بتكوين تعليمات برمجية مضمنة لعنون URL لمساحة العمل ورمز الوصول المميز مباشرة داخل التعليمات البرمجية الخاصة بك، ثم قم بتهيئة
WorkspaceClient
كما يلي. على الرغم من أن هذا الخيار مدعوم، إلا أن Databricks لا يوصي بهذا الخيار، لأنه يمكن أن يعرض معلومات حساسة، مثل رموز الوصول المميزة، إذا تم إيداع التعليمات البرمجية الخاصة بك في التحكم بالإصدار أو تمت مشاركتها بطريقة أخرى:from databricks.sdk import WorkspaceClient w = WorkspaceClient(host = f"https://{retrieve_workspace_instance_name()}", token = retrieve_token())
قم بإنشاء أو تحديد ملف تعريف تكوين يحتوي على الحقول
host
وtoken
، ثم قم بتعريف علىWorkspaceClient
النحو التالي:from databricks.sdk import WorkspaceClient w = WorkspaceClient(profile = "<profile-name>")
قم بتعيين متغيرات
DATABRICKS_HOST
البيئة وبنفسDATABRICKS_TOKEN
الطريقة التي قمت بتعيينها الاتصال Databricks، ثم تهيئتهاWorkspaceClient
كما يلي:from databricks.sdk import WorkspaceClient w = WorkspaceClient()
لا يتعرف Databricks SDK ل Python على SPARK_REMOTE
متغير البيئة ل Databricks الاتصال.
للحصول على خيارات مصادقة Azure Databricks إضافية ل Databricks SDK ل Python، بالإضافة إلى كيفية التهيئة AccountClient
داخل Databricks SDKs للوصول إلى واجهات برمجة تطبيقات Databricks REST المتوفرة على مستوى الحساب بدلا من مستوى مساحة العمل، راجع databricks-sdk على PyPI.
يوضح المثال التالي كيفية استخدام Databricks SDK ل Python لأتمتة Databricks Utilities. ينشئ هذا المثال ملفا باسم zzz_hello.txt
في مسار وحدة تخزين كتالوج Unity داخل مساحة العمل، ويقرأ البيانات من الملف، ثم يحذف الملف. يفترض هذا المثال أن متغيرات DATABRICKS_HOST
البيئة وقد تم تعيينها DATABRICKS_TOKEN
بالفعل:
from databricks.sdk import WorkspaceClient
w = WorkspaceClient()
file_path = "/Volumes/main/default/my-volume/zzz_hello.txt"
file_data = "Hello, Databricks!"
fs = w.dbutils.fs
fs.put(
file = file_path,
contents = file_data,
overwrite = True
)
print(fs.head(file_path))
fs.rm(file_path)
راجع أيضا التفاعل مع dbutils في Databricks SDK لوثائق Python.