Python API

توفر هذه الصفحة ارتباطات إلى وثائق واجهة برمجة تطبيقات Python لهندسة ميزات Databricks ومخزن ميزات مساحة عمل Databricks، ومعلومات حول حزم databricks-feature-engineering العميل و databricks-feature-store.

إشعار

اعتبارا من الإصدار 0.17.0، databricks-feature-store تم إهماله. تتوفر الآن جميع الوحدات النمطية الموجودة من هذه الحزمة في databricks-feature-engineering الإصدار 0.2.0 والإصدارات الأحدث. للحصول على معلومات حول الترحيل إلى databricks-feature-engineering، راجع الترحيل إلى databricks-feature-engineering.

مصفوفة التوافق

تعتمد الحزمة والعميل اللذين يجب استخدامهما على مكان وجود جداول الميزات وإصدار Databricks Runtime ML الذي تقوم بتشغيله، كما هو موضح في الجدول التالي.

لتحديد إصدار الحزمة المضمن في إصدار Databricks Runtime ML، راجع مصفوفة توافق هندسة الميزات.

إصدار وقت تشغيل Databricks بالنسبة لجداول الميزات في استخدام الحزمة استخدام عميل Python
Databricks Runtime 14.3 ML وما فوق كتالوج Unity databricks-feature-engineering FeatureEngineeringClient
Databricks Runtime 14.3 ML وما فوق مساحة عمل databricks-feature-engineering FeatureStoreClient
Databricks Runtime 14.2 ML وما دونه كتالوج Unity databricks-feature-engineering FeatureEngineeringClient
Databricks Runtime 14.2 ML وما دونه مساحة عمل databricks-feature-store FeatureStoreClient

مرجع واجهة برمجة تطبيقات Python لهندسة الميزات

راجع مرجع واجهة برمجة تطبيقات Python لهندسة الميزات.

مرجع واجهة برمجة تطبيقات Python لمخزن ميزات مساحة العمل (مهمل)

إشعار

  • اعتبارا من الإصدار 0.17.0، databricks-feature-store تم إهماله. تتوفر الآن جميع الوحدات النمطية الموجودة من هذه الحزمة في databricks-feature-engineering الإصدار 0.2.0 والإصدارات الأحدث.

للحصول على databricks-feature-store الإصدار 0.17.0، راجع Databricks FeatureStoreClient في مرجع واجهة برمجة تطبيقات Python لهندسة الميزات للحصول على أحدث مرجع لواجهة برمجة تطبيقات مخزن ميزات مساحة العمل.

بالنسبة إلى الإصدار 0.16.3 والإصدارات أدناه، استخدم الارتباطات الموجودة في الجدول لتنزيل مرجع واجهة برمجة تطبيقات Python لمتجر الميزات أو عرضه. لتحديد الإصدار المثبت مسبقا لإصدار Databricks Runtime ML، راجع مصفوفة التوافق.

إصدار تنزيل PDF مرجع واجهة برمجة التطبيقات عبر الإنترنت
v0.3.5 إلى v0.16.3 مرجع ملف PDF ل Feature Store Python API 0.16.3 مرجع واجهة برمجة التطبيقات عبر الإنترنت
الإصدار 0.3.5 وما دونه مرجع ملف PDF ل Feature Store Python API 0.3.5 مرجع واجهة برمجة التطبيقات عبر الإنترنت غير متوفر

حزمة Python

يصف هذا القسم كيفية تثبيت حزم Python لاستخدام Databricks Feature Engineering وDatabricks Workspace Feature Store.

هندسة الميزات

إشعار

  • اعتبارا من الإصدار 0.2.0، databricks-feature-engineering يحتوي على وحدات للعمل مع جداول الميزات في كل من كتالوج Unity ومخزن ميزات مساحة العمل. databricks-feature-engineering يعمل الإصدار أدناه 0.2.0 فقط مع جداول الميزات في كتالوج Unity.

تتوفر واجهات برمجة تطبيقات هندسة ميزات Databricks من خلال حزمة databricks-feature-engineeringعميل Python . يتوفر العميل على PyPI ويتم تثبيته مسبقا في Databricks Runtime 13.3 LTS ML وما فوق.

للحصول على مرجع لإصدار العميل الذي يتوافق مع إصدار وقت التشغيل، راجع مصفوفة التوافق.

لتثبيت العميل في Databricks Runtime:

%pip install databricks-feature-engineering

لتثبيت العميل في بيئة Python محلية:

pip install databricks-feature-engineering

مخزن ميزات مساحة العمل (مهمل)

إشعار

  • اعتبارا من الإصدار 0.17.0، databricks-feature-store تم إهماله. تتوفر جميع الوحدات النمطية الموجودة من هذه الحزمة الآن في databricks-feature-engineeringالإصدار 0.2.0 والإصدارات الأحدث.
  • راجع الترحيل إلى databricks-feature-engineering للحصول على مزيد من المعلومات.

تتوفر واجهات برمجة تطبيقات مخزن ميزات Databricks من خلال حزمة databricks-feature-storeعميل Python . يتوفر العميل على PyPI ويتم تثبيته مسبقا في Databricks Runtime التعلم الآلي. للحصول على مرجع لوقت التشغيل الذي يتضمن إصدار العميل، راجع مصفوفة التوافق.

لتثبيت العميل في Databricks Runtime:

%pip install databricks-feature-store

لتثبيت العميل في بيئة Python محلية:

pip install databricks-feature-store

الترحيل إلى databricks-feature-engineering

لتثبيت الحزمة databricks-feature-engineering ، استخدم pip install databricks-feature-engineering بدلا من pip install databricks-feature-store. تم نقل جميع الوحدات النمطية في databricks-feature-store إلى databricks-feature-engineering، لذلك ليس عليك تغيير أي تعليمة برمجية. ستستمر عبارات الاستيراد مثل from databricks.feature_store import FeatureStoreClient في العمل بعد تثبيت databricks-feature-engineering.

للعمل مع جداول الميزات في كتالوج Unity، استخدم FeatureEngineeringClient. لاستخدام Workspace Feature Store، يجب عليك استخدام FeatureStoreClient.

السيناريوهات المدعومة

في Databricks، بما في ذلك Databricks Runtime وDatabricks Runtime التعلم الآلي، يمكنك:

  • إنشاء جداول الميزات وقراءتها وكتابتها.
  • تدريب نماذج وتسجيلها على بيانات الميزات.
  • نشر جداول الميزات إلى المتاجر عبر الإنترنت لتقديمها في الوقت الحقيقي.

من بيئة محلية أو بيئة خارجية إلى Databricks، يمكنك:

  • تطوير التعليمات البرمجية بدعم IDE المحلي.
  • اختبار الوحدة باستخدام أطر عمل وهمية.
  • كتابة اختبارات التكامل ليتم تشغيلها على Databricks.

القيود

يمكن تشغيل مكتبة العميل فقط على Databricks، بما في ذلك Databricks Runtime وDatabricks Runtime التعلم الآلي. لا يدعم استدعاء هندسة الميزات في كتالوج Unity أو واجهات برمجة تطبيقات مخزن الميزات من بيئة محلية، أو من بيئة أخرى غير Databricks.

استخدام العملاء لاختبار الوحدة

يمكنك تثبيت هندسة الميزات في عميل كتالوج Unity أو عميل مخزن الميزات محليا للمساعدة في تشغيل اختبارات الوحدة.

على سبيل المثال، للتحقق من أن أسلوب update_customer_features يستدعي FeatureEngineeringClient.write_table بشكل صحيح (أو لمخزن ميزات مساحة العمل، FeatureStoreClient.write_table)، يمكنك كتابة:

from unittest.mock import MagicMock, patch

from my_feature_update_module import update_customer_features
from databricks.feature_engineering import FeatureEngineeringClient

@patch.object(FeatureEngineeringClient, "write_table")
@patch("my_feature_update_module.compute_customer_features")
def test_something(compute_customer_features, mock_write_table):
  customer_features_df = MagicMock()
  compute_customer_features.return_value = customer_features_df

  update_customer_features()  # Function being tested

  mock_write_table.assert_called_once_with(
    name='ml.recommender_system.customer_features',
    df=customer_features_df,
    mode='merge'
  )

استخدام العملاء لاختبار التكامل

يمكنك تشغيل اختبارات التكامل مع عميل Feature Engineering في كتالوج Unity أو عميل Feature Store على Databricks. للحصول على التفاصيل، راجع أدوات المطور وإرشاداته: استخدام CI/CD.

استخدام العملاء في بيئة تطوير متكاملة (IDE)

يمكنك استخدام هندسة الميزات في عميل كتالوج Unity أو عميل مخزن الميزات مع IDE لتطوير البرامج باستخدام Databricks. للحصول على التفاصيل، راجع استخدام dbx مع Visual Studio Code.