فبراير 2019

تم إصدار هذه الميزات وتحسينات النظام الأساسي ل Azure Databricks في فبراير 2019.

إشعار

يتم تنظيم الإصدارات. قد لا يتم تحديث حساب Azure Databricks الخاص بك حتى أسبوع بعد تاريخ الإصدار الأولي.

Databricks Light متوفر بشكل عام

26 فبراير - 5 مارس 2019: الإصدار 2.92

Databricks Light (المعروف أيضا باسم Data Engineering Light) متاح الآن. Databricks Light هو حزمة Databricks لوقت تشغيل مصدر مفتوح Apache Spark. يوفر خيار وقت التشغيل للوظائف التي لا تحتاج إلى الأداء المتقدم أو الموثوقية أو مزايا التحجيم التلقائي التي يوفرها وقت تشغيل Databricks. يمكنك تحديد Databricks Light فقط عند إنشاء نظام مجموعة لتشغيل وظيفة JAR أو Python أو spark-submit ؛ لا يمكنك تحديد وقت التشغيل هذا للمجموعات التي تقوم بتشغيل أحمال عمل مهمة تفاعلية أو دفتر ملاحظات عليها. راجع Databricks Light.

MLflow المدار على Azure Databricks Public Preview

26 فبراير - 5 مارس 2019: الإصدار 2.92

MLflow هو نظام أساسي مصدر مفتوح لإدارة دورة حياة التعلم الآلي الشاملة. وهو يعالج ثلاث وظائف أساسية:

  • تعقب التجارب لتسجيل المعلمات والنتائج ومقارنتها.
  • إدارة ونشر النماذج من مجموعة متنوعة من مكتبات التعلم الآلي إلى مجموعة متنوعة من منصات خدمة النموذج والاستدلال.
  • تجميع تعليمة التعلم الآلي البرمجية في شكل قابل لإعادة الاستخدام وقابل للتكرار لمشاركته مع علماء البيانات الآخرين أو نقله إلى الإنتاج.

يوفر Azure Databricks الآن إصدارا مدارا ومستضافا بالكامل من MLflow متكاملا مع ميزات أمان المؤسسة والتوافر العالي وميزات مساحة عمل Azure Databricks الأخرى مثل إدارة التجربة وإدارة التشغيل وتسجيل مراجعة دفتر الملاحظات. يوفر MLflow على Azure Databricks تجربة متكاملة لتتبع وتأمين تشغيل تدريب نموذج التعلم الآلي وتشغيل مشاريع التعلم الآلي. باستخدام MLflow المدار على Azure Databricks، يمكنك الحصول على مزايا كلا النظامين الأساسيين، بما في ذلك:

  • مساحات العمل: تتبع التجارب والنتائج وتنظيمها بشكل تعاوني داخل مساحات عمل Azure Databricks باستخدام خادم تتبع MLflow المستضاف وواجهة مستخدم التجربة المتكاملة. عند استخدام MLflow في دفاتر الملاحظات، يلتقط Azure Databricks تلقائيا مراجعات دفتر الملاحظات حتى تتمكن من إعادة إنتاج نفس التعليمات البرمجية وتشغيلها لاحقا.
  • الأمان: استفد من نموذج أمان مشترك واحد لدورة حياة التعلم الآلي بأكملها عبر قوائم التحكم في الوصول.
  • الوظائف: قم بتشغيل مشاريع MLflow كوظائف Azure Databricks عن بعد ومباشرة من دفاتر ملاحظات Azure Databricks.

فيما يلي عرض توضيحي لسير عمل تعقب في مساحة عمل Azure Databricks:

Track runs and organize experiment workflow

للحصول على التفاصيل، راجع تعقب التعلم الآلي وتشغيل التدريب على التعلم العميق وتشغيل مشاريع MLflow على Azure Databricks.

يتوفر موصل Azure Data Lake Storage Gen2 بشكل عام

15 فبراير 2019

Azure Data Lake Storage Gen2 (ADLS Gen2)، حل مستودع البيانات من الجيل التالي لتحليلات البيانات الضخمة، هو الآن GA، كما هو موصل ADLS Gen2 ل Azure Databricks. يسرنا أيضا أن نعلن أن ADLS Gen2 يدعم Databricks Delta عند تشغيل مجموعات على Databricks Runtime 5.2 وما فوق.

Python 3 الآن الافتراضي عند إنشاء مجموعات

12-19 فبراير 2019: الإصدار 2.91

تم تبديل إصدار Python الافتراضي للمجموعات التي تم إنشاؤها باستخدام واجهة المستخدم من Python 2 إلى Python 3. لا يزال الإعداد الافتراضي للمجموعات التي تم إنشاؤها باستخدام واجهة برمجة تطبيقات REST هو Python 2.

لن تغير المجموعات الموجودة إصدارات Python الخاصة بها. ولكن إذا كنت معتادا على أخذ الإعداد الافتراضي Python 2 عند إنشاء مجموعات جديدة، فستحتاج إلى البدء في الانتباه إلى تحديد إصدار Python الخاص بك.

Default Python version

Delta Lake متاحة بشكل عام

1 فبراير 2019

الآن يمكن للجميع الحصول على فوائد طبقة تخزين المعاملات القوية في Databricks Delta وقراءة فائقة السرعة: اعتبارا من 1 فبراير، Delta Lake هو GA ومتاح على جميع الإصدارات المدعومة من Databricks Runtime. للحصول على معلومات حول Delta، راجع ما هو Delta Lake؟.