استخدام MLflow لتتبع التجارب، وتسجيل المقاييس، ومقارنة العمليات التشغيلية

مكتمل

سيتعين عليك في هذه الوحدة إكمال التمرينات في دفتر ملاحظات Databricks. للبدء، يتعين عليك الحصول على إمكانية الوصول إلى مساحة عمل Azure Databricks بها نظام مجموعة تفاعلي. إذا لم تكن لديك مساحة عمل و/أو نظام المجموعة المطلوب، فاتبع التعليمات الواردة أدناه. بخلاف ذلك، يمكنك التخطي إلى أسفل الصفحة لتثبيت المكتبات المطلوبة.

المتطلبات الأساسية للوحدة

حساب Microsoft Azure: ستحتاج حساباً صالحاً ونشطاً على Azure من أجل معامل Azure. إذا لم يكن لديك حساب، يمكنك التسجيل في تجربة مجانية

  • إذا كنت مشتركاً نشطاً في Visual Studio، فإنك تحصل على رصيد Azure شهرياً. يمكنك الرجوع إلى هذا الرابط لمعرفة المزيد بما في ذلك كيفية تنشيط رصيد Azure الشهري الخاص بك وبدء استخدامه.

  • إذا لم تكن مشتركاً في Visual Studio، يمكنك التسجيل في برنامج Visual Studio Dev Essentials المجاني لإنشاء حساب Azure مجاني.

إنشاء الموارد المطلوبة

لإكمال هذا المعمل، سيتعين عليك نشر مساحة عمل Azure Databricks في اشتراك Azure الخاص بك.

نشر مساحة عمل Azure Databricks

  1. انقر فوق الزر التالي لفتح قالب Azure Resource Manager في مدخل Azure. نشر Databricks من قالب Azure Resource Manager

  2. وفّر القيم المطلوبة لإنشاء مساحة عمل Azure Databricks الخاصة بك:

    • الاشتراك: اختر اشتراك Azure الذي يمكنك من خلاله نشر مساحة العمل.
    • مجموعة الموارد: اختر "Create new" وقم بتوفير اسم لمجموعة الموارد الجديدة.
    • الموقع: حدد موقعاً بالقرب منك من أجل النشر. للاطلاع على قائمة المناطق التي يدعمها Azure Databricks، راجع خدمات Azure المتوفرة حسب المنطقة.
    • اسم مساحة العمل: وفّر اسماً لمساحة العمل الخاصة بك.
    • فئة السعر: تأكد من تحديد premium.
  3. اقبل الشروط والأحكام.

  4. حدد "Purchase".

  5. يستغرق إنشاء مساحة العمل بضع دقائق. يعرض المدخل -أثناء إنشاء مساحة العمل- النشر المرسل على لوحة Azure Databricks على الجانب الأيمن. ربما يتعين عليك التمرير إلى اليمين في لوحة المعلومات الخاصة بك لرؤية اللوحة. يُوجد كذلك شريط تقدم يتم عرضه بالقرب من أعلى الشاشة. يمكنك مراقبة كلتا المساحتين لمتابعة التقدم.

إنشاء نظام مجموعة

  1. عند اكتمال إنشاء مساحة العمل الخاصة بك على Azure Databricks، حدد الرابط للانتقال إلى المورد.

  2. حدد "Launch Workspace" لفتح مساحة عمل Databricks الخاصة بك في علامة تبويب جديدة.

  3. حدد "Clusters" من القائمة اليسرى لمساحة عمل Databricks الخاصة بك.

  4. حدد "Create Cluster" لإضافة نظام مجموعة جديد.

    صفحة إنشاء نظام المجموعة

  5. أدخل اسماً لنظام المجموعة الخاص بك. استخدم اسمك أو حروف اسمك الأولى للتمييز بسهولة بين نظام المجموعة الخاص بك وأنظمة زملائك في العمل.

  6. حدد Cluster Mode: Single Node

  7. حدد Databricks RuntimeVersion: Runtime: 7.3 LTS ML (Scala 2.12, Spark 3.0.1) (تذكر تحديد الإصدار ML).

  8. ضمن Autopilot Options، اترك المربع محددًا وفي مربع النص أدخل 45.

  9. حدد Node Type: Standard_DS3_v2

  10. حدد "Create Cluster".

استنساخ أرشيف Databricks

  1. إذا لم تكن لديك مساحة عمل خاصة بك على Azure Databricks مفتوحة حالياً: انتقل في مدخل Azure إلى مساحة العمل الخاصة بك Azure Databricks التي تم نشرها وحدد "Launch Workspace".

  2. حدد "Workspace" > "Users" في الجزء الأيسر، وحدد اسم المستخدم الخاص بك (الإدخال ذو أيقونة المنزل).

  3. في الجزء الذي يظهر، حدد السهم الموجود بجوار اسمك، وحدد "Import".

    خيار القائمة لاستيراد الأرشيف

  4. في مربع الحوار "Import Notebooks"، حدد عنوان URL والصقه في عنوان URL التالي:

    https://github.com/MicrosoftDocs/mslearn_databricks/blob/main/mlflow/1.1.0/Labs.dbc

  5. حدد "Import".

  6. حدد مجلد ⁧⁩mlflow⁧⁩ الذي يظهر.

إكمال دفتر الملاحظات التالي

افتح ⁧⁩1. دفتر ملاحظات MLflow⁧⁩. تأكد من إرفاق نظام المجموعة الخاص بك بدفتر الملاحظات قبل اتباع التعليمات وتشغيل الخلايا بداخله.

في دفتر الملاحظات، سوف تتمكن مما يلي:

  • استخدام MLflow لتتبع التجارب، وتسجيل المقاييس، ومقارنة العمليات التشغيلية

بعد إكمال دفتر الملاحظات، ارجع إلى هذه الشاشة، واتبع الخطوة التالية.