ضبط نموذج المعلمات الفائقة
توضح هذه المقالة كيفية استخدام مكون Tune Model Hyperparameters في مصمم Azure التعلم الآلي. الهدف هو تحديد المعلمات الفائقة المثلى لنموذج التعلم الآلي. يقوم المكون بإنشاء نماذج متعددة واختبارها باستخدام مجموعات مختلفة من الإعدادات. يقارن المقاييس على جميع النماذج للحصول على مجموعات من الإعدادات.
يمكن أن يكون مصطلحا المعلمةوالمعلمة الفائقة مربكين. معلمات النموذج هي ما قمت بتعيينه في الجزء الأيسر من المكون. بشكل أساسي ، يقوم هذا المكون بإجراء مسح معلمة فوق إعدادات المعلمة المحددة. يتعلم مجموعة مثالية من المعلمات الفائقة ، والتي قد تكون مختلفة لكل شجرة قرار محددة أو مجموعة بيانات أو طريقة انحدار. تسمى عملية العثور على التكوين الأمثل أحيانا الضبط.
يدعم المكون الطريقة التالية للعثور على الإعدادات المثلى للنموذج: القطار واللحن المتكاملان. في هذه الطريقة، يمكنك تكوين مجموعة من المعلمات للاستخدام. ثم تدع المكون يتكرر عبر مجموعات متعددة. يقيس المكون الدقة حتى يجد نموذجا "أفضل". مع معظم مكونات المتعلم ، يمكنك اختيار المعلمات التي يجب تغييرها أثناء عملية التدريب ، والتي يجب أن تظل ثابتة.
بناء على المدة التي تريد تشغيل عملية الضبط، قد تقرر اختبار جميع المجموعات بشكل شامل. أو يمكنك تقصير العملية عن طريق إنشاء شبكة من مجموعات المعلمات واختبار مجموعة فرعية عشوائية من شبكة المعلمات.
تقوم هذه الطريقة بإنشاء نموذج مدرب يمكنك حفظه لإعادة استخدامه.
تلميح
يمكنك القيام بمهمة ذات صلة. قبل البدء في الضبط، قم بتطبيق تحديد المعالم لتحديد الأعمدة أو المتغيرات التي تحتوي على أعلى قيمة معلومات.
كيفية تكوين المعلمات التشعبية لنموذج Tune
Learning تتطلب المعلمات الفائقة المثلى لنموذج التعلم الآلي استخداما كبيرا لخطوط الأنابيب.
تدريب نموذج باستخدام مسح معلمة
يصف هذا القسم كيفية إجراء مسح معلمة أساسية، والتي تقوم بتدريب نموذج باستخدام مكون Tune Model Hyperparameters (Tune Model Hyperparameters ).
أضف مكون Tune Model Hyperparameters إلى خط الأنابيب الخاص بك في المصمم.
الاتصال نموذج غير مدرب إلى أقصى اليسار.
ملاحظة
لا يمكن توصيل Tune Model Hyperparameters إلا بمكونات خوارزمية التعلم الآلي المضمنة ، ولا يمكن دعم النموذج المخصص المدمج في Create Python Model.
أضف مجموعة البيانات التي تريد استخدامها للتدريب، وقم بتوصيلها بالإدخال الأوسط ل Tune Model Hyperparameters.
اختياريا، إذا كان لديك مجموعة بيانات ذات علامات، فيمكنك توصيلها بمنفذ الإدخال الموجود في أقصى اليمين (مجموعة بيانات التحقق من الصحة الاختيارية). يتيح لك ذلك قياس الدقة أثناء التدريب والضبط.
في اللوحة اليسرى من Tune Model Hyperparameters، اختر قيمة لوضع كنس المعلمات. يتحكم هذا الخيار في كيفية تحديد المعلمات.
الشبكة بأكملها: عند تحديد هذا الخيار، يتكرر المكون فوق شبكة محددة مسبقا بواسطة النظام، لتجربة مجموعات مختلفة وتحديد أفضل متعلم. يكون هذا الخيار مفيدا عندما لا تعرف أفضل إعدادات المعلمات وتريد تجربة جميع مجموعات القيم الممكنة.
الكنس العشوائي: عند تحديد هذا الخيار، سيقوم المكون بتحديد قيم المعلمات عشوائيا عبر نطاق معرف من قبل النظام. يجب تحديد الحد الأقصى لعدد عمليات التشغيل التي تريد أن ينفذها المكون. يكون هذا الخيار مفيدا عندما تريد زيادة أداء النموذج باستخدام المقاييس التي تختارها مع الحفاظ على موارد الحوسبة.
بالنسبة إلى عمود التسمية، افتح محدد الأعمدة لاختيار عمود تسمية واحد.
اختر عدد الأشواط:
- الحد الأقصى لعدد عمليات التشغيل على الاجتياح العشوائي: إذا اخترت مسحا عشوائيا، فيمكنك تحديد عدد المرات التي يجب فيها تدريب النموذج، باستخدام مجموعة عشوائية من قيم المعلمات.
بالنسبة إلى الترتيب، اختر مقياسا واحدا لاستخدامه لترتيب النماذج.
عند تشغيل عملية مسح معلمة، يقوم المكون بحساب جميع المقاييس القابلة للتطبيق لنوع النموذج وإرجاعها في تقرير نتائج الاجتياح . يستخدم المكون مقاييس منفصلة لنماذج الانحدار والتصنيف.
ومع ذلك، يحدد المقياس الذي تختاره كيفية ترتيب النماذج. فقط النموذج الأعلى ، كما هو مرتب حسب المقياس المختار ، هو الإخراج كنموذج مدرب لاستخدامه في التسجيل.
بالنسبة للبذور العشوائية، أدخل رقما صحيحا كحالة مولد أرقام عشوائية زائفة تستخدم لتحديد قيم المعلمات عشوائيا على نطاق محدد مسبقا. هذه المعلمة فعالة فقط إذا كان وضع كنس المعلمة هو الاجتياح العشوائي.
إرسال المسار.
نتائج ضبط المعلمات الفائقة
عند اكتمال التدريب:
لعرض نتائج الكنس، يمكنك إما النقر بزر الماوس الأيمن فوق المكون، ثم تحديد تصور، أو النقر بزر الماوس الأيمن فوق منفذ الإخراج الأيسر للمكون لتصوره.
تتضمن نتائج الاجتياح جميع مقاييس مسح المعلمات ودقتها التي تنطبق على نوع النموذج، ويحدد المقياس الذي حددته للترتيب النموذج الذي يعتبر "الأفضل".
لحفظ لقطة للنموذج المدرب، حدد علامة التبويب مخرجات+سجلات في اللوحة اليمنى من مكون نموذج القطار . حدد أيقونة تسجيل مجموعة البيانات لحفظ النموذج كمكون قابل لإعادة الاستخدام.
ملاحظات فنية
يحتوي هذا القسم على تفاصيل التنفيذ ونصائح.
كيفية عمل مسح المعلمة
عند إعداد مسح معلمة، يمكنك تحديد نطاق البحث. قد يستخدم البحث عددا محدودا من المعلمات المحددة عشوائيا. أو قد يكون بحثا شاملا عبر مساحة معلمة تحددها.
المسح العشوائي: يقوم هذا الخيار بتدريب نموذج باستخدام عدد محدد من التكرارات.
يمكنك تحديد نطاق من القيم لتكرارها، ويستخدم المكون مجموعة فرعية مختارة عشوائيا من تلك القيم. يتم اختيار القيم مع الاستبدال، مما يعني أن الأرقام التي تم اختيارها مسبقا عشوائيا لا تتم إزالتها من مجموعة الأرقام المتاحة. وبالتالي فإن فرصة تحديد أي قيمة تبقى كما هي في جميع التصاريح.
الشبكة بأكملها: يعني خيار استخدام الشبكة بأكملها أنه يتم اختبار كل مجموعة. هذا الخيار هو الأكثر شمولا ، لكنه يتطلب معظم الوقت.
التحكم في طول وتعقيد التدريب
يمكن أن يستغرق التكرار عبر العديد من مجموعات الإعدادات وقتا طويلا ، لذلك يوفر المكون عدة طرق لتقييد العملية:
- الحد من عدد التكرارات المستخدمة لاختبار نموذج.
- الحد من مساحة المعلمة.
- الحد من كل من عدد التكرارات ومساحة المعلمة.
نوصي بإعداد الإعدادات لتحديد الطريقة الأكثر فعالية للتدريب على مجموعة بيانات ونموذج معينين.
اختيار مقياس التقييم
في نهاية الاختبار، يقدم النموذج تقريرا يحتوي على دقة كل نموذج بحيث يمكنك مراجعة نتائج المقياس:
- يتم استخدام مجموعة موحدة من المقاييس لجميع نماذج التصنيف الثنائي.
- يتم استخدام الدقة لجميع نماذج التصنيف متعددة الفئات.
- يتم استخدام مجموعة مختلفة من المقاييس لنماذج الانحدار.
ومع ذلك ، أثناء التدريب ، يجب عليك اختيار مقياس واحد لاستخدامه في ترتيب النماذج التي يتم إنشاؤها أثناء عملية الضبط. قد تجد أن أفضل مقياس يختلف ، اعتمادا على مشكلة عملك وتكلفة الإيجابيات الكاذبة والسلبيات الكاذبة.
المقاييس المستخدمة للتصنيف الثنائي
الدقة هي نسبة النتائج الحقيقية إلى إجمالي الحالات.
الدقة هي نسبة النتائج الحقيقية إلى النتائج الإيجابية.
الاستدعاء هو جزء من جميع النتائج الصحيحة على جميع النتائج.
F-score هو مقياس يوازن بين الدقة والتذكر.
AUC هي قيمة تمثل المساحة تحت المنحنى عندما يتم رسم الإيجابيات الكاذبة على المحور x ويتم رسم الإيجابيات الحقيقية على المحور y.
متوسط فقدان السجل هو الفرق بين توزيعين احتماليين: التوزيع الحقيقي ، والتوزيع الموجود في النموذج.
المقاييس المستخدمة للانحدار
متوسط الخطأ المطلق متوسط جميع الأخطاء في النموذج، حيث الخطأ يعني مسافة القيمة المتوقعة من القيمة الحقيقية. غالبا ما يتم اختصارها باسم MAE.
يقيس جذر متوسط الخطأ التربيعي متوسط مربعات الأخطاء، ثم يأخذ جذر تلك القيمة. غالبا ما يتم اختصارها باسم RMSE.
يمثل الخطأ المطلق النسبي الخطأ كنسبة مئوية من القيمة الحقيقية.
يعمل الخطأ التربيعي النسبي على تطبيع الخطأ التربيعي الكلي عن طريق القسمة على إجمالي الخطأ التربيعي للقيم المتوقعة.
معامل التحديد هو رقم واحد يشير إلى مدى ملاءمة البيانات للنموذج. تعني قيمة واحد أن النموذج يتطابق تماما مع البيانات. تعني قيمة الصفر أن البيانات عشوائية أو لا يمكن ملاءمتها للنموذج. غالبا ما يطلق عليه r2 أو R2 أو r-squared.
المكونات التي لا تدعم مسح المعلمات
يدعم جميع المتعلمين تقريبا في Azure التعلم الآلي التحقق المتبادل من خلال مسح معلمات متكامل، والذي يتيح لك اختيار المعلمات التي تريد التخطيط لها. إذا كان المتعلم لا يدعم تعيين نطاق من القيم، فلا يزال بإمكانك استخدامه في التحقق من الصحة المتقاطعة. في هذه الحالة، يتم تحديد نطاق من القيم المسموح بها للاكتساح.
الخطوات التالية
راجع مجموعة المكونات المتوفرة ل Azure التعلم الآلي.