مكون انحدار شجرة القرار المعزز

توضح هذه المقالة مكونا في Azure التعلم الآلي مصمم.

استخدم هذا المكون لإنشاء مجموعة من أشجار الانحدار باستخدام التعزيز. التعزيز يعني أن كل شجرة تعتمد على الأشجار السابقة. تتعلم الخوارزمية من خلال تركيب بقايا الأشجار التي سبقتها. وبالتالي ، فإن التعزيز في مجموعة شجرة القرار يميل إلى تحسين الدقة مع بعض المخاطر الصغيرة المتمثلة في تغطية أقل.

يعتمد هذا المكون على خوارزمية LightGBM.

طريقة الانحدار هذه هي طريقة تعلم خاضعة للإشراف ، وبالتالي تتطلب مجموعة بيانات موسومة. يجب أن يحتوي عمود التسمية على قيم رقمية.

ملاحظة

استخدم هذا المكون فقط مع مجموعات البيانات التي تستخدم المتغيرات الرقمية.

بعد تعريف النموذج، قم بتدريبه باستخدام نموذج القطار.

المزيد عن أشجار الانحدار المعززة

التعزيز هو واحد من عدة طرق كلاسيكية لإنشاء نماذج جماعية ، إلى جانب التعبئة ، والغابات العشوائية ، وما إلى ذلك. في Azure التعلم الآلي، تستخدم أشجار القرار المعززة تطبيقا فعالا لخوارزمية تعزيز التدرج MART. تعزيز التدرج هو تقنية التعلم الآلي لمشاكل الانحدار. يبني كل شجرة انحدار بطريقة تدريجية ، باستخدام دالة فقدان محددة مسبقا لقياس الخطأ في كل خطوة وتصحيحها في الخطوة التالية. وبالتالي فإن نموذج التنبؤ هو في الواقع مجموعة من نماذج التنبؤ الأضعف.

في مشاكل الانحدار ، يبني التعزيز سلسلة من الأشجار بطريقة تدريجية ، ثم يختار الشجرة المثلى باستخدام وظيفة خسارة عشوائية قابلة للتمييز.

للحصول على معلومات إضافية، راجع هذه المقالات:

يمكن أيضا استخدام طريقة تعزيز التدرج لمشاكل التصنيف عن طريق تقليلها إلى الانحدار مع وظيفة فقدان مناسبة. لمزيد من المعلومات حول تنفيذ الأشجار المعززة لمهام التصنيف، راجع شجرة القرار المعزز من فئتين.

كيفية تكوين انحدار شجرة القرار المعزز

  1. أضف مكون شجرة القرار المعزز إلى خط الأنابيب. يمكنك العثور على هذا المكون ضمن التعلم الآلي، تهيئة، ضمن فئة الانحدار.

  2. حدد الطريقة التي تريد تدريب النموذج بها، عن طريق تعيين الخيار إنشاء وضع مدرب .

    • معلمة واحدة: حدد هذا الخيار إذا كنت تعرف كيف تريد تكوين النموذج، وقم بتوفير مجموعة محددة من القيم كوسيطات.

    • نطاق المعلمات: حدد هذا الخيار إذا لم تكن متأكدا من أفضل المعلمات، وتريد تشغيل عملية مسح معلمة. حدد نطاقا من القيم لتكراره، وتكرر المعلمات التشعبية لنموذج Tune على جميع المجموعات الممكنة من الإعدادات التي قدمتها لتحديد المعلمات التشعبية التي تنتج أفضل النتائج.

  3. الحد الأقصى لعدد الأوراق لكل شجرة: حدد الحد الأقصى لعدد العقد الطرفية (الأوراق) التي يمكن إنشاؤها في أي شجرة.

    من خلال زيادة هذه القيمة ، من المحتمل أن تزيد من حجم الشجرة وتحصل على دقة أفضل ، في خطر الإفراط في التركيب ووقت التدريب الأطول.

  4. الحد الأدنى لعدد العينات لكل عقدة ورقة: حدد الحد الأدنى لعدد الحالات المطلوبة لإنشاء أي عقدة طرفية (ورقة) في شجرة.

    من خلال زيادة هذه القيمة، يمكنك زيادة الحد الأدنى لإنشاء قواعد جديدة. على سبيل المثال، مع القيمة الافتراضية 1، حتى حالة واحدة يمكن أن تتسبب في إنشاء قاعدة جديدة. إذا قمت بزيادة القيمة إلى 5 ، فيجب أن تحتوي بيانات التدريب على 5 حالات على الأقل تستوفي نفس الشروط.

  5. معدل Learning: اكتب رقما بين 0 و 1 يحدد حجم الخطوة أثناء التعلم. يحدد معدل التعلم مدى سرعة أو بطء تقارب المتعلم على الحل الأمثل. إذا كان حجم الخطوة كبيرا جدا ، فقد تتجاوز الحل الأمثل. إذا كان حجم الخطوة صغيرا جدا ، فإن التدريب يستغرق وقتا أطول للتقارب حول أفضل الحلول.

  6. عدد الأشجار التي تم بناؤها: حدد العدد الإجمالي لأشجار القرار التي سيتم إنشاؤها في المجموعة. من خلال إنشاء المزيد من أشجار القرار ، يمكنك الحصول على تغطية أفضل ، ولكن وقت التدريب يزيد.

    إذا قمت بتعيين القيمة إلى 1 ؛ ومع ذلك ، يتم إنتاج شجرة واحدة فقط (الشجرة مع المجموعة الأولية من المعلمات) ولا يتم إجراء أي تكرارات أخرى.

  7. بذور الأرقام العشوائية: اكتب عددا صحيحا اختياريا غير سالب لاستخدامه كقيمة بذرة عشوائية. يضمن تحديد البذور إمكانية التكرار عبر عمليات التشغيل التي تحتوي على نفس البيانات والمعلمات.

    بشكل افتراضي ، يتم تعيين البذور العشوائية إلى 0 ، مما يعني أنه يتم الحصول على قيمة البذور الأولية من ساعة النظام.

  8. تدريب النموذج:

    • إذا قمت بتعيين إنشاء وضع مدرب إلى معلمة واحدة، فقم بتوصيل مجموعة بيانات ذات علامات تمييز بمكون نموذج القطار .

    • إذا قمت بتعيين إنشاء وضع المدرب إلى نطاق المعلمات، فقم بتوصيل مجموعة بيانات ذات علامات وتدريب النموذج باستخدام معلمات Tune Model Hyperمعلمات.

    ملاحظة

    إذا قمت بتمرير نطاق معلمات إلى نموذج القطار، فإنه يستخدم فقط القيمة الافتراضية في قائمة معلمات واحدة.

    إذا قمت بتمرير مجموعة واحدة من قيم المعلمات إلى مكون Tune Model Hyperparameters ، فعندما تتوقع نطاقا من الإعدادات لكل معلمة ، فإنها تتجاهل القيم وتستخدم القيم الافتراضية للمتعلم.

    إذا قمت بتحديد خيار نطاق المعلمات وأدخلت قيمة واحدة لأي معلمة، استخدام هذه القيمة المفردة التي حددتها خلال عملية المسح، حتى إذا تغيرت المعلمات الأخرى عبر نطاق من القيم.

  9. إرسال المسار.

النتائج

بعد اكتمال التدريب:

  • لاستخدام النموذج للتسجيل، قم بتوصيل نموذج القطار بنموذجالنتيجة، للتنبؤ بقيم أمثلة الإدخال الجديدة.

  • لحفظ لقطة للنموذج المدرب، حدد علامة التبويب المخرجات في اللوحة اليمنى من النموذج المدرب وانقر فوق رمز تسجيل مجموعة البيانات . سيتم حفظ نسخة النموذج المدرب كمكون في شجرة المكونات ولن يتم تحديثها في عمليات التشغيل المتتالية لخط الأنابيب.

الخطوات التالية

راجع مجموعة المكونات المتوفرة ل Azure التعلم الآلي.