Two-Class مكون شجرة القرار المعزز

توضح هذه المقالة مكونا في Azure التعلم الآلي مصمم.

استخدم هذا المكون لإنشاء نموذج تعلم آلي يستند إلى خوارزمية أشجار القرار المعززة.

شجرة القرار المعززة هي طريقة تعلم جماعية تصحح فيها الشجرة الثانية أخطاء الشجرة الأولى ، وتصحح الشجرة الثالثة أخطاء الشجرتين الأولى والثانية ، وما إلى ذلك. تعتمد التنبؤات على مجموعة الأشجار بأكملها معا التي تجعل التنبؤ.

بشكل عام ، عند تكوينها بشكل صحيح ، تعد أشجار القرار المعززة أسهل الطرق للحصول على أعلى أداء في مجموعة واسعة من مهام التعلم الآلي. ومع ذلك ، فهم أيضا أحد المتعلمين الأكثر كثافة في الذاكرة ، والتطبيق الحالي يحمل كل شيء في الذاكرة. لذلك ، قد لا يتمكن نموذج شجرة القرار المعزز من معالجة مجموعات البيانات الكبيرة التي يمكن لبعض المتعلمين الخطيين التعامل معها.

يعتمد هذا المكون على خوارزمية LightGBM.

كيفية التهيئة

ينشئ هذا المكون نموذج تصنيف غير مدرب. نظرا لأن التصنيف هو طريقة تعلم خاضعة للإشراف، لتدريب النموذج، تحتاج إلى مجموعة بيانات ذات علامات تتضمن عمود تسمية بقيمة لجميع الصفوف.

يمكنك تدريب هذا النوع من النماذج باستخدام نموذج القطار.

  1. في Azure التعلم الآلي، أضف مكون شجرة القرار المعزز إلى خط الأنابيب.

  2. حدد الطريقة التي تريد تدريب النموذج بها، عن طريق تعيين الخيار إنشاء وضع مدرب .

    • معلمة واحدة: إذا كنت تعرف الطريقة التي تريد بها تكوين النموذج، فيمكنك توفير مجموعة محددة من القيم كوسيطات.

    • نطاق المعلمات: إذا لم تكن متأكدا من أفضل المعلمات ، فيمكنك العثور على المعلمات المثلى باستخدام مكون Tune Model Hyperparameters . يمكنك توفير نطاق معين من القيم، ويكرر المدرب على مجموعات متعددة من الإعدادات لتحديد مجموعة القيم التي تنتج أفضل نتيجة.

  3. بالنسبة إلى الحد الأقصى لعدد الأوراق لكل شجرة، أشر إلى الحد الأقصى لعدد العقد الطرفية (الأوراق) التي يمكن إنشاؤها في أي شجرة.

    من خلال زيادة هذه القيمة ، من المحتمل أن تزيد من حجم الشجرة وتحصل على دقة أفضل ، في خطر الإفراط في التركيب ووقت التدريب الأطول.

  4. بالنسبة للحد الأدنى لعدد العينات لكل عقدة ورقة، يرجى الإشارة إلى عدد الحالات المطلوبة لإنشاء أي عقدة طرفية (ورقة) في شجرة.

    من خلال زيادة هذه القيمة، يمكنك زيادة الحد الأدنى لإنشاء قواعد جديدة. على سبيل المثال، مع القيمة الافتراضية 1، حتى حالة واحدة يمكن أن تتسبب في إنشاء قاعدة جديدة. إذا قمت بزيادة القيمة إلى 5 ، فيجب أن تحتوي بيانات التدريب على خمس حالات على الأقل تستوفي نفس الشروط.

  5. للحصول على معدل Learning، اكتب رقما بين 0 و1 يحدد حجم الخطوة أثناء التعلم.

    يحدد معدل التعلم مدى سرعة أو بطء تقارب المتعلم على الحل الأمثل. إذا كان حجم الخطوة كبيرا جدا، فقد تتجاوز الحل الأمثل. إذا كان حجم الخطوة صغيرا جدا ، فإن التدريب يستغرق وقتا أطول للتقارب حول أفضل الحلول.

  6. بالنسبة لعدد الأشجار التي تم بناؤها، أشر إلى إجمالي عدد أشجار القرار التي سيتم إنشاؤها في المجموعة. من خلال إنشاء المزيد من أشجار القرار ، يمكنك الحصول على تغطية أفضل ، ولكن وقت التدريب سيزداد.

    إذا قمت بتعيين القيمة إلى 1 ، إنتاج شجرة واحدة فقط (الشجرة مع المجموعة الأولية من المعلمات) ولا يتم إجراء أي تكرارات أخرى.

  7. بالنسبة لبذور الأرقام العشوائية، اكتب اختياريا عددا صحيحا غير سالب لاستخدامه كقيمة البذور العشوائية. يضمن تحديد البذور إمكانية التكرار عبر عمليات التشغيل التي تحتوي على نفس البيانات والمعلمات.

    يتم تعيين البذور العشوائية افتراضيا إلى 0 ، مما يعني أنه يتم الحصول على قيمة البذور الأولية من ساعة النظام. يمكن أن يكون للعمليات المتتالية باستخدام بذرة عشوائية نتائج مختلفة.

  8. تدريب النموذج:

    • إذا قمت بتعيين إنشاء وضع مدرب إلى معلمة واحدة، فقم بتوصيل مجموعة بيانات ذات علامات تمييز بمكون نموذج القطار .

    • إذا قمت بتعيين إنشاء وضع المدرب إلى نطاق المعلمات، فقم بتوصيل مجموعة بيانات ذات علامات وتدريب النموذج باستخدام معلمات Tune Model Hyperمعلمات.

    ملاحظة

    إذا قمت بتمرير نطاق معلمات إلى نموذج القطار، فإنه يستخدم فقط القيمة الافتراضية في قائمة معلمات واحدة.

    إذا قمت بتمرير مجموعة واحدة من قيم المعلمات إلى مكون Tune Model Hyperparameters ، فعندما تتوقع نطاقا من الإعدادات لكل معلمة ، فإنها تتجاهل القيم وتستخدم القيم الافتراضية للمتعلم.

    إذا قمت بتحديد خيار نطاق المعلمات وأدخلت قيمة واحدة لأي معلمة، استخدام هذه القيمة المفردة التي حددتها خلال عملية المسح، حتى إذا تغيرت المعلمات الأخرى عبر نطاق من القيم.

النتائج

بعد اكتمال التدريب:

  • لحفظ لقطة للنموذج المدرب، حدد علامة التبويب المخرجات في اللوحة اليمنى من مكون نموذج القطار . حدد أيقونة تسجيل مجموعة البيانات لحفظ النموذج كمكون قابل لإعادة الاستخدام.

  • لاستخدام النموذج للتسجيل، أضف مكون نموذج النتيجة إلى خط أنابيب.

الخطوات التالية

راجع مجموعة المكونات المتوفرة ل Azure التعلم الآلي.