شجرة قرار معززة متعددة الطبقات

توضح هذه المقالة مكونا في Azure التعلم الآلي مصمم.

استخدم هذا المكون لإنشاء نموذج تعلم آلي يستند إلى خوارزمية أشجار القرار المعززة.

شجرة القرار المعززة هي طريقة تعلم جماعية تصحح فيها الشجرة الثانية أخطاء الشجرة الأولى ، وتصحح الشجرة الثالثة أخطاء الشجرتين الأولى والثانية ، وما إلى ذلك. تعتمد التنبؤات على مجموعة الأشجار معا.

كيفية التهيئة

ينشئ هذا المكون نموذج تصنيف غير مدرب. نظرا لأن التصنيف هو أسلوب تعلم خاضع للإشراف، فأنت بحاجة إلى مجموعة بيانات مصنفة تتضمن عمود تسمية بقيمة لجميع الصفوف.

يمكنك تدريب هذا النوع من النماذج باستخدام نموذج القطار.

  1. أضف مكون شجرة القرار المعزز متعدد الفئات إلى خط الأنابيب.

  2. حدد الطريقة التي تريد تدريب النموذج بها عن طريق تعيين الخيار إنشاء وضع مدرب .

    • معلمة واحدة: إذا كنت تعرف الطريقة التي تريد بها تكوين النموذج، فيمكنك توفير مجموعة محددة من القيم كوسيطات.

    • نطاق المعلمات: حدد هذا الخيار إذا لم تكن متأكدا من أفضل المعلمات، وتريد تشغيل عملية مسح معلمة. حدد نطاقا من القيم لتكراره، وتكرر المعلمات التشعبية لنموذج Tune على جميع المجموعات الممكنة من الإعدادات التي قدمتها لتحديد المعلمات التشعبية التي تنتج أفضل النتائج.

  3. الحد الأقصى لعدد الأوراق لكل شجرة يحد من الحد الأقصى لعدد العقد الطرفية (الأوراق) التي يمكن إنشاؤها في أي شجرة.

    من خلال زيادة هذه القيمة ، من المحتمل أن تزيد من حجم الشجرة وتحقق دقة أعلى ، في خطر الإفراط في التركيب ووقت التدريب الأطول.

  4. يشير الحد الأدنى لعدد العينات لكل عقدة ورقة إلى عدد الحالات المطلوبة لإنشاء أي عقدة طرفية (ورقة) في شجرة.

    من خلال زيادة هذه القيمة، يمكنك زيادة الحد الأدنى لإنشاء قواعد جديدة. على سبيل المثال، مع القيمة الافتراضية 1، حتى حالة واحدة يمكن أن تتسبب في إنشاء قاعدة جديدة. إذا قمت بزيادة القيمة إلى 5 ، فيجب أن تحتوي بيانات التدريب على خمس حالات على الأقل تستوفي نفس الشروط.

  5. يحدد معدل Learning حجم الخطوة أثناء التعلم. أدخل رقما بين 0 و1.

    يحدد معدل التعلم مدى سرعة أو بطء تقارب المتعلم على الحل الأمثل. إذا كان حجم الخطوة كبيرا جدا، فقد تتجاوز الحل الأمثل. إذا كان حجم الخطوة صغيرا جدا ، فإن التدريب يستغرق وقتا أطول للتقارب حول أفضل الحلول.

  6. يشير عدد الأشجار التي تم بناؤها إلى إجمالي عدد أشجار القرار التي سيتم إنشاؤها في المجموعة. من خلال إنشاء المزيد من أشجار القرار ، يمكنك الحصول على تغطية أفضل ، ولكن وقت التدريب سيزداد.

  7. تقوم بذور الأرقام العشوائية اختياريا بتعيين عدد صحيح غير سالب لاستخدامه كقيمة البذور العشوائية. يضمن تحديد البذور إمكانية التكرار عبر عمليات التشغيل التي تحتوي على نفس البيانات والمعلمات.

    يتم تعيين البذور العشوائية افتراضيا إلى 42. يمكن أن يكون للركض المتتالي باستخدام بذور عشوائية مختلفة نتائج مختلفة.

  8. تدريب النموذج:

    • إذا قمت بتعيين إنشاء وضع مدرب إلى معلمة واحدة، فقم بتوصيل مجموعة بيانات ذات علامات تمييز بمكون نموذج القطار .

    • إذا قمت بتعيين إنشاء وضع المدرب إلى نطاق المعلمات، فقم بتوصيل مجموعة بيانات ذات علامات وتدريب النموذج باستخدام معلمات Tune Model Hyperمعلمات.

    ملاحظة

    إذا قمت بتمرير نطاق معلمات إلى نموذج القطار، فإنه يستخدم فقط القيمة الافتراضية في قائمة معلمات واحدة.

    إذا قمت بتمرير مجموعة واحدة من قيم المعلمات إلى مكون Tune Model Hyperparameters ، فعندما تتوقع نطاقا من الإعدادات لكل معلمة ، فإنها تتجاهل القيم وتستخدم القيم الافتراضية للمتعلم.

    إذا قمت بتحديد خيار نطاق المعلمات وأدخلت قيمة واحدة لأي معلمة، استخدام هذه القيمة المفردة التي حددتها خلال عملية المسح، حتى إذا تغيرت المعلمات الأخرى عبر نطاق من القيم.

الخطوات التالية

راجع مجموعة المكونات المتوفرة ل Azure التعلم الآلي.