مكون غابة القرار متعدد الطبقات

توضح هذه المقالة مكونا في Azure التعلم الآلي مصمم.

استخدم هذا المكون لإنشاء نموذج تعلم آلي استنادا إلى خوارزمية غابة القرار . غابة القرار هي نموذج مجموعة يبني بسرعة سلسلة من أشجار القرار ، بينما يتعلم من البيانات المعلمة.

المزيد عن غابات القرار

خوارزمية غابة القرار هي طريقة تعلم جماعية للتصنيف. تعمل الخوارزمية عن طريق بناء أشجار قرار متعددة ثم التصويت على فئة المخرجات الأكثر شعبية. التصويت هو شكل من أشكال التجميع ، حيث تنتج كل شجرة في غابة قرار التصنيف رسما بيانيا غير طبيعي للتسميات الترددية. تجمع عملية التجميع هذه المدرج التكراري وتطبيع النتيجة للحصول على "الاحتمالات" لكل تصنيف. الأشجار التي لديها ثقة عالية في التنبؤ لها وزن أكبر في القرار النهائي للمجموعة.

أشجار القرار بشكل عام هي نماذج غير بارامترية ، مما يعني أنها تدعم البيانات ذات التوزيعات المتنوعة. في كل شجرة ، يتم تشغيل سلسلة من الاختبارات البسيطة لكل فئة ، مما يزيد من مستويات بنية الشجرة حتى يتم الوصول إلى عقدة ورقة (قرار).

أشجار القرار لها العديد من المزايا:

  • يمكن أن تمثل حدود القرار غير الخطية.
  • فهي فعالة في الحساب واستخدام الذاكرة أثناء التدريب والتنبؤ.
  • يقومون باختيار الميزات المتكاملة وتصنيفها.
  • فهي مرنة في وجود ميزات صاخبة.

يتكون مصنف غابة القرار في Azure التعلم الآلي من مجموعة من أشجار القرار. بشكل عام ، توفر نماذج المجموعة تغطية ودقة أفضل من أشجار القرار الفردي. لمزيد من المعلومات، راجع أشجار القرار.

كيفية تكوين غابة القرار متعددة الفئات

  1. أضف مكون غابة القرار متعدد الفئات إلى خط الأنابيب الخاص بك في المصمم. يمكنك العثور على هذا المكون ضمن التعلم الآليوتهيئة النموذجوالتصنيف.

  2. انقر نقرا مزدوجا فوق المكون لفتح جزء الخصائص .

  3. بالنسبة لطريقة إعادة التشكيل، اختر الطريقة المستخدمة لإنشاء الأشجار الفردية. يمكنك الاختيار من بين التعبئة أو النسخ المتماثل.

    • التعبئة: ويسمى التعبئة أيضا تجميع bootstrap. في هذه الطريقة، يتم زراعة كل شجرة على عينة جديدة، يتم إنشاؤها عن طريق أخذ عينات عشوائية من مجموعة البيانات الأصلية مع استبدالها حتى يكون لديك مجموعة بيانات بحجم المجموعة الأصلية. يتم الجمع بين مخرجات النماذج عن طريق التصويت ، وهو شكل من أشكال التجميع. لمزيد من المعلومات، راجع إدخال ويكيبيديا لتجميع Bootstrap.

    • النسخ المتماثل: في النسخ المتماثل ، يتم تدريب كل شجرة على نفس بيانات الإدخال بالضبط. يظل تحديد المسند المقسم المستخدم لكل عقدة شجرة عشوائيا ، مما يخلق أشجارا متنوعة.

  4. حدد الطريقة التي تريد تدريب النموذج بها، عن طريق تعيين الخيار إنشاء وضع مدرب .

    • معلمة واحدة: حدد هذا الخيار إذا كنت تعرف الطريقة التي تريد بها تكوين النموذج، وقم بتوفير مجموعة من القيم كوسيطات.

    • نطاق المعلمات: حدد هذا الخيار إذا لم تكن متأكدا من أفضل المعلمات، وتريد تشغيل عملية مسح معلمة. حدد نطاقا من القيم لتكراره، وتكرر المعلمات التشعبية لنموذج Tune على جميع المجموعات الممكنة من الإعدادات التي قدمتها لتحديد المعلمات التشعبية التي تنتج أفضل النتائج.

  5. عدد أشجار القرار: اكتب الحد الأقصى لعدد أشجار القرار التي يمكن إنشاؤها في المجموعة. من خلال إنشاء المزيد من أشجار القرار ، يمكنك الحصول على تغطية أفضل ، ولكن قد يزداد وقت التدريب.

    إذا قمت بتعيين القيمة إلى 1 ؛ ومع ذلك ، هذا يعني أنه يمكن إنتاج شجرة واحدة فقط (الشجرة مع المجموعة الأولية من المعلمات) ، ولا يتم إجراء أي تكرارات أخرى.

  6. الحد الأقصى لعمق أشجار القرار: اكتب رقما للحد من الحد الأقصى لعمق أي شجرة قرار. زيادة عمق الشجرة قد تزيد من الدقة ، في خطر بعض الإفراط في التركيب وزيادة وقت التدريب.

  7. عدد الانقسامات العشوائية لكل عقدة: اكتب عدد الانقسامات لاستخدامها عند إنشاء كل عقدة من الشجرة. الانقسام يعني أن المعالم في كل مستوى من مستويات الشجرة (العقدة) يتم تقسيمها عشوائيا.

  8. الحد الأدنى لعدد العينات لكل عقدة ورقة: حدد الحد الأدنى لعدد الحالات المطلوبة لإنشاء أي عقدة طرفية (ورقة) في شجرة. من خلال زيادة هذه القيمة، يمكنك زيادة الحد الأدنى لإنشاء قواعد جديدة.

    على سبيل المثال، مع القيمة الافتراضية 1، حتى حالة واحدة يمكن أن تتسبب في إنشاء قاعدة جديدة. إذا قمت بزيادة القيمة إلى 5 ، فيجب أن تحتوي بيانات التدريب على خمس حالات على الأقل تستوفي نفس الشروط.

  9. الاتصال مجموعة بيانات موسومة ، وتدريب النموذج:

    • إذا قمت بتعيين إنشاء وضع مدرب إلى معلمة واحدة، فقم بتوصيل مجموعة بيانات ذات علامات تمييز بمكون نموذج القطار .

    • إذا قمت بتعيين إنشاء وضع المدرب إلى نطاق المعلمات، فقم بتوصيل مجموعة بيانات ذات علامات وتدريب النموذج باستخدام معلمات Tune Model Hyperمعلمات.

    ملاحظة

    إذا قمت بتمرير نطاق معلمات إلى نموذج القطار، فإنه يستخدم فقط القيمة الافتراضية في قائمة معلمات واحدة.

    إذا قمت بتمرير مجموعة واحدة من قيم المعلمات إلى مكون Tune Model Hyperparameters ، فعندما تتوقع نطاقا من الإعدادات لكل معلمة ، فإنها تتجاهل القيم وتستخدم القيم الافتراضية للمتعلم.

    إذا قمت بتحديد خيار نطاق المعلمات وأدخلت قيمة واحدة لأي معلمة، استخدام هذه القيمة المفردة التي حددتها خلال عملية المسح، حتى إذا تغيرت المعلمات الأخرى عبر نطاق من القيم.

  10. إرسال المسار.

الخطوات التالية

راجع مجموعة المكونات المتوفرة ل Azure التعلم الآلي.