Two-Class عنصر غابات القرار
توضح هذه المقالة مكونا في Azure التعلم الآلي مصمم.
استخدم هذا المكون لإنشاء نموذج تعلم آلي يستند إلى خوارزمية غابات القرار.
غابات القرار هي نماذج مجموعة سريعة وخاضعة للإشراف. يعد هذا المكون خيارا جيدا إذا كنت ترغب في التنبؤ بالهدف بنتيجة كحد أقصى.
فهم غابات القرار
خوارزمية غابة القرار هذه هي طريقة تعلم جماعية مخصصة لمهام التصنيف. تعتمد طرق المجموعة على المبدأ العام القائل بأنه بدلا من الاعتماد على نموذج واحد ، يمكنك الحصول على نتائج أفضل ونموذج أكثر عمومية من خلال إنشاء نماذج متعددة ذات صلة ودمجها بطريقة ما. بشكل عام ، توفر نماذج المجموعة تغطية ودقة أفضل من أشجار القرار الفردي.
هناك العديد من الطرق لإنشاء نماذج فردية ودمجها في مجموعة. هذا التنفيذ الخاص لغابة القرار يعمل من خلال بناء أشجار قرار متعددة ثم التصويت على فئة المخرجات الأكثر شعبية. التصويت هو واحد من أفضل الطرق المعروفة لتوليد النتائج في نموذج المجموعة.
- يتم إنشاء العديد من أشجار التصنيف الفردية ، باستخدام مجموعة البيانات بأكملها ، ولكن نقاط بداية مختلفة (عادة ما تكون عشوائية). وهذا يختلف عن نهج الغابات العشوائية، حيث قد تستخدم أشجار القرار الفردية فقط جزءا عشوائيا من البيانات أو الميزات.
- كل شجرة في شجرة غابة القرار تنتج رسما بيانيا غير طبيعي للتردد من التسميات.
- تجمع عملية التجميع هذه المدرج التكراري وتطبيع النتيجة للحصول على "الاحتمالات" لكل تصنيف.
- سيكون للأشجار التي تتمتع بثقة تنبؤ عالية وزن أكبر في القرار النهائي للمجموعة.
تتمتع أشجار القرار بشكل عام بالعديد من المزايا لمهام التصنيف:
- يمكنهم التقاط حدود القرار غير الخطية.
- يمكنك التدريب والتنبؤ بالكثير من البيانات ، لأنها فعالة في الحساب واستخدام الذاكرة.
- يتم دمج اختيار الميزات في عمليات التدريب والتصنيف.
- يمكن أن تستوعب الأشجار البيانات الصاخبة والعديد من الميزات.
- إنها نماذج غير بارامترية ، مما يعني أنها تستطيع التعامل مع البيانات بتوزيعات متنوعة.
ومع ذلك ، يمكن لأشجار القرار البسيطة أن تتلاءم مع البيانات ، وهي أقل قابلية للتعميم من مجموعات الأشجار.
لمزيد من المعلومات، راجع غابات القرار.
كيفية التهيئة
أضف مكون غابة القرار من فئتين إلى خط الأنابيب الخاص بك في Azure التعلم الآلي، وافتح جزء الخصائص من المكون.
يمكنك العثور على المكون ضمن التعلم الآلي. قم بتوسيع تهيئة ثم التصنيف.
بالنسبة لطريقة إعادة التشكيل، اختر الطريقة المستخدمة لإنشاء الأشجار الفردية. يمكنك الاختيار من بين التعبئة أو النسخ المتماثل.
التعبئة: ويسمى التعبئة أيضا تجميع bootstrap. في هذه الطريقة، يتم زراعة كل شجرة على عينة جديدة، يتم إنشاؤها عن طريق أخذ عينات عشوائية من مجموعة البيانات الأصلية مع استبدالها حتى يكون لديك مجموعة بيانات بحجم المجموعة الأصلية.
يتم الجمع بين مخرجات النماذج عن طريق التصويت ، وهو شكل من أشكال التجميع. كل شجرة في غابة قرار التصنيف تنتج رسما بيانيا غير طبيعي للتردد من التسميات. التجميع هو جمع هذه المدرج التكراري وتطبيعه للحصول على "الاحتمالات" لكل تسمية. وبهذه الطريقة ، سيكون للأشجار التي تتمتع بثقة تنبؤ عالية وزن أكبر في القرار النهائي للمجموعة.
لمزيد من المعلومات، راجع إدخال ويكيبيديا لتجميع Bootstrap.
النسخ المتماثل: في النسخ المتماثل ، يتم تدريب كل شجرة على نفس بيانات الإدخال بالضبط. يبقى تحديد المسند المقسم المستخدم لكل عقدة شجرة عشوائيا وستكون الأشجار متنوعة.
حدد الطريقة التي تريد تدريب النموذج بها، عن طريق تعيين الخيار إنشاء وضع مدرب .
معلمة واحدة: إذا كنت تعرف الطريقة التي تريد بها تكوين النموذج، فيمكنك توفير مجموعة محددة من القيم كوسيطات.
نطاق المعلمات: إذا لم تكن متأكدا من أفضل المعلمات ، فيمكنك العثور على المعلمات المثلى باستخدام مكون Tune Model Hyperparameters . يمكنك توفير نطاق معين من القيم، ويكرر المدرب على مجموعات متعددة من الإعدادات لتحديد مجموعة القيم التي تنتج أفضل نتيجة.
بالنسبة إلى عدد أشجار القرار، اكتب الحد الأقصى لعدد أشجار القرار التي يمكن إنشاؤها في المجموعة. من خلال إنشاء المزيد من أشجار القرار ، يمكنك الحصول على تغطية أفضل ، ولكن وقت التدريب يزيد.
ملاحظة
إذا قمت بتعيين القيمة إلى 1. ومع ذلك ، يمكن إنتاج شجرة واحدة فقط (الشجرة مع المجموعة الأولية من المعلمات) ولا يتم إجراء أي تكرارات أخرى.
للحصول على أقصى عمق لأشجار القرار، اكتب رقما للحد من الحد الأقصى لعمق أي شجرة قرار. زيادة عمق الشجرة قد تزيد من الدقة ، في خطر بعض الإفراط في التركيب وزيادة وقت التدريب.
بالنسبة إلى الحد الأدنى لعدد العينات لكل عقدة ورقة، حدد الحد الأدنى لعدد الحالات المطلوبة لإنشاء أي عقدة طرفية (ورقة) في شجرة.
من خلال زيادة هذه القيمة، يمكنك زيادة الحد الأدنى لإنشاء قواعد جديدة. على سبيل المثال، مع القيمة الافتراضية 1، حتى حالة واحدة يمكن أن تتسبب في إنشاء قاعدة جديدة. إذا قمت بزيادة القيمة إلى 5 ، فيجب أن تحتوي بيانات التدريب على خمس حالات على الأقل تستوفي نفس الشروط.
حدد الخيار السماح بقيم غير معروفة للميزات الفئوية لإنشاء مجموعة لقيم غير معروفة في مجموعات التدريب أو التحقق من الصحة. قد يكون النموذج أقل دقة للقيم المعروفة، ولكنه يمكن أن يوفر تنبؤات أفضل للقيم الجديدة (غير المعروفة).
إذا قمت بإلغاء تحديد هذا الخيار، يمكن للنموذج قبول القيم المضمنة في بيانات التدريب فقط.
إرفاق مجموعة بيانات موسومة ، وتدريب النموذج:
إذا قمت بتعيين إنشاء وضع مدرب إلى معلمة واحدة، فقم بتوصيل مجموعة بيانات ذات علامات تمييز بمكون نموذج القطار .
إذا قمت بتعيين إنشاء وضع المدرب إلى نطاق المعلمات، فقم بتوصيل مجموعة بيانات ذات علامات وتدريب النموذج باستخدام معلمات Tune Model Hyperمعلمات.
ملاحظة
إذا قمت بتمرير نطاق معلمات إلى نموذج القطار، فإنه يستخدم فقط القيمة الافتراضية في قائمة معلمات واحدة.
إذا قمت بتمرير مجموعة واحدة من قيم المعلمات إلى مكون Tune Model Hyperparameters ، فعندما تتوقع نطاقا من الإعدادات لكل معلمة ، فإنها تتجاهل القيم وتستخدم القيم الافتراضية للمتعلم.
إذا قمت بتحديد خيار نطاق المعلمات وأدخلت قيمة واحدة لأي معلمة، استخدام هذه القيمة المفردة التي حددتها خلال عملية المسح، حتى إذا تغيرت المعلمات الأخرى عبر نطاق من القيم.
النتائج
بعد اكتمال التدريب:
لحفظ لقطة للنموذج المدرب، حدد علامة التبويب المخرجات في اللوحة اليمنى من مكون نموذج القطار . حدد أيقونة تسجيل مجموعة البيانات لحفظ النموذج كمكون قابل لإعادة الاستخدام.
لاستخدام النموذج للتسجيل، أضف مكون نموذج النتيجة إلى خط أنابيب.
الخطوات التالية
راجع مجموعة المكونات المتوفرة ل Azure التعلم الآلي.