الانحدار السريع للكمية في الغابة
توضح هذه المقالة وحدة نمطية في Azure التعلم الآلي مصمم.
استخدم هذا المكون لإنشاء نموذج انحدار كمي سريع للغابات في خط أنابيب. يعد الانحدار الكمي السريع للغابات مفيدا إذا كنت ترغب في فهم المزيد حول توزيع القيمة المتوقعة ، بدلا من الحصول على قيمة تنبؤ متوسطة واحدة. هذه الطريقة لها العديد من التطبيقات ، بما في ذلك:
التنبؤ بالأسعار
تقدير أداء الطالب أو تطبيق مخططات النمو لتقييم نمو الطفل
اكتشاف العلاقات التنبؤية في الحالات التي لا توجد فيها سوى علاقة ضعيفة بين المتغيرات
خوارزمية الانحدار هذه هي طريقة تعلم خاضعة للإشراف ، مما يعني أنها تتطلب مجموعة بيانات ذات علامات تتضمن عمود تسمية. نظرا لأنها خوارزمية انحدار، يجب أن يحتوي عمود التسمية على قيم رقمية فقط.
المزيد عن الانحدار الكمي
هناك العديد من أنواع الانحدار المختلفة. ببساطة ، يعني الانحدار تركيب نموذج لهدف يتم التعبير عنه كمتجه رقمي. ومع ذلك ، فقد طور الإحصائيون طرقا متقدمة بشكل متزايد للانحدار.
أبسط تعريف للكمية هو قيمة تقسم مجموعة من البيانات إلى مجموعات متساوية الحجم. وبالتالي ، فإن القيم الكمية تحدد الحدود بين المجموعات. من الناحية الإحصائية ، الكميات هي قيم مأخوذة على فترات منتظمة من عكس دالة التوزيع التراكمي (CDF) لمتغير عشوائي.
في حين تحاول نماذج الانحدار الخطي التنبؤ بقيمة متغير رقمي باستخدام تقدير واحد ، المتوسط ، في بعض الأحيان تحتاج إلى التنبؤ بالنطاق أو التوزيع الكامل للمتغير المستهدف. وقد تم تطوير تقنيات مثل الانحدار البايزي والانحدار الكمي لهذا الغرض.
يساعدك الانحدار الكمي على فهم توزيع القيمة المتوقعة. تتمتع نماذج الانحدار الكمي القائمة على الأشجار ، مثل النموذج المستخدم في هذا المكون ، بميزة إضافية تتمثل في إمكانية استخدامها للتنبؤ بالتوزيعات غير المعلمية.
كيفية تكوين الانحدار الكمي للغابات السريع
أضف مكون الانحدار الكمي السريع للغابات إلى خط الأنابيب الخاص بك في المصمم. يمكنك العثور على هذا المكون ضمن التعلم الآلي الخوارزميات، في فئة الانحدار.
في الجزء الأيسر من مكون الانحدار الكمي السريع للغابات ، حدد الطريقة التي تريد تدريب النموذج بها، عن طريق تعيين الخيار إنشاء وضع مدرب .
معلمة واحدة: إذا كنت تعرف الطريقة التي تريد بها تكوين النموذج، فقم بتوفير مجموعة محددة من القيم كوسيطات. عند تدريب النموذج، استخدم نموذج القطار.
نطاق المعلمات: إذا لم تكن متأكدا من أفضل المعلمات، فقم بإجراء مسح للمعلمات باستخدام مكون Tune Model Hyperparameters (Tune Model Hyperparameters ). يكرر المدرب على قيم متعددة تحددها للعثور على التكوين الأمثل.
عدد الأشجار، اكتب الحد الأقصى لعدد الأشجار التي يمكن إنشاؤها في المجموعة. إذا قمت بإنشاء المزيد من الأشجار ، فإنه يؤدي عموما إلى دقة أكبر ، ولكن على حساب وقت تدريب أطول.
عدد الأوراق، اكتب الحد الأقصى لعدد الأوراق، أو العقد الطرفية، التي يمكن إنشاؤها في أي شجرة.
الحد الأدنى لعدد مثيلات التدريب المطلوبة لتشكيل ورقة، حدد الحد الأدنى لعدد الأمثلة المطلوبة لإنشاء أي عقدة طرفية (ورقة) في شجرة.
من خلال زيادة هذه القيمة، يمكنك زيادة الحد الأدنى لإنشاء قواعد جديدة. على سبيل المثال، مع القيمة الافتراضية 1، حتى حالة واحدة يمكن أن تتسبب في إنشاء قاعدة جديدة. إذا قمت بزيادة القيمة إلى 5 ، فيجب أن تحتوي بيانات التدريب على 5 حالات على الأقل تستوفي نفس الشروط.
كسر التعبئة ، حدد رقما بين 0 و 1 يمثل جزء العينات لاستخدامها عند بناء كل مجموعة من الكميات. يتم اختيار العينات عشوائيا ، مع استبدالها.
تقسيم الكسر، اكتب رقما بين 0 و1 يمثل كسر المعالم المراد استخدامه في كل انقسام من الشجرة. يتم اختيار الميزات المستخدمة دائما بشكل عشوائي.
Quantiles المراد تقديرها، اكتب قائمة مفصولة بفاصلة منقوطة للكميات التي تريد أن يقوم النموذج بتدريبها وإنشاء تنبؤات لها.
على سبيل المثال، إذا كنت تريد إنشاء نموذج يقدر للأرباع، يمكنك كتابة
0.25; 0.5; 0.75.اختياريا، اكتب قيمة لبذرة الرقم العشوائي لزرع مولد الأرقام العشوائية المستخدم من قبل النموذج. الافتراضي هو 0 ، مما يعني أنه يتم اختيار بذرة عشوائية.
يجب عليك تقديم قيمة إذا كنت بحاجة إلى إعادة إنتاج النتائج عبر عمليات التشغيل المتتالية على نفس البيانات.
الاتصال مجموعة بيانات التدريب والنموذج غير المدرب إلى أحد مكونات التدريب:
إذا قمت بتعيين إنشاء وضع مدرب إلى معلمة واحدة، فاستخدم مكون نموذج القطار .
إذا قمت بتعيين إنشاء وضع المدرب إلى نطاق المعلمات، فاستخدم مكون Tune Model Hyperparameters (المعلمات التشعبية ).
تحذير
إذا قمت بتمرير نطاق معلمات إلى نموذج القطار، فإنه يستخدم القيمة الأولى فقط في قائمة نطاق المعلمات.
إذا قمت بتمرير مجموعة واحدة من قيم المعلمات إلى مكون Tune Model Hyperparameters ، فعندما تتوقع نطاقا من الإعدادات لكل معلمة ، فإنها تتجاهل القيم وتستخدم القيم الافتراضية للمتعلم.
إذا قمت بتحديد خيار نطاق المعلمات وأدخلت قيمة واحدة لأي معلمة، استخدام هذه القيمة المفردة التي حددتها خلال عملية المسح، حتى إذا تغيرت المعلمات الأخرى عبر نطاق من القيم.
إرسال المسار.
النتائج
بعد اكتمال التدريب:
- لحفظ لقطة للنموذج المدرب، حدد مكون التدريب، ثم قم بالتبديل إلى علامة التبويب مخرجات+سجلات في اللوحة اليمنى. انقر على أيقونة تسجيل مجموعة البيانات. يمكنك العثور على النموذج المحفوظ كمكون في شجرة المكونات.
الخطوات التالية
راجع مجموعة المكونات المتوفرة ل Azure التعلم الآلي.