مكون الانحدار الخطي
توضح هذه المقالة مكونا في Azure التعلم الآلي مصمم.
استخدم هذا المكون لإنشاء نموذج انحدار خطي للاستخدام في خط أنابيب. يحاول الانحدار الخطي إنشاء علاقة خطية بين واحد أو أكثر من المتغيرات المستقلة والنتيجة الرقمية أو المتغير التابع.
يمكنك استخدام هذا المكون لتعريف أسلوب انحدار خطي ثم قم بتدريب نموذج باستخدام مجموعة بيانات مسماة. يمكن بعد ذلك استخدام النموذج المدرب لإجراء التنبؤات.
حول الانحدار الخطي
الانحدار الخطي هو طريقة إحصائية شائعة ، تم اعتمادها في التعلم الآلي وتم تعزيزها بالعديد من الطرق الجديدة لتركيب الخط وقياس الخطأ. ببساطة ، يشير الانحدار إلى التنبؤ بالهدف الرقمي. لا يزال الانحدار الخطي خيارا جيدا عندما تريد نموذجا بسيطا لمهمة تنبؤية أساسية. يميل الانحدار الخطي أيضا إلى العمل بشكل جيد على مجموعات البيانات عالية الأبعاد والمتناثرة التي تفتقر إلى التعقيد.
يدعم Azure التعلم الآلي مجموعة متنوعة من نماذج الانحدار، بالإضافة إلى الانحدار الخطي. ومع ذلك ، يمكن تفسير مصطلح "الانحدار" بشكل فضفاض ، ولا يتم دعم بعض أنواع الانحدار المقدمة في أدوات أخرى.
تتضمن مشكلة الانحدار الكلاسيكية متغيرا مستقلا واحدا ومتغير تابع. وهذا ما يسمى الانحدار البسيط. يدعم هذا المكون الانحدار البسيط.
يتضمن الانحدار الخطي المتعدد متغيرين مستقلين أو أكثر يساهمان في متغير تابع واحد. وتسمى المشاكل التي تستخدم فيها مدخلات متعددة للتنبؤ بنتيجة رقمية واحدة أيضا الانحدار الخطي متعدد المتغيرات.
يمكن لمكون الانحدار الخطي حل هذه المشكلات ، وكذلك معظم مكونات الانحدار الأخرى.
الانحدار متعدد التسميات هو مهمة التنبؤ بمتغيرات تابعة متعددة داخل نموذج واحد. على سبيل المثال، في الانحدار اللوجستي متعدد التسميات، يمكن تعيين عينة إلى تسميات مختلفة متعددة. (يختلف هذا عن مهمة التنبؤ بمستويات متعددة داخل متغير فئة واحد.)
هذا النوع من الانحدار غير معتمد في Azure التعلم الآلي. للتنبؤ بمتغيرات متعددة، قم بإنشاء متعلم منفصل لكل ناتج ترغب في التنبؤ به.
لسنوات ، كان الإحصائيون يطورون طرقا متقدمة بشكل متزايد للانحدار. هذا صحيح حتى بالنسبة للانحدار الخطي. يدعم هذا المكون طريقتين لقياس الخطأ وملاءمة خط الانحدار: طريقة المربعات الصغرى العادية ، وهبوط التدرج.
التدرج التنازلي هو طريقة تقلل من مقدار الخطأ في كل خطوة من خطوات عملية التدريب النموذجية. هناك العديد من الاختلافات في التدرج التنازلي وقد تمت دراسة تحسينه لمختلف مشاكل التعلم على نطاق واسع. إذا اخترت هذا الخيار لطريقة الحل، فيمكنك تعيين مجموعة متنوعة من المعلمات للتحكم في حجم الخطوة ومعدل التعلم وما إلى ذلك. يدعم هذا الخيار أيضا استخدام مسح معلمات متكامل.
المربعات الصغرى العادية هي واحدة من أكثر التقنيات استخداما في الانحدار الخطي. على سبيل المثال، المربعات الصغرى هي الطريقة المستخدمة في مجموعة أدوات التحليل Microsoft Excel.
تشير المربعات الصغرى العادية إلى دالة الخسارة ، التي تحسب الخطأ على أنه مجموع مربع المسافة من القيمة الفعلية إلى الخط المتوقع ، وتناسب النموذج عن طريق تقليل الخطأ التربيعي. تفترض هذه الطريقة وجود علاقة خطية قوية بين المدخلات والمتغير التابع.
تكوين الانحدار الخطي
يدعم هذا المكون طريقتين لتركيب نموذج الانحدار، مع خيارات مختلفة:
تناسب نموذج الانحدار باستخدام المربعات الصغرى العادية
بالنسبة لمجموعات البيانات الصغيرة ، من الأفضل تحديد المربعات الصغرى العادية. هذا يجب أن يعطي نتائج مماثلة Excel.
إنشاء نموذج انحدار باستخدام نسب التدرج عبر الإنترنت
يعد التدرج التنازلي دالة فقدان أفضل للنماذج الأكثر تعقيدا ، أو التي تحتوي على بيانات تدريب قليلة جدا بالنظر إلى عدد المتغيرات.
إنشاء نموذج انحدار باستخدام المربعات الصغرى العادية
أضف مكون نموذج الانحدار الخطي إلى خط الأنابيب الخاص بك في المصمم.
يمكنك العثور على هذا المكون في الفئة التعلم الآلي. قم بتوسيع تهيئة النموذج، قم بتوسيع الانحدار، ثم اسحب مكون نموذج الانحدار الخطي إلى خط الأنابيب الخاص بك.
في جزء الخصائص ، في القائمة المنسدلة أسلوب الحل ، حدد المربعات الصغرى العادية. يحدد هذا الخيار طريقة الحساب المستخدمة للعثور على خط الانحدار.
في وزن تنظيم L2، اكتب القيمة المراد استخدامها كوزن لتنظيم L2. نوصي باستخدام قيمة غير صفرية لتجنب الإفراط في التركيب.
لمعرفة المزيد حول كيفية تأثير التنظيم على تركيب النموذج، راجع هذه المقالة: L1 و L2 Regularization for التعلم الآلي
حدد الخيار، تضمين مصطلح اعتراض، إذا كنت تريد عرض مصطلح الاعتراض.
قم بإلغاء تحديد هذا الخيار إذا لم تكن بحاجة إلى مراجعة صيغة الانحدار.
بالنسبة لبذور الأرقام العشوائية، يمكنك اختياريا كتابة قيمة لزرع مولد الأرقام العشوائية الذي يستخدمه النموذج.
يعد استخدام قيمة البذور مفيدا إذا كنت ترغب في الحفاظ على نفس النتائج عبر عمليات تشغيل مختلفة لنفس خط الأنابيب. وإلا، فإن الإعداد الافتراضي هو استخدام قيمة من ساعة النظام.
أضف مكون نموذج القطار إلى خط الأنابيب الخاص بك، وقم بتوصيل مجموعة بيانات مصنفة.
إرسال المسار.
نتائج نموذج المربعات الصغرى العادية
بعد اكتمال التدريب:
- لإجراء التنبؤات، قم بتوصيل النموذج المدرب بمكون نموذج النتيجة ، إلى جانب مجموعة بيانات من القيم الجديدة.
إنشاء نموذج انحدار باستخدام نسب التدرج عبر الإنترنت
أضف مكون نموذج الانحدار الخطي إلى خط الأنابيب الخاص بك في المصمم.
يمكنك العثور على هذا المكون في الفئة التعلم الآلي. قم بتوسيع تهيئة النموذج، وقم بتوسيع الانحدار، واسحب مكون نموذج الانحدار الخطي إلى خط الأنابيب الخاص بك
في جزء الخصائص ، في القائمة المنسدلة أسلوب الحل ، اختر نسب التدرج عبر الإنترنت كطريقة حساب مستخدمة للبحث عن خط الانحدار.
بالنسبة إلى وضع إنشاء مدرب، حدد ما إذا كنت تريد تدريب النموذج باستخدام مجموعة محددة مسبقا من المعلمات، أو إذا كنت تريد تحسين النموذج باستخدام مسح معلمة.
معلمة واحدة: إذا كنت تعرف كيف تريد تكوين شبكة الانحدار الخطي، فيمكنك توفير مجموعة محددة من القيم كوسيطات.
نطاق المعلمات: حدد هذا الخيار إذا لم تكن متأكدا من أفضل المعلمات، وتريد تشغيل عملية مسح معلمة. حدد نطاقا من القيم لتكراره، وتكرر المعلمات التشعبية لنموذج Tune على جميع المجموعات الممكنة من الإعدادات التي قدمتها لتحديد المعلمات التشعبية التي تنتج أفضل النتائج.
بالنسبة Learning معدل، حدد معدل التعلم الأولي لمحسن التدرج العشوائي.
بالنسبة إلى عدد عصور التدريب، اكتب قيمة تشير إلى عدد المرات التي يجب أن تتكرر فيها الخوارزمية من خلال الأمثلة. بالنسبة لمجموعات البيانات التي تحتوي على عدد صغير من الأمثلة ، يجب أن يكون هذا العدد كبيرا للوصول إلى التقارب.
تطبيع الميزات: إذا قمت بالفعل بتطبيع البيانات الرقمية المستخدمة لتدريب النموذج، فيمكنك إلغاء تحديد هذا الخيار. بشكل افتراضي، يقوم المكون بتطبيع كافة المدخلات الرقمية إلى نطاق يتراوح بين 0 و1.
ملاحظة
تذكر تطبيق نفس طريقة التطبيع على البيانات الجديدة المستخدمة للتسجيل.
في وزن تنظيم L2، اكتب القيمة المراد استخدامها كوزن لتنظيم L2. نوصي باستخدام قيمة غير صفرية لتجنب الإفراط في التركيب.
لمعرفة المزيد حول كيفية تأثير التنظيم على تركيب النموذج، راجع هذه المقالة: L1 و L2 Regularization for التعلم الآلي
حدد الخيار، تقليل معدل التعلم، إذا كنت تريد أن ينخفض معدل التعلم مع تقدم التكرارات.
بالنسبة لبذور الأرقام العشوائية، يمكنك اختياريا كتابة قيمة لزرع مولد الأرقام العشوائية الذي يستخدمه النموذج. يعد استخدام قيمة البذور مفيدا إذا كنت ترغب في الحفاظ على نفس النتائج عبر عمليات تشغيل مختلفة لنفس خط الأنابيب.
تدريب النموذج:
إذا قمت بتعيين إنشاء وضع مدرب إلى معلمة واحدة، فقم بتوصيل مجموعة بيانات ذات علامات تمييز بمكون نموذج القطار .
إذا قمت بتعيين إنشاء وضع المدرب إلى نطاق المعلمات، فقم بتوصيل مجموعة بيانات ذات علامات وتدريب النموذج باستخدام معلمات Tune Model Hyperمعلمات.
ملاحظة
إذا قمت بتمرير نطاق معلمات إلى نموذج القطار، فإنه يستخدم فقط القيمة الافتراضية في قائمة معلمات واحدة.
إذا قمت بتمرير مجموعة واحدة من قيم المعلمات إلى مكون Tune Model Hyperparameters ، فعندما تتوقع نطاقا من الإعدادات لكل معلمة ، فإنها تتجاهل القيم وتستخدم القيم الافتراضية للمتعلم.
إذا قمت بتحديد خيار نطاق المعلمات وأدخلت قيمة واحدة لأي معلمة، استخدام هذه القيمة المفردة التي حددتها خلال عملية المسح، حتى إذا تغيرت المعلمات الأخرى عبر نطاق من القيم.
إرسال المسار.
نتائج النسب المتدرج عبر الإنترنت
بعد اكتمال التدريب:
- لإجراء التنبؤات، قم بتوصيل النموذج المدرب بمكون نموذج النتيجة ، جنبا إلى جنب مع بيانات الإدخال الجديدة.
الخطوات التالية
راجع مجموعة المكونات المتوفرة ل Azure التعلم الآلي.