Two-Class مكون الانحدار اللوجستي

توضح هذه المقالة مكونا في Azure التعلم الآلي مصمم.

استخدم هذا المكون لإنشاء نموذج انحدار لوجستي يمكن استخدامه للتنبؤ بنتيجتين (واثنتين فقط).

الانحدار اللوجستي هو تقنية إحصائية معروفة تستخدم لنمذجة أنواع كثيرة من المشاكل. هذه الخوارزمية هي طريقة تعلم خاضعة للإشراف . لذلك، يجب توفير مجموعة بيانات تحتوي بالفعل على النتائج لتدريب النموذج.

حول الانحدار اللوجستي

الانحدار اللوجستي هو طريقة معروفة في الإحصاءات تستخدم للتنبؤ باحتمال حدوث نتيجة ، وتحظى بشعبية خاصة في مهام التصنيف. تتنبأ الخوارزمية باحتمال حدوث حدث ما عن طريق ملاءمة البيانات مع وظيفة لوجستية.

في هذا المكون ، يتم تحسين خوارزمية التصنيف للمتغيرات الثنائية أو الثنائية. إذا كنت بحاجة إلى تصنيف نتائج متعددة، فاستخدم مكون الانحدار اللوجستي متعدد الفئات .

كيفية التهيئة

لتدريب هذا النموذج، يجب توفير مجموعة بيانات تحتوي على تسمية أو عمود فئة. نظرا لأن هذا المكون مخصص للمشكلات المكونة من فئتين، يجب أن يحتوي عمود التسمية أو الفئة على قيمتين بالضبط.

على سبيل المثال، قد يكون عمود التسمية [Voted] مع قيم محتملة ل "نعم" أو "لا". أو قد يكون [مخاطر الائتمان]، مع قيم محتملة من "عالية" أو "منخفضة".

  1. أضف مكون الانحدار اللوجستي من فئتين إلى خط الأنابيب الخاص بك.

  2. حدد الطريقة التي تريد تدريب النموذج بها، عن طريق تعيين الخيار إنشاء وضع مدرب .

    • معلمة واحدة: إذا كنت تعرف الطريقة التي تريد بها تكوين النموذج، فيمكنك توفير مجموعة محددة من القيم كوسيطات.

    • نطاق المعلمات: إذا لم تكن متأكدا من أفضل المعلمات ، فيمكنك العثور على المعلمات المثلى باستخدام مكون Tune Model Hyperparameters . يمكنك توفير نطاق معين من القيم، ويكرر المدرب على مجموعات متعددة من الإعدادات لتحديد مجموعة القيم التي تنتج أفضل نتيجة.

  3. بالنسبة إلى تفاوت التحسين، حدد قيمة عتبة لاستخدامها عند تحسين النموذج. إذا كان التحسن بين التكرارات أقل من العتبة المحددة ، اعتبار الخوارزمية قد تقاربت على حل ، ويتوقف التدريب.

  4. بالنسبة لوزن تنظيم L1 ووزن تنظيم L2، اكتب قيمة لاستخدامها في معلمات التنظيم L1 وL2. يوصى باستخدام قيمة غير صفرية لكليهما.
    التنظيم هو طريقة لمنع الإفراط في التركيب عن طريق معاقبة النماذج ذات قيم المعامل المتطرفة. يعمل التنظيم عن طريق إضافة العقوبة المرتبطة بقيم المعامل إلى خطأ الفرضية. وبالتالي ، فإن النموذج الدقيق ذو القيم القصوى للمعامل المتطرف سيتم معاقبته أكثر ، ولكن النموذج الأقل دقة مع قيم أكثر تحفظا سيعاقب عليه أقل.

    تنظيم L1 و L2 له تأثيرات واستخدامات مختلفة.

    • يمكن تطبيق L1 على النماذج المتناثرة ، وهو أمر مفيد عند العمل مع البيانات عالية الأبعاد.

    • في المقابل ، فإن تنظيم L2 هو الأفضل للبيانات غير المتناثرة.

    تدعم هذه الخوارزمية مزيجا خطيا من قيم تنظيم L1 و L2: أي إذا x = L1 و y = L2، ثم ax + by = c تحدد المدى الخطي لمصطلحات التنظيم.

    ملاحظة

    هل تريد معرفة المزيد عن تنظيم L1 و L2؟ تقدم المقالة التالية مناقشة حول كيفية اختلاف تنظيم L1 و L2 وكيفية تأثيرهما على تركيب النموذج ، مع عينات التعليمات البرمجية للانحدار اللوجستي ونماذج الشبكة العصبية: L1 و L2 تنظيم التعلم الآلي

    تم ابتكار مجموعات خطية مختلفة من مصطلحات L1 و L2 لنماذج الانحدار اللوجستي: على سبيل المثال ، تنظيم صافي مرن. نقترح عليك الرجوع إلى هذه المجموعات لتحديد تركيبة خطية فعالة في النموذج الخاص بك.

  5. بالنسبة لحجم الذاكرة ل L-BFGS، حدد مقدار الذاكرة المطلوب استخدامها لتحسين L-BFGS.

    L-BFGS تعني "الذاكرة المحدودة Broyden-Fletcher-Goldfarb-Shanno". إنها خوارزمية تحسين شائعة في تقدير المعلمات. تشير هذه المعلمة إلى عدد المواضع والتدرجات السابقة التي يجب تخزينها لحساب الخطوة التالية.

    تحد معلمة التحسين هذه من مقدار الذاكرة المستخدمة لحساب الخطوة والاتجاه التاليين. عند تحديد ذاكرة أقل، يكون التدريب أسرع ولكنه أقل دقة.

  6. بالنسبة لبذرة الأرقام العشوائية، اكتب قيمة عدد صحيح. يعد تحديد قيمة البذور أمرا مهما إذا كنت تريد أن تكون النتائج قابلة للتكرار عبر عمليات تشغيل متعددة من نفس خط الأنابيب.

  7. أضف مجموعة بيانات مصنفة إلى خط الأنابيب، وقم بتدريب النموذج:

    • إذا قمت بتعيين إنشاء وضع مدرب إلى معلمة واحدة، فقم بتوصيل مجموعة بيانات ذات علامات تمييز بمكون نموذج القطار .

    • إذا قمت بتعيين إنشاء وضع المدرب إلى نطاق المعلمات، فقم بتوصيل مجموعة بيانات ذات علامات وتدريب النموذج باستخدام معلمات Tune Model Hyperمعلمات.

    ملاحظة

    إذا قمت بتمرير نطاق معلمات إلى نموذج القطار، فإنه يستخدم فقط القيمة الافتراضية في قائمة معلمات واحدة.

    إذا قمت بتمرير مجموعة واحدة من قيم المعلمات إلى مكون Tune Model Hyperparameters ، فعندما تتوقع نطاقا من الإعدادات لكل معلمة ، فإنها تتجاهل القيم وتستخدم القيم الافتراضية للمتعلم.

    إذا قمت بتحديد خيار نطاق المعلمات وأدخلت قيمة واحدة لأي معلمة، استخدام هذه القيمة المفردة التي حددتها خلال عملية المسح، حتى إذا تغيرت المعلمات الأخرى عبر نطاق من القيم.

  8. إرسال المسار.

النتائج

بعد اكتمال التدريب:

  • لإجراء تنبؤات على البيانات الجديدة، استخدم النموذج المدرب والبيانات الجديدة كمدخلات لمكون نموذج النتيجة.

الخطوات التالية

راجع مجموعة المكونات المتوفرة ل Azure التعلم الآلي.