تدريب SVD الموصى به
توضح هذه المقالة كيفية استخدام مكون "موصي تدريب SVD" في مصمم Azure التعلم الآلي. استخدم هذا المكون لتدريب نموذج توصية استنادا إلى خوارزمية تحليل القيمة الواحدة (SVD).
يقرأ مكون Train SVD Recommender مجموعة بيانات من الثلاثية لتصنيف عنصر المستخدم. يقوم بإرجاع موصي SVD مدرب. يمكنك بعد ذلك استخدام النموذج المدرب للتنبؤ بالتقييمات أو إنشاء توصيات، من خلال توصيل مكون Score SVD Recommender .
المزيد حول نماذج التوصيات ومقترح SVD
الهدف الرئيسي من نظام التوصية هو التوصية بعنصر واحد أو أكثر لمستخدمي النظام. قد تكون أمثلة العنصر فيلما أو مطعما أو كتابا أو أغنية. قد يكون المستخدم شخصا أو مجموعة من الأشخاص أو كيانا آخر لديه تفضيلات العنصر.
هناك نهجان رئيسيان لأنظمة التوصية:
- يستخدم النهج القائم على المحتوى الميزات لكل من المستخدمين والعناصر. يمكن وصف المستخدمين من خلال خصائص مثل العمر والجنس. يمكن وصف العناصر بواسطة خصائص مثل المؤلف والشركة المصنعة. يمكنك العثور على أمثلة نموذجية لأنظمة التوصية المستندة إلى المحتوى على مواقع التوفيق الاجتماعي.
- تستخدم التصفية التعاونية فقط معرفات المستخدمين والعناصر. يحصل على معلومات ضمنية حول هذه الكيانات من مصفوفة (متفرقة) من التصنيفات التي يقدمها المستخدمون للعناصر. يمكننا التعرف على مستخدم من العناصر التي قام بتقييمها ومن المستخدمين الآخرين الذين قيموا العناصر نفسها.
يستخدم موصي SVD معرفات المستخدمين والعناصر ، ومصفوفة من التقييمات التي يقدمها المستخدمون للعناصر. إنه موصى تعاوني.
لمزيد من المعلومات حول موصي SVD ، راجع الورقة البحثية ذات الصلة: تقنيات معامل المصفوفة لأنظمة التوصية.
كيفية تكوين تدريب SVD الموصى بها
إعداد البيانات
قبل استخدام المكون، يجب أن تكون بيانات الإدخال بالتنسيق الذي يتوقعه نموذج التوصية. مطلوب مجموعة بيانات تدريبية من ثلاثة أضعاف تصنيف عنصر المستخدم.
- يحتوي العمود الأول على معرفات المستخدمين.
- يحتوي العمود الثاني على معرفات العناصر.
- يحتوي العمود الثالث على تصنيف زوج عنصر المستخدم. يجب أن تكون قيم التصنيف من النوع الرقمي.
توضح مجموعة بيانات "تصنيفات الأفلام" في مصمم Azure التعلم الآلي (حدد مجموعات البيانات ثم العينات) التنسيق المتوقع:

من هذه العينة ، يمكنك أن ترى أن مستخدما واحدا قد قيم العديد من الأفلام.
تدريب النموذج
أضف مكون Train SVD Recommender إلى خط الأنابيب الخاص بك في المصمم، وقم بتوصيله ببيانات التدريب.
بالنسبة لعدد العوامل، حدد عدد العوامل التي يجب استخدامها مع الموصي.
يقيس كل عامل مدى ارتباط المستخدم بالعنصر. عدد العوامل هو أيضا أبعاد مساحة العامل الكامن. مع زيادة عدد المستخدمين والعناصر ، من الأفضل تعيين عدد أكبر من العوامل. ولكن إذا كان الرقم كبيرا جدا ، فقد ينخفض الأداء.
يشير عدد تكرارات خوارزمية التوصية إلى عدد المرات التي يجب أن تعالج فيها الخوارزمية بيانات الإدخال. كلما ارتفع هذا الرقم ، كلما كانت التنبؤات أكثر دقة. ومع ذلك ، فإن الرقم الأعلى يعني تدريبا أبطأ. القيمة الافتراضية هي 30.
للحصول على معدل Learning، أدخل رقما بين 0.0 و2.0 يحدد حجم الخطوة للتعلم.
يحدد معدل التعلم حجم الخطوة في كل تكرار. إذا كان حجم الخطوة كبيرا جدا، فقد تتجاوز الحل الأمثل. إذا كان حجم الخطوة صغيرا جدا ، فإن التدريب يستغرق وقتا أطول للعثور على أفضل حل.
إرسال المسار.
النتائج
بعد اكتمال تشغيل خط الأنابيب، لاستخدام النموذج للتسجيل، قم بتوصيل "موصي SVD" ب "موصي SVD للنقاط"، للتنبؤ بقيم أمثلة الإدخال الجديدة.
الخطوات التالية
راجع مجموعة المكونات المتوفرة ل Azure التعلم الآلي.