تسجيل توصية واسعة وعميقة

توضح هذه المقالة كيفية استخدام مكون Score Wide و Deep Recommendation في مصمم Azure التعلم الآلي، لإنشاء تنبؤات استنادا إلى نموذج توصية مدرب، استنادا إلى التعلم العميق الواسع & من Google.

يمكن للموصي الواسع والعميق إنشاء نوعين مختلفين من التنبؤات:

عند إنشاء النوع الأخير من التنبؤات ، يمكنك العمل إما في وضع الإنتاج أو وضع التقييم.

  • يأخذ وضع الإنتاج في الاعتبار جميع المستخدمين أو العناصر، وعادة ما يستخدم في خدمة ويب. يمكنك إنشاء درجات للمستخدمين الجدد، وليس فقط للمستخدمين الذين شوهدوا أثناء التدريب.

  • يعمل وضع التقييم على مجموعة مخفضة من المستخدمين أو العناصر التي يمكن تقييمها، وعادة ما يتم استخدامه أثناء التجريب.

يمكن العثور على مزيد من التفاصيل حول الموصي الواسع والعميق ونظريته الأساسية في الورقة البحثية ذات الصلة: Learning العميق الواسع & لأنظمة التوصية.

كيفية تكوين موصى النقاط الواسعة والعميقة

يدعم هذا المكون أنواعا مختلفة من التوصيات ، لكل منها متطلبات مختلفة. انقر فوق الارتباط الخاص بنوع البيانات المتوفرة لديك ونوع التوصية التي تريد إنشاؤها.

توقع التقييمات

عندما تتنبأ بالتقييمات ، يحسب النموذج كيفية تفاعل مستخدم معين مع عنصر معين ، بالنظر إلى بيانات التدريب. لذلك، يجب أن توفر بيانات الإدخال لتسجيل النقاط كلا من المستخدم والعنصر المطلوب تقييمه.

  1. أضف نموذج توصية Wide & Deep مدربا إلى تجربتك، وقم بتوصيله بنموذج التوصية الواسعة والعميقة المدربة. يجب إنشاء النموذج باستخدام " الموصى بالقطار الواسع" و"العميق".

  2. نوع تنبؤ الموصي: حدد توقع التصنيف. لا توجد معلمات أخرى مطلوبة.

  3. أضف البيانات التي ترغب في إجراء تنبؤات لها، وقم بتوصيلها ب Dataset للتسجيل.

    للتنبؤ بالتصنيفات، يجب أن تحتوي مجموعة بيانات الإدخال على أزواج عناصر المستخدم.

    يمكن أن تحتوي مجموعة البيانات على عمود ثالث اختياري من التقييمات لزوج عناصر المستخدم في العمودين الأول والثاني، ولكن سيتم تجاهل العمود الثالث أثناء التنبؤ.

  4. (اختياري). إذا كان لديك مجموعة بيانات من ميزات المستخدم، فقم بتوصيلها بميزات المستخدم.

    يجب أن تحتوي مجموعة بيانات ميزات المستخدم على معرف المستخدم في العمود الأول. يجب أن تحتوي الأعمدة المتبقية على قيم تميز المستخدمين ، مثل جنسهم وتفضيلاتهم وموقعهم وما إلى ذلك.

    يتم تجاهل ميزات المستخدمين الذين قاموا بتصنيف العناصر في مجموعة بيانات التدريب بواسطة Score Wide و Deep Recommender ، لأنه تم تعلمها بالفعل أثناء التدريب. لذلك، قم بتصفية مجموعة البيانات الخاصة بك مقدما لتضمين المستخدمين الذين يبدأون التشغيل البارد فقط، أو المستخدمين الذين لم يقوموا بتقييم أي عناصر.

    تحذير

    إذا تم تدريب النموذج بدون استخدام ميزات المستخدم، فلا يمكنك تقديم ميزات المستخدم أثناء التسجيل.

  5. إذا كان لديك مجموعة بيانات من ميزات العنصر، فيمكنك توصيلها بميزات العنصر.

    يجب أن تحتوي مجموعة بيانات ميزات العنصر على معرف عنصر في العمود الأول. يجب أن تحتوي الأعمدة المتبقية على قيم تميز العناصر.

    يتم تجاهل ميزات العناصر المصنفة في مجموعة بيانات التدريب بواسطة Score Wide و Deep Recommendation كما تم تعلمها بالفعل أثناء التدريب. لذلك، قم بتقييد مجموعة بيانات تسجيل النقاط الخاصة بك إلى عناصر البدء البارد، أو العناصر التي لم يتم تقييمها من قبل أي مستخدمين.

    تحذير

    إذا تم تدريب النموذج بدون استخدام ميزات العنصر، فلا يمكنك إدخال ميزات العنصر أثناء تسجيل النقاط.

  6. شغِّل التجربة.

نتائج تنبؤات التقييم

تحتوي مجموعة بيانات المخرجات على ثلاثة أعمدة، تحتوي على المستخدم والعنصر والتصنيف المتوقع لكل مستخدم إدخال وعنصر.

بالإضافة إلى ذلك، يتم تطبيق التغييرات التالية أثناء التسجيل:

  • بالنسبة لعمود ميزة مستخدم رقمي أو عنصر، يتم استبدال القيم المفقودة تلقائيا بمتوسط قيم مجموعة التدريب غير المفقودة. بالنسبة للميزة الفئوية، يتم استبدال القيم المفقودة بنفس القيمة الفئوية بخلاف أي قيم محتملة لهذه الميزة.
  • لا يتم تطبيق أي ترجمة على قيم المعالم للحفاظ على تباينها.

يوصي العناصر

للتوصية بالعناصر للمستخدمين، يمكنك توفير قائمة بالمستخدمين والعناصر كمدخلات. من هذه البيانات ، يستخدم النموذج معرفته حول العناصر والمستخدمين الحاليين لإنشاء قائمة بالعناصر ذات الجاذبية المحتملة لكل مستخدم. يمكنك تخصيص عدد التوصيات التي تم إرجاعها، وتعيين حد أقصى لعدد التوصيات السابقة المطلوبة لإنشاء توصية.

  1. أضف نموذج توصية واسعة وعميقة مدربة إلى تجربتك، وقم بتوصيله بنموذج التوصية الواسعة والعميقة المدربة. يجب إنشاء النموذج باستخدام " الموصى بالقطار الواسع" و"العميق".

  2. للتوصية بعناصر لقائمة معينة من المستخدمين، قم بتعيين نوع تنبؤ الموصى به إلى توصية العنصر.

  3. تحديد العنصر الموصى به: حدد ما إذا كنت تستخدم مكون تسجيل النقاط في الإنتاج أو لتقييم النموذج، عن طريق اختيار إحدى القيم التالية:

    • من العناصر المقدرة (لتقييم النموذج): حدد هذا الخيار إذا كنت تقوم بتطوير نموذج أو اختباره. يتيح هذا الخيار وضع التقييم، ويقدم المكون توصيات فقط من تلك العناصر الموجودة في مجموعة بيانات الإدخال التي تم تقييمها.
    • من كافة العناصر: حدد هذا الخيار إذا كنت تقوم بإعداد تجربة لاستخدامها في خدمة ويب أو إنتاج. يتيح هذا الخيار وضع الإنتاج، ويقدم المكون توصيات من جميع العناصر التي شوهدت أثناء التدريب.
    • من العناصر غير المصنفة (لاقتراح عناصر جديدة للمستخدمين): حدد هذا الخيار إذا كنت تريد أن يقدم المكون توصيات فقط من تلك العناصر الموجودة في مجموعة بيانات التدريب التي لم يتم تقييمها.
  4. أضف مجموعة البيانات التي تريد إجراء تنبؤات لها، وقم بتوصيلها بمجموعة البيانات للتسجيل.

    • إذا اخترت الخيار، من كل العناصر، فيجب أن تتكون مجموعة بيانات الإدخال من عمود واحد فقط، يحتوي على معرفات المستخدمين التي يجب تقديم توصيات بشأنها.

      يمكن أن تتضمن مجموعة البيانات عمودين إضافيين من معرفات العناصر وتصنيفاتها، ولكن يتم تجاهل هذين العمودين.

    • إذا اخترت الخيار، من العناصر المقدرة (لتقييم النموذج)، فيجب أن تتكون مجموعة بيانات الإدخال من أزواج عناصر المستخدم. يجب أن يحتوي العمود الأول على معرف المستخدم . يجب أن يحتوي العمود الثاني على معرفات العناصر المقابلة.

      يمكن أن تتضمن مجموعة البيانات عمودا ثالثا من تقييمات عنصر المستخدم، ولكن يتم تجاهل هذا العمود.

    • بالنسبة إلى "من العناصر غير المصنفة" (لاقتراح عناصر جديدة للمستخدمين)، يجب أن تتكون مجموعة بيانات الإدخال من أزواج عناصر المستخدم. يجب أن يحتوي العمود الأول على معرف المستخدم. يجب أن يحتوي العمود الثاني على معرفات العناصر المقابلة.

      يمكن أن تتضمن مجموعة البيانات عمودا ثالثا من تقييمات عنصر المستخدم، ولكن يتم تجاهل هذا العمود.

  5. (اختياري). إذا كان لديك مجموعة بيانات من ميزات المستخدم، فقم بتوصيلها بميزات المستخدم.

    يجب أن يحتوي العمود الأول في مجموعة بيانات ميزات المستخدم على معرف المستخدم. يجب أن تحتوي الأعمدة المتبقية على قيم تميز المستخدم ، مثل جنسه وتفضيلاته وموقعه وما إلى ذلك.

    يتم تجاهل ميزات المستخدمين الذين قاموا بتصنيف العناصر بواسطة Score Wide و Deep Recommender ، لأن هذه الميزات قد تم تعلمها بالفعل أثناء التدريب. لذلك، يمكنك تصفية مجموعة البيانات الخاصة بك مقدما لتشمل فقط المستخدمين الذين يبدأون التشغيل على البارد أو المستخدمين الذين لم يقوموا بتقييم أي عناصر.

    تحذير

    إذا تم تدريب النموذج بدون استخدام ميزات المستخدم، فلا يمكنك استخدام تطبيق الميزات أثناء التسجيل.

  6. (اختياري) إذا كان لديك مجموعة بيانات من ميزات العنصر، فيمكنك توصيلها بميزات العنصر.

    يجب أن يحتوي العمود الأول في مجموعة بيانات ميزات العنصر على معرف العنصر. يجب أن تحتوي الأعمدة المتبقية على قيم تميز العناصر.

    يتم تجاهل ميزات العناصر المصنفة بواسطة Score Wide و Deep Recommender ، لأن هذه الميزات قد تم تعلمها بالفعل أثناء التدريب. لذلك، يمكنك تقييد مجموعة بيانات تسجيل النقاط الخاصة بك إلى عناصر البدء البارد، أو العناصر التي لم يتم تقييمها من قبل أي مستخدمين.

    تحذير

    إذا تم تدريب النموذج بدون استخدام ميزات العنصر، فلا تستخدم ميزات العنصر عند التسجيل.

  7. الحد الأقصى لعدد العناصر التي يجب التوصية بها للمستخدم: اكتب عدد العناصر المطلوب إرجاعها لكل مستخدم. بشكل افتراضي، يوصى باستخدام 5 عناصر.

  8. الحد الأدنى لحجم تجمع التوصيات لكل مستخدم: اكتب قيمة تشير إلى عدد التوصيات السابقة المطلوبة. بشكل افتراضي، يتم تعيين هذه المعلمة إلى 2، مما يعني أنه يجب أن يكون العنصر قد تمت التوصية به من قبل اثنين على الأقل من المستخدمين الآخرين.

    يجب استخدام هذا الخيار فقط إذا كنت تسجل في وضع التقييم. لا يتوفر الخيار إذا قمت بتحديد من كل العناصر أو من العناصر غير المصنفة (لاقتراح عناصر جديدة للمستخدمين).

  9. بالنسبة إلى "من العناصر غير المصنفة" (لاقتراح عناصر جديدة للمستخدمين)، استخدم منفذ الإدخال الثالث، المسمى " بيانات التدريب"، لإزالة العناصر التي تم تصنيفها بالفعل من نتائج التنبؤ.

    لتطبيق عامل التصفية هذا، قم بتوصيل مجموعة بيانات التدريب الأصلية بمنفذ الإدخال.

  10. شغِّل التجربة.

نتائج التوصية بالبند

تسرد مجموعة البيانات المسجلة التي تم إرجاعها بواسطة Score Wide و Deep Recommendation العناصر الموصى بها لكل مستخدم.

  • يحتوي العمود الأول على معرفات المستخدم.
  • يتم إنشاء عدد من الأعمدة الإضافية، استنادا إلى القيمة التي قمت بتعيينها للحد الأقصى لعدد العناصر التي تريد التوصية بها للمستخدم. يحتوي كل عمود على عنصر موصى به (حسب المعرف). يتم ترتيب التوصيات حسب تقارب المستخدم مع العنصر ، مع وضع العنصر ذي التقارب الأعلى في العمود ، العنصر 1.

ملاحظات فنية

يحتوي هذا القسم على إجابات لبعض الأسئلة الشائعة حول استخدام الموصى العميق الواسع & لإنشاء تنبؤات.

المستخدمون المبتدئون والتوصيات

عادة، لإنشاء توصيات، يتطلب مكون Score Wide و Deep Recommendation نفس المدخلات التي استخدمتها عند تدريب النموذج، بما في ذلك معرف المستخدم. وذلك لأن الخوارزمية تحتاج إلى معرفة ما إذا كانت قد تعلمت شيئا عن هذا المستخدم أثناء التدريب.

ومع ذلك ، بالنسبة للمستخدمين الجدد ، قد لا يكون لديك معرف مستخدم ، فقط بعض ميزات المستخدم مثل العمر والجنس وما إلى ذلك.

لا يزال بإمكانك إنشاء توصيات للمستخدمين الجدد على نظامك، من خلال التعامل معهم كمستخدمين يبدأون التشغيل البارد. بالنسبة لهؤلاء المستخدمين ، لا تستخدم خوارزمية التوصية السجل السابق أو التقييمات السابقة ، فقط ميزات المستخدم.

لأغراض التنبؤ، يتم تعريف مستخدم البدء البارد على أنه مستخدم لديه معرف لم يتم استخدامه للتدريب. للتأكد من أن المعرفات لا تتطابق مع المعرفات المستخدمة في التدريب، يمكنك إنشاء معرفات جديدة. على سبيل المثال، يمكنك إنشاء معرفات عشوائية ضمن نطاق محدد، أو تخصيص سلسلة من المعرفات مسبقا للمستخدمين الذين يبدأون العمل على البارد.

ومع ذلك ، إذا لم يكن لديك أي بيانات تصفية تعاونية ، مثل متجه ميزات المستخدم ، فمن الأفضل استخدام متعلم تصنيف أو انحدار.

استخدام الإنتاج للتوصية الواسعة والعميقة

إذا كنت قد جربت الموصي العريض والعميق ثم نقلت النموذج إلى الإنتاج، فكن على دراية بهذه الاختلافات الرئيسية عند استخدام الموصى به في وضع التقييم وفي وضع الإنتاج:

  • يتطلب التقييم ، بحكم تعريفه ، تنبؤات يمكن التحقق منها مقابل الحقيقة الأرضية في مجموعة اختبارات. لذلك، عند تقييم الموصي، يجب أن يتنبأ فقط بالعناصر التي تم تصنيفها في مجموعة الاختبار. هذا يقيد بالضرورة القيم المحتملة التي يتم التنبؤ بها.

    ومع ذلك، عند تشغيل النموذج، عادة ما تقوم بتغيير وضع التنبؤ لتقديم توصيات استنادا إلى جميع العناصر الممكنة، من أجل الحصول على أفضل التنبؤات. بالنسبة للعديد من هذه التنبؤات ، لا توجد حقيقة أرضية مقابلة ، لذلك لا يمكن التحقق من دقة التوصية بنفس الطريقة كما هو الحال أثناء التجريب.

  • إذا لم تقم بتوفير معرف مستخدم في الإنتاج، ولم تقدم سوى متجه ميزة، فقد تحصل كرد على قائمة بجميع التوصيات لجميع المستخدمين المحتملين. تأكد من توفير معرف مستخدم.

    للحد من عدد التوصيات التي يتم إرجاعها، يمكنك أيضا تحديد الحد الأقصى لعدد العناصر التي يتم إرجاعها لكل مستخدم.

الخطوات التالية

راجع مجموعة المكونات المتوفرة في Azure التعلم الآلي.