التحسين التلقائي للتخصيص (معاينة)
مقدمة
يوفر لك التحسين التلقائي ل Personalizer الجهد اليدوي في الحفاظ على حلقة Personalizer في أفضل أداء للتعلم الآلي ، من خلال البحث تلقائيا عن Learning الإعدادات المحسنة المستخدمة لتدريب نماذجك وتطبيقها. لدى Personalizer معايير صارمة لتطبيق Learning الإعدادات جديدة لضمان عدم احتمال أن تؤدي التحسينات إلى خسارة في المكافآت.
التحسين التلقائي للتخصيص موجود في المعاينة العامة وستتغير الميزات والأساليب والعمليات بناء على تعليقات المستخدمين.
متى تستخدم التحسين التلقائي
في معظم الحالات ، يكون الخيار الأفضل هو تشغيل التحسين التلقائي. التحسين التلقائي قيد التشغيل الافتراضي لحلقات Personalizer الجديدة.
قد يساعد التحسين التلقائي في الحالات التالية:
- يمكنك إنشاء تطبيقات يستخدمها العديد من المستأجرين ، ويحصل كل منهم على حلقة (حلقات) Personalizer الخاصة بهم ؛ على سبيل المثال، إذا كنت تستضيف مواقع متعددة للتجارة الإلكترونية. يتيح لك التحسين التلقائي تجنب الجهد اليدوي الذي تحتاجه لضبط إعدادات التعلم لأعداد كبيرة من حلقات Personalizer.
- لقد قمت بنشر Personalizer وتحققت من أنه يعمل بشكل جيد ، ويحصل على مكافآت جيدة ، وتأكدت من عدم وجود أخطاء أو مشاكل في ميزاتك.
ملاحظة
سيقوم التحسين التلقائي بالكتابة فوق Learning الإعدادات Personalizer بشكل دوري. إذا كانت حالة الاستخدام أو مجال عملك يتطلب مراجعة النماذج والإعدادات وأرشفتها، أو إذا كنت بحاجة إلى نسخ احتياطية من الإعدادات السابقة، فيمكنك استخدام واجهة برمجة تطبيقات Personalizer لاسترداد Learning الإعدادات، أو تنزيلها عبر مدخل Azure.
كيفية تمكين وتعطيل التحسين التلقائي
لتمكين التحسين التلقائي، استخدم مفتاح التبديل في الشفرة النصلية "الطراز Learning الإعدادات" في مدخل Azure.
بدلا من ذلك، يمكنك تنشيط التحسين التلقائي باستخدام واجهة برمجة تطبيقات Personalizer /configurations/service .
لتعطيل التحسين التلقائي، أوقف تشغيل مفتاح التبديل.
تقارير التحسين التلقائي
في شفرة الطراز وشفرة Learning الإعدادات ، يمكنك رؤية محفوظات عمليات التشغيل التحسين التلقائي والإجراءات المتخذة على كل منها.
ويبين الجدول ما يلي:
- عند حدوث تشغيل التحسين التلقائي،
- ما هي نافذة البيانات التي تم تضمينها ،
- ما هو أداء المكافأة عبر الإنترنت ، وخط الأساس ، وأفضل Learning الإعدادات ،
- الإجراءات المتخذة: إذا تم تحديث Learning الإعدادات أم لا.
يتم عرض أداء المكافأة لإعدادات التعلم المختلفة في كل صف من صفوف محفوظات التحسين التلقائي بالأرقام المطلقة، وكنسب مئوية بالنسبة إلى الأداء الأساسي.
مثال: إذا قدر متوسط المكافأة الأساسية ب 0.20، وكان سلوك Personalizer عبر الإنترنت يحقق 0.30، عرضها بنسبة 100٪ و150٪ على التوالي. إذا وجد التحسين التلقائي إعدادات تعلم قادرة على تحقيق متوسط مكافأة 0.40 ، عرضها على أنها 200٪ (0.40 هي 200٪ من 0.20). على افتراض أن هوامش الثقة تسمح بذلك ، سيتم تطبيق الإعدادات الجديدة ، ثم ستدفع هذه الإعدادات Personalizer كإعدادات عبر الإنترنت حتى التشغيل التالي.
يتم الاحتفاظ بمحفوظات تصل إلى 24 عملية تشغيل "التحسين التلقائي" السابقة لتحليلك. يمكنك البحث عن مزيد من التفاصيل حول تلك التقييمات والتقارير غير المتصلة بالإنترنت لكل منها. كما تحتوي التقارير على أي Learning الإعدادات موجودة في هذا السجل، والتي يمكنك العثور عليها وتنزيلها أو تطبيقها.
كيف تعمل هذه الميزة
تقوم Personalizer باستمرار بتدريب النماذج الذكاء الاصطناعي التي تستخدمها بناء على المكافآت. يتم هذا التدريب بعد بعض Learning الإعدادات ، والتي تحتوي على معلمات فائقة وقيم أخرى تستخدم في عملية التدريب. يمكن "ضبط" إعدادات التعلم هذه على مثيل Personalizer المحدد الخاص بك.
لدى Personalizer أيضا القدرة على إجراء تقييمات غير متصلة بالإنترنت. تنظر التقييمات غير المتصلة بالإنترنت إلى البيانات السابقة ، ويمكن أن تنتج تقديرا إحصائيا لمتوسط المكافأة التي كان يمكن أن تحققها خوارزميات ونماذج مختلفة من Personalizer. خلال هذه العملية ، سيبحث Personalizer أيضا عن Learning الإعدادات أفضل ، ويقدر أدائهم (عدد المكافآت التي كانوا سيحصلون عليها) خلال تلك الفترة الزمنية الماضية.
التحسين التلقائي للتردد
سيتم تشغيل التحسين التلقائي بشكل دوري ، وسيقوم بإجراء التحسين التلقائي استنادا إلى البيانات السابقة
- إذا أرسل تطبيقك إلى Personalizer أكثر من 20 ميغابايت تقريبا من البيانات في الأسبوعين الماضيين، فسيستخدم آخر أسبوعين من البيانات.
- إذا أرسل تطبيقك أقل من هذا المبلغ، فسيضيف Personalizer بيانات من الأيام السابقة حتى تتوفر بيانات كافية لتحسينها، أو تصل إلى أقرب البيانات المخزنة (حتى عدد أيام الاحتفاظ بالبيانات).
يتم تحديد الأوقات والأيام الدقيقة التي يتم فيها تشغيل التحسين التلقائي بواسطة خدمة Personalizer ، وسوف تتقلب بمرور الوقت.
معايير تحديث إعدادات التعلم
يستخدم Personalizer تقديرات المكافآت هذه لتحديد ما إذا كان سيتم تغيير Learning الإعدادات الحالي للآخرين. كل تقدير هو منحنى توزيع ، مع حدود ثقة أعلى وأسفل 95٪. لن يطبق Personalizer Learning الإعدادات الجديدة إلا إذا:
- أظهروا متوسط مكافآت أعلى في فترة التقييم ، و
- لديهم حد أدنى من فترة الثقة 95٪ ، وهذا أعلى من الحد الأدنى لفترة الثقة 95٪ Learning الإعدادات عبر الإنترنت. تتم إدارة هذه المعايير لتحقيق أقصى قدر من تحسين المكافآت ، مع محاولة القضاء على احتمال فقدان المكافآت المستقبلية بواسطة Personalizer وتستمد من الأبحاث في خوارزميات Seldonian وسلامة الذكاء الاصطناعي.
قيود التحسين التلقائي
يعتمد التحسين التلقائي للتخصيص على تقييم الفترة الماضية لتقدير الأداء في المستقبل. من الممكن أنه بسبب العوامل الخارجية في العالم وتطبيقك ومستخدميك ، فإن هذه التقديرات والتنبؤات حول نماذج Personalizer التي تم إجراؤها خلال الفترة الماضية لا تمثل المستقبل.
معاينة التحسين التلقائي غير متوفرة لحلقات Personalizer التي مكنت وظيفة معاينة واجهة برمجة تطبيقات التخصيص متعدد الفتحات.