درجة الثقة في الإجابة
عندما تتم مطابقة استعلام مستخدم مع قاعدة معارف، يقوم QnA Maker بإرجاع الإجابات ذات الصلة، إلى جانب درجة الثقة. تشير هذه النتيجة إلى الثقة في أن الإجابة هي المطابقة الصحيحة لاستعلام المستخدم المحدد.
درجة الثقة هي رقم يتراوح بين 0 و 100. من المحتمل أن تكون درجة 100 مطابقة تماما ، في حين أن درجة 0 تعني أنه لم يتم العثور على إجابة مطابقة. كلما ارتفعت النتيجة - زادت الثقة في الإجابة. بالنسبة لاستعلام معين ، قد تكون هناك إجابات متعددة تم إرجاعها. في هذه الحالة ، يتم إرجاع الإجابات بترتيب تقليل درجة الثقة.
في المثال أدناه ، يمكنك رؤية كيان QnA واحد ، مع أسئلة 2.

بالنسبة للمثال أعلاه - يمكنك توقع درجات مثل نطاق نقاط العينة أدناه - لأنواع مختلفة من استعلامات المستخدمين:

يشير الجدول التالي إلى الثقة النموذجية المرتبطة بدرجة معينة.
| قيمة النتيجة | معنى النتيجة | مثال على الاستعلام |
|---|---|---|
| 90 - 100 | تطابق شبه تام بين استعلام المستخدم وسؤال قاعدة المعارف | "لا يتم تحديث تغييراتي في قاعدة المعارف بعد النشر" |
| > 70 | ثقة عالية - عادة ما تكون إجابة جيدة تجيب تماما على استفسار المستخدم | "لقد نشرت قاعدة المعارف الخاصة بي ولكن لم يتم تحديثها" |
| 50 - 70 | ثقة متوسطة - عادة ما تكون إجابة جيدة إلى حد ما يجب أن تجيب على القصد الرئيسي من استعلام المستخدم | "هل يجب علي حفظ تحديثاتي قبل نشر قاعدة المعارف الخاصة بي؟" |
| 30 - 50 | ثقة منخفضة - عادة ما تكون إجابة ذات صلة ، تجيب جزئيا على نية المستخدم | "ماذا يفعل الحفظ والتدريب؟" |
| < 30 | ثقة منخفضة جدا - عادة لا تجيب على استفسار المستخدم ، ولكن لديها بعض الكلمات أو العبارات المتطابقة | "أين يمكنني إضافة مرادفات إلى قاعدة المعارف الخاصة بي" |
| 0 | لا يوجد تطابق ، لذلك لا يتم إرجاع الإجابة. | "كم تبلغ تكلفة الخدمة" |
اختر الحد الأدنى للنقاط
يوضح الجدول أعلاه الدرجات المتوقعة على معظم كيلوبايت. ومع ذلك، نظرا لأن كل قاعدة معارف مختلفة، ولها أنواع مختلفة من الكلمات والنوايا والأهداف، فإننا نوصيك باختبار واختيار العتبة التي تناسبك بشكل أفضل. بشكل افتراضي ، يتم تعيين العتبة إلى 0 ، بحيث يتم إرجاع جميع الإجابات الممكنة. الحد الأدنى الموصى به الذي يجب أن يعمل مع معظم كيلوبايت هو 50.
عند اختيار الحد الأدنى الخاص بك، ضع في اعتبارك التوازن بين الدقة والتغطية، وقم بتعديل الحد الأدنى الخاص بك بناء على متطلباتك.
إذا كانت الدقة (أو الدقة ) أكثر أهمية للسيناريو الخاص بك، فقم بزيادة الحد الأدنى الخاص بك. بهذه الطريقة ، في كل مرة تقوم فيها بإرجاع إجابة ، ستكون حالة أكثر ثقة ، ومن المرجح أن تكون الإجابة التي يبحث عنها المستخدمون. في هذه الحالة ، قد ينتهي بك الأمر إلى ترك المزيد من الأسئلة دون إجابة. على سبيل المثال: إذا جعلت العتبة 70 ، فقد تفوتك بعض الأمثلة الغامضة مثل "ما هو الحفظ والتدريب؟".
إذا كانت التغطية (أو التذكر ) أكثر أهمية - وتريد الإجابة على أكبر عدد ممكن من الأسئلة ، حتى لو كان هناك علاقة جزئية فقط بسؤال المستخدم - فقم بخفض العتبة. هذا يعني أنه قد يكون هناك المزيد من الحالات التي لا تجيب فيها الإجابة على الاستعلام الفعلي للمستخدم ، ولكنها تعطي إجابة أخرى ذات صلة إلى حد ما. على سبيل المثال: إذا حددت الحد الأدنى 30، يمكنك تقديم إجابات لاستفسارات مثل "أين يمكنني تعديل قاعدة المعارف الخاصة بي؟"
ملاحظة
تتضمن الإصدارات الأحدث من QnA Maker تحسينات على منطق تسجيل النقاط، ويمكن أن تؤثر على الحد الأدنى الخاص بك. في أي وقت تقوم فيه بتحديث الخدمة، تأكد من اختبار العتبة وتعديلها إذا لزم الأمر. يمكنك التحقق من إصدار خدمة QnA الخاص بك هنا ، ومعرفة كيفية الحصول على آخر التحديثات هنا.
تعيين عتبة
قم بتعيين درجة العتبة كخاصية لنص JSON لواجهة برمجة تطبيقات GenerateAnswer. هذا يعني أنك قمت بتعيينه لكل مكالمة إلى GenerateAnswer.
من إطار عمل البوت ، قم بتعيين النتيجة كجزء من كائن الخيارات باستخدام C # أو Node.js.
تحسين درجات الثقة
لتحسين درجة الثقة لاستجابة معينة لاستعلام مستخدم، يمكنك إضافة استعلام المستخدم إلى قاعدة معارف كسؤال بديل حول هذه الاستجابة. يمكنك أيضا استخدام تعديلات الكلمات غير الحساسة لحالة الأحرف لإضافة مرادفات إلى الكلمات الرئيسية في قاعدة المعارف.
درجات ثقة مماثلة
عندما يكون للاستجابات المتعددة درجة ثقة مماثلة ، فمن المحتمل أن يكون الاستعلام عاما للغاية وبالتالي يتطابق مع احتمال متساو مع إجابات متعددة. حاول هيكلة Qnas الخاص بك بشكل أفضل بحيث يكون لكل كيان من كيانات QnA نية متميزة.
فروق درجات الثقة بين الاختبار والإنتاج
قد تتغير درجة الثقة في الإجابة بشكل طفيف بين الاختبار والإصدار المنشور من قاعدة معارف حتى لو كان المحتوى هو نفسه. وذلك لأن محتوى الاختبار قاعدة معارف المنشورة موجودان في فهارس بحث Azure المعرفي المختلفة.
يحتوي مؤشر الاختبار على جميع أزواج QnA من قواعد المعرفة الخاصة بك. عند الاستعلام عن فهرس الاختبار، ينطبق الاستعلام على الفهرس بأكمله، ثم تقتصر النتائج على القسم الخاص بهذا قاعدة معارف المحدد. إذا كانت نتائج استعلام الاختبار تؤثر سلبا على قدرتك على التحقق من صحة قاعدة معارف، يمكنك:
- تنظيم قاعدة معارف باستخدام أحد الإجراءات التالية:
- مورد واحد مقيد ب 1 كيلوبايت: تقييد مورد QnA واحد (وفهرس اختبار Azure Cognitive Search الناتج) إلى قاعدة معارف واحد.
- 2 الموارد - 1 للاختبار ، 1 للإنتاج: لديك اثنين من موارد QnA Maker ، باستخدام واحد للاختبار (مع مؤشرات الاختبار والإنتاج الخاصة به) وواحد للمنتج (لديه أيضا مؤشرات الاختبار والإنتاج الخاصة به)
- واستخدم دائما نفس المعلمات، مثل أعلى عند الاستعلام عن كل من الاختبار والإنتاج قاعدة معارف
عند نشر قاعدة معارف، تنتقل محتويات الأسئلة والأجوبة في قاعدة معارف من فهرس الاختبار إلى فهرس إنتاج في بحث Azure. تعرف على كيفية عمل عملية النشر .
إذا كان لديك قاعدة معارف في مناطق مختلفة، فستستخدم كل منطقة فهرس البحث المعرفي Azure الخاص بها. نظرا لاستخدام فهارس مختلفة ، لن تكون الدرجات هي نفسها تماما.
لم يتم العثور على تطابق
عندما لا يتم العثور على تطابق جيد من قبل الترتيب، يتم إرجاع درجة الثقة 0.0 أو "لا شيء" والاستجابة الافتراضية هي "لا يوجد تطابق جيد موجود في قاعدة المعارف". يمكنك تجاوز هذه الاستجابة الافتراضية في رمز الروبوت أو التطبيق الذي يستدعي نقطة النهاية. بدلا من ذلك، يمكنك أيضا تعيين استجابة التجاوز في Azure وهذا يغير الإعداد الافتراضي لجميع قواعد المعرفة المنشورة في خدمة QnA Maker معينة.