إرجاع إجابة دلالية في البحث المعرفي في Azure

هام

البحث الدلالي في المعاينة العامة بموجب شروط الاستخدام التكميلية. وهي متوفرة من خلال مدخل Azure ومعاينة واجهة برمجة تطبيقات REST ومجموعات تطوير البرامج التجريبية. هذه الميزة قابلة للفوترة (راجع التوفر والتسعير).

عند استدعاء الترتيب الدلالي والتسميات التوضيحية، يمكنك اختياريا استخراج المحتوى من المستندات المطابقة للأعلى التي "تجيب" على الاستعلام مباشرة. يمكن تضمين إجابة واحدة أو أكثر في الاستجابة، والتي يمكنك بعد ذلك عرضها على صفحة بحث لتحسين تجربة المستخدم لتطبيقك.

في هذه المقالة، تعرف على كيفية طلب إجابة دلالية، وفك حزم الاستجابة، وما هي خصائص المحتوى الأكثر ملاءمة لإنتاج إجابات عالية الجودة.

المتطلبات الأساسية

تنطبق جميع المتطلبات الأساسية التي تنطبق على الاستعلامات الدلالية أيضا على الإجابات ، بما في ذلك طبقة الخدمة والمنطقة.

  • يجب أن يتضمن منطق الاستعلام معلمات الاستعلام الدلالي "queryType = semantic"، بالإضافة إلى معلمة "الإجابات". تتم مناقشة المعلمات المطلوبة في هذه المقالة.

  • يجب التعرف على سلاسل الاستعلام التي أدخلها المستخدم كسؤال (ماذا وأين ومتى وكيف).

  • يجب أن تحتوي مستندات البحث في الفهرس على نص له خصائص إجابة، ويجب أن يكون هذا النص موجودا في أحد الحقول المدرجة في التكوين الدلالي. على سبيل المثال ، بالنظر إلى استعلام "ما هو جدول التجزئة" ، إذا لم يكن أي من الحقول في التكوين الدلالي يحتوي على مقاطع تتضمن "جدول التجزئة هو ..." ، فمن غير المحتمل أن يتم إرجاع إجابة.

ما هي الإجابة الدلالية؟

الإجابة الدلالية هي بنية تحتية لاستجابة استعلام دلالي. وهو يتألف من مقطع حرفي واحد أو أكثر من مستند بحث، صيغ كإجابة على استعلام يشبه السؤال. لإرجاع إجابة، يجب أن توجد عبارات أو جمل في مستند بحث له الخصائص اللغوية للإجابة، ويجب طرح الاستعلام نفسه كسؤال.

يستخدم البحث المعرفي نموذج فهم القراءة الآلية لاختيار أفضل إجابة. ينتج النموذج مجموعة من الإجابات المحتملة من المحتوى المتاح ، وعندما يصل إلى مستوى ثقة عال بما فيه الكفاية ، سيقترح واحدة كإجابة.

يتم إرجاع الإجابات ككائن مستقل من المستوى الأعلى في حمولة استجابة الاستعلام التي يمكنك اختيار عرضها على صفحات البحث، إلى جانب نتائج البحث الجانبية. من الناحية الهيكلية ، إنه عنصر صفيف داخل الاستجابة يتكون من نص ومفتاح مستند ودرجة ثقة.

صياغة بقية الاستعلام عن "الإجابات"

وقد تغير مؤخرا نهج إدراج الحقول بترتيب الأولوية، حيث حل مصطلح "semanticConfiguration" محل "searchFields". إذا كنت تستخدم حاليا searchFields، فقم بتحديث التعليمات البرمجية إلى إصدار واجهة برمجة التطبيقات 2021-04-30-Preview واستخدم "semanticConfiguration" بدلا من ذلك.

لإرجاع إجابة دلالية، يجب أن يحتوي الاستعلام على معلمات "queryType" و"queryLanguage" و"semanticConfiguration" و"إجابات" الدلالية. لا يضمن تحديد هذه المعلمات إجابة، ولكن يجب أن يتضمن الطلب هذه الإجابات حتى تتم معالجة الإجابة.

تعد معلمة "semanticConfiguration" ضرورية لإرجاع إجابة عالية الجودة.

{
    "search": "how do clouds form",
    "queryType": "semantic",
    "queryLanguage": "en-us",
    "semanticConfiguration": "my-semantic-config",
    "answers": "extractive|count-3",
    "captions": "extractive|highlight-true",
    "count": "true"
}
  • يجب ألا تكون سلسلة الاستعلام فارغة ويجب صياغتها كسؤال.

  • يجب تعيين "queryType" إلى "دلالي.

  • يجب أن تكون "queryLanguage" إحدى القيم من قائمة اللغات المدعومة (REST API).

  • يحدد "semanticConfiguration" حقول السلسلة التي توفر الرموز المميزة لنموذج الاستخراج. نفس الحقول التي تنتج تسميات توضيحية تنتج أيضا إجابات. راجع إنشاء تكوين دلالي للحصول على التفاصيل.

  • بالنسبة إلى "الإجابات" ، يكون بناء المعلمة هو "answers": "extractive"، حيث يكون العدد الافتراضي للإجابات التي تم إرجاعها واحدا. يمكنك زيادة عدد الإجابات عن طريق إضافة a count كما هو موضح في المثال أعلاه، بحد أقصى 10. يعتمد ما إذا كنت بحاجة إلى أكثر من إجابة واحدة على تجربة المستخدم لتطبيقك، وكيفية عرض النتائج.

فك "إجابة" من الرد

يتم توفير الإجابات في الصفيف "@search.answers" ، والذي يظهر أولا في استجابة الاستعلام. ستتضمن كل إجابة في الصفيف ما يلي:

  • مفتاح المستند
  • نص أو محتوى الإجابة، بنص عادي أو بتنسيق
  • درجة الثقة

إذا كانت الإجابة غير محددة، فستظهر الاستجابة على النحو التالي: "@search.answers": []. يتبع صفيف الإجابات صفيف القيمة، وهو الاستجابة القياسية في استعلام دلالي.

بالنظر إلى الاستعلام "كيف تتشكل الغيوم" ، يوضح المثال التالي إجابة:

{
    "@search.answers": [
        {
            "key": "4123",
            "text": "Sunlight heats the land all day, warming that moist air and causing it to rise high into the   atmosphere until it cools and condenses into water droplets. Clouds generally form where air is ascending (over land in this case),   but not where it is descending (over the river).",
            "highlights": "Sunlight heats the land all day, warming that moist air and causing it to rise high into the   atmosphere until it cools and condenses into water droplets. Clouds generally form<em> where air is ascending</em> (over land in this case),   but not where it is<em> descending</em> (over the river).",
            "score": 0.94639826
        }
    ],
    "value": [
        {
            "@search.score": 0.5479723,
            "@search.rerankerScore": 1.0321671911515296,
            "@search.captions": [
                {
                    "text": "Like all clouds, it forms when the air reaches its dew point—the temperature at which an air mass is cool enough for its water vapor to condense into liquid droplets. This false-color image shows valley fog, which is common in the Pacific Northwest of North America.",
                    "highlights": "Like all<em> clouds</em>, it<em> forms</em> when the air reaches its dew point—the temperature at    which an air mass is cool enough for its water vapor to condense into liquid droplets. This false-color image shows valley<em> fog</em>, which is common in the Pacific Northwest of North America."
                }
            ],
            "title": "Earth Atmosphere",
            "content": "Fog is essentially a cloud lying on the ground. Like all clouds, it forms when the air reaches its dew point—the temperature at  \n\nwhich an air mass is cool enough for its water vapor to condense into liquid droplets.\n\nThis false-color image shows valley fog, which is common in the Pacific Northwest of North America. On clear winter nights, the \n\nground and overlying air cool off rapidly, especially at high elevations. Cold air is denser than warm air, and it sinks down into the \n\nvalleys. The moist air in the valleys gets chilled to its dew point, and fog forms. If undisturbed by winds, such fog may persist for \n\ndays. The Terra satellite captured this image of foggy valleys northeast of Vancouver in February 2010.\n\n\n",
            "locations": [
                "Pacific Northwest",
                "North America",
                "Vancouver"
            ]
        }
    ]
}

عند تصميم صفحة نتائج بحث تتضمن إجابات، تأكد من التعامل مع الحالات التي لا يتم فيها العثور على إجابات.

ضمن @search.answers:

  • "المفتاح" هو مفتاح المستند أو معرف المطابقة. نظرا لمفتاح مستند، يمكنك استخدام واجهة برمجة تطبيقات مستند البحث لاسترداد أي من أجزاء مستند البحث أو جميعها لتضمينها في صفحة البحث أو صفحة التفاصيل.

  • يوفر "النص" و "النقاط البارزة" محتوى متطابقا ، في كل من النص العادي ومع النقاط البارزة.

    بشكل افتراضي، يتم تصميم الإبرازات على أنها <em>، والتي يمكنك تجاوزها باستخدام معلمات HighlightPreTag و highlightPostTag الموجودة. وكما لوحظ في موضع آخر، فإن مضمون الإجابة هو محتوى حرفي من مستند بحث. يبحث نموذج الاستخراج عن خصائص الإجابة للعثور على المحتوى المناسب، ولكنه لا يؤلف لغة جديدة في الاستجابة.

  • "النتيجة" هي درجة ثقة تعكس قوة الإجابة. إذا كانت هناك إجابات متعددة في الاستجابة، يتم استخدام هذه النتيجة لتحديد الترتيب. يمكن اشتقاق الإجابات العليا والتسميات التوضيحية العلوية من مستندات بحث مختلفة، حيث تنشأ الإجابة العليا من مستند واحد، والتسمية التوضيحية العلوية من أخرى، ولكن بشكل عام سترى نفس المستندات في المواضع العليا داخل كل صفيف.

تتبع الإجابات صفيف " القيمة" ، الذي يتضمن دائما النقاط والتسميات التوضيحية وأي حقول يمكن استردادها افتراضيا. إذا قمت بتحديد معلمة التحديد ، فإن صفيف "القيمة" يقتصر على الحقول التي حددتها. راجع إنشاء استعلام دلالي للحصول على التفاصيل.

تلميحات لإنتاج إجابات عالية الجودة

للحصول على أفضل النتائج، قم بإرجاع الإجابات الدلالية على مجموعة مستندات لها الخصائص التالية:

  • يجب أن يتضمن "التكوين الدلالي" الحقول التي تقدم نصا كافيا من المحتمل العثور على إجابة فيه. يجب إدراج الحقول التي من المرجح أن تحتوي على إجابات أولا في "prioritizedContentFields". يمكن أن يظهر النص الحرفي فقط من المستند كإجابة.

  • يجب ألا تكون سلاسل الاستعلام فارغة (search=*) ويجب أن تحتوي السلسلة على خصائص السؤال، بدلا من البحث عن الكلمات الرئيسية (قائمة متسلسلة من المصطلحات أو العبارات التعسفية). إذا لم تظهر سلسلة الاستعلام كإجابة، تخطي معالجة الإجابة، حتى إذا كان الطلب يحدد الإجابات كمعلمة استعلام.

  • الاستخراج الدلالي والتلخيص لهما حدود على عدد الرموز المميزة لكل مستند يمكن تحليلها في الوقت المناسب. من الناحية العملية ، إذا كان لديك مستندات كبيرة تصل إلى مئات الصفحات ، فحاول تقسيم المحتوى إلى مستندات أصغر أولا.

الخطوات التالية