استخراج البيانات من نص النطق مع المقاصد والكيانات

يمنحك LUIS القدرة على الحصول على معلومات من أقوال اللغة الطبيعية للمستخدم. يتم استخراج المعلومات بطريقة يمكن استخدامها بواسطة برنامج أو تطبيق أو روبوت دردشة لاتخاذ إجراء. في الأقسام التالية، تعرف على البيانات التي يتم إرجاعها من المقاصد والكيانات مع أمثلة على JSON.

أصعب البيانات التي يجب استخراجها هي بيانات التعلم الآلي لأنها ليست مطابقة نصية دقيقة. يجب أن يكون استخراج البيانات لكيانات التعلم الآلي جزءا من دورة التأليف حتى تكون واثقا من أنك تتلقى البيانات التي تتوقعها.

موقع البيانات واستخدام المفاتيح

يستخرج LUIS البيانات من كلام المستخدم عند نقطة النهاية المنشورة. يحتوي طلب HTTPS (POST أو GET) على النطق بالإضافة إلى بعض التكوينات الاختيارية مثل بيئات التدريج أو الإنتاج.

طلب نقطة نهاية التنبؤ V2

https://westus.api.cognitive.microsoft.com/luis/v2.0/apps/<appID>?subscription-key=<subscription-key>&verbose=true&timezoneOffset=0&q=book 2 tickets to paris

طلب نقطة نهاية التنبؤ V3

https://westus.api.cognitive.microsoft.com/luis/v3.0-preview/apps/<appID>/slots/<slot-type>/predict?subscription-key=<subscription-key>&verbose=true&timezoneOffset=0&query=book 2 tickets to paris

يتوفر appID هذا في صفحة الإعدادات من تطبيق LUIS بالإضافة إلى جزء من عنوان URL (بعد/apps/) عند تحرير تطبيق LUIS هذا. هذا subscription-key هو مفتاح نقطة النهاية المستخدم للاستعلام عن تطبيقك. على الرغم من أنه يمكنك استخدام مفتاح التأليف/البدء المجاني أثناء تعلم LUIS، إلا أنه من المهم تغيير مفتاح نقطة النهاية إلى مفتاح يدعم استخدام LUIS المتوقع. الوحدة timezoneOffset على بعد دقائق.

تحتوي استجابة HTTPS على جميع معلومات النية والكيان التي يمكن ل LUIS تحديدها استنادا إلى النموذج المنشور الحالي إما لنقطة نهاية التدريج أو الإنتاج. تم العثور على عنوان URL لنقطة النهاية على موقع LUIS على الويب، في القسم إدارة ، في صفحة المفاتيح ونقاط النهاية .

بيانات من النوايا

البيانات الأساسية هي اسم نية تسجيل أعلى النقاط. استجابة نقطة النهاية هي:

{
  "query": "when do you open next?",
  "topScoringIntent": {
    "intent": "GetStoreInfo",
    "score": 0.984749258
  },
  "entities": []
}
كائن البيانات نوع البيانات موقع البيانات القيمة
الهدف سلسلة topSscoreingIntent.intent "GetStoreInfo"

إذا اتخذ روبوت الدردشة أو تطبيق الاتصال ب LUIS قرارا استنادا إلى أكثر من درجة نية واحدة، فقم بإرجاع جميع نقاط النوايا.

تعيين معلمة querystring ، verbose=true. استجابة نقطة النهاية هي:

{
  "query": "when do you open next?",
  "topScoringIntent": {
    "intent": "GetStoreInfo",
    "score": 0.984749258
  },
  "intents": [
    {
      "intent": "GetStoreInfo",
      "score": 0.984749258
    },
    {
      "intent": "None",
      "score": 0.2040639
    }
  ],
  "entities": []
}

يتم ترتيب النوايا من أعلى إلى أدنى درجة.

كائن البيانات نوع البيانات موقع البيانات القيمة الدرجة
الهدف سلسلة المقاصد[0].النية "GetStoreInfo" 0.984749258
الهدف سلسلة المقاصد[1].النية "لا شيء" 0.0168218873

إذا أضفت نطاقات تم إنشاؤها مسبقا، يشير اسم القصد إلى النطاق، مثل Utilties أو Communication بالإضافة إلى القصد:

{
  "query": "Turn on the lights next monday at 9am",
  "topScoringIntent": {
    "intent": "Utilities.ShowNext",
    "score": 0.07842206
  },
  "intents": [
    {
      "intent": "Utilities.ShowNext",
      "score": 0.07842206
    },
    {
      "intent": "Communication.StartOver",
      "score": 0.0239675418
    },
    {
      "intent": "None",
      "score": 0.0168218873
    }],
  "entities": []
}
المجال كائن البيانات نوع البيانات موقع البيانات القيمة
الأدوات المساعدة الهدف سلسلة المقاصد[0].النية "المرافق. شو نيكست"
الاتصالات الهدف سلسلة المقاصد[1].النية التواصل. ستارت أوفر"
الهدف سلسلة المقاصد[2].النية "لا شيء"

البيانات الواردة من الكيانات

تحتاج معظم روبوتات الدردشة والتطبيقات إلى أكثر من اسم النية. تأتي هذه البيانات الإضافية الاختيارية من الكيانات المكتشفة في الكلام. يقوم كل نوع من أنواع الكيانات بإرجاع معلومات مختلفة حول المطابقة.

يمكن أن تتطابق كلمة أو عبارة واحدة في النطق مع أكثر من كيان واحد. في هذه الحالة ، يتم إرجاع كل كيان مطابق مع درجاته.

يتم إرجاع جميع الكيانات في صفيف الكيانات للاستجابة من نقطة النهاية

تم إرجاع الكيان المميز

راجع دعم الرمز المميز في LUIS.

بيانات الكيان المعدة مسبقا

يتم اكتشاف الكيانات التي تم إنشاؤها مسبقا استنادا إلى مطابقة تعبير منتظمة باستخدام مشروع Recognizers-Text مفتوح المصدر. يتم إرجاع الكيانات التي تم إنشاؤها مسبقا في صفيف الكيانات واستخدام اسم النوع المسبوق ب builtin::.

قائمة بيانات الكيانات

تمثل كيانات القائمة مجموعة ثابتة ومغلقة من الكلمات ذات الصلة إلى جانب مرادفاتها. لا يكتشف LUIS قيما إضافية لكيان القائمة. استخدم ميزة التوصية للاطلاع على اقتراحات الكلمات الجديدة استنادا إلى القائمة الحالية. إذا كان هناك أكثر من كيان قائمة واحد بنفس القيمة، إرجاع كل كيان في استعلام نقطة النهاية.

بيانات كيان التعبير العادي

يقوم كيان تعبير عادي باستخراج كيان استنادا إلى تعبير عادي توفره.

استخراج الأسماء

الحصول على أسماء من النطق أمر صعب لأن الاسم يمكن أن يكون تقريبا أي مزيج من الحروف والكلمات. بناء على نوع الاسم الذي تستخرجه، لديك العديد من الخيارات. الاقتراحات التالية ليست قواعد ولكن المزيد من الإرشادات.

إضافة كيانات PersonName وGeographyV2 المعدة مسبقا

تتوفر كيانات PersonName و GeographyV2 في بعض الثقافات اللغوية.

أسماء الأشخاص

يمكن أن يكون لاسم الأشخاص تنسيق طفيف اعتمادا على اللغة والثقافة. استخدم إما كيان personName تم إنشاؤه مسبقا أو كيانا بسيطا له أدوار الاسم الأول واسم العائلة.

إذا كنت تستخدم الكيان البسيط، فتأكد من إعطاء أمثلة تستخدم الاسم الأول والأخير في أجزاء مختلفة من اللفظ، وفي الألفاظ ذات الأطوال المختلفة، والألفاظ عبر جميع المقاصد بما في ذلك نية اللاشيء. راجع أقوال نقاط النهاية على أساس منتظم لتسمية أي أسماء لم يتم التنبؤ بها بشكل صحيح.

أسماء الأماكن

يتم تعيين أسماء المواقع الجغرافية ومعرفتها مثل المدن والمقاطعات والولايات والمقاطعات والبلدان/المناطق. استخدم جغرافيا الكيان المبنية مسبقاV2 لاستخراج معلومات الموقع.

أسماء جديدة وناشئة

يجب أن تكون بعض التطبيقات قادرة على العثور على أسماء جديدة وناشئة مثل المنتجات أو الشركات. هذه الأنواع من الأسماء هي أصعب أنواع استخراج البيانات. ابدأ بكيان بسيط وأضف قائمة عبارات. راجع أقوال نقاط النهاية على أساس منتظم لتسمية أي أسماء لم يتم التنبؤ بها بشكل صحيح.

نمط.أي بيانات كيان

Pattern.any هو عنصر نائب متغير الطول يستخدم فقط في نطق قالب النمط لتحديد المكان الذي يبدأ فيه الكيان وينتهي. يجب العثور على الكيان المستخدم في النمط من أجل تطبيق النمط.

تحليل التوجه

إذا تم تكوين تحليل المشاعر أثناء النشر، فإن استجابة LUIS json تتضمن تحليل المشاعر. تعرف على المزيد حول تحليل المشاعر في وثائق خدمة اللغة .

بيانات كيان استخراج العبارة الرئيسية

يقوم كيان استخراج العبارة الرئيسية بإرجاع العبارات الرئيسية في النطق ، التي توفرها خدمة اللغة.

مطابقة البيانات لكيانات متعددة

يقوم LUIS بإرجاع كافة الكيانات المكتشفة في الكلام. نتيجة لذلك ، قد يحتاج روبوت الدردشة إلى اتخاذ قرار بناء على النتائج.

مطابقة البيانات لكيانات قائمة متعددة

إذا كانت كلمة أو عبارة تتطابق مع أكثر من كيان قائمة واحد، يقوم استعلام نقطة النهاية بإرجاع كل كيان قائمة.

بالنسبة للاستعلام when is the best time to go to red rock?، ويحتوي التطبيق على الكلمة red في أكثر من قائمة واحدة، يتعرف LUIS على جميع الكيانات ويقوم بإرجاع صفيف من الكيانات كجزء من استجابة نقطة نهاية JSON.

الخطوات التالية

راجع إضافة كيانات لمعرفة المزيد حول كيفية إضافة كيانات إلى تطبيق LUIS.