التعبيرات

هام

سيتم إيقاف LUIS في 1 أكتوبر 2025 وبدءا من 1 أبريل 2023، لن تتمكن من إنشاء موارد LUIS جديدة. نوصي بترحيل تطبيقات LUIS الخاصة بك إلى فهم لغة المحادثة للاستفادة من دعم المنتج المستمر والقدرات متعددة اللغات.

تعتبر التصريحات مدخلاً من المستخدم يحتاج تطبيقك إلى تفسيره. لتدريب LUIS على استخلاص المقاصد والكيانات من هذه المدخلات، من المهم التقاط أمثلة مختلفة لألفاظ مختلفة لكل هدف. التعلم النشط، أو عملية الاستمرار في التدريب على الكلام الجديد، ضروري لذكاء التعلم الآلي الذي توفره LUIS.

استخدم التعبيرات التي تعتقد أن المستخدمين سيدخلونها. تضمين الألفاظ، والتي تعني نفس الشيء ولكن يتم إنشاؤها بطرق مختلفة:

  • طول التعبير - قصير ومتوسط وطويل لتطبيق العميل الخاص بك
  • طول الكلمة والعبارة
  • موضع الكلمات - الكيان في البداية والوسط ونهاية اللفظ
  • القواعد
  • التعددية
  • Stemming
  • اختيار الاسم والفعل
  • علامات الترقيم - باستخدام كل من التدقيق النحوي الصحيح وغير الصحيح

اختيار تعبيرات متنوعة

عند البدء في إضافة أمثلة الألفاظ إلى نموذج LUIS الخاص بك، هناك العديد من المبادئ التي يجب وضعها في الاعتبار:

لا يتم تشكيل التعبيرات بشكل جيد دائماً

قد يحتاج تطبيقك إلى معالجة الجمل، مثل "حجز تذكرة إلى باريس نيابة عني"، أو جزء من جملة، مثل "Booking" أو "Paris flight" غالبا ما يرتكب المستخدمون أيضا أخطاء إملائية. عند التخطيط لتطبيقك، ضع في اعتبارك ما إذا كنت تريد استخدام Bing Spell Check لتصحيح إدخال المستخدم قبل تمريره إلى LUIS أم لا.

إذا لم تقم بالتدقيق الإملائي لأقوال المستخدم، فيجب عليك تدريب LUIS على الألفاظ التي تتضمن الأخطاء الإملائية والإملائية.

استخدم اللغة التمثيلية للمستخدم

عند اختيار التعبيرات، يجب أن تدرك أن ما تعتقد أنه مصطلحات أو عبارات شائعة قد لا يكون شائعاً للمستخدم النموذجي لتطبيق العميل الخاص بك. قد لا يكون لديهم خبرة في المجال أو يستخدمون مصطلحات مختلفة. كن حذرا عند استخدام مصطلحات أو عبارات لن يقولها المستخدم إلا إذا كان خبيراً.

اختيار مصطلحات وجمل متنوعة

ستجد أنه حتى إذا بذلت جهودا لإنشاء أنماط جملة متنوعة، فستظل تكرر بعض المفردات. على سبيل المثال، الألفاظ التالية لها معنى مشابه، ولكن مصطلحات وجمل مختلفة:

  • "كيف يمكنني الحصول على كمبيوتر؟"
  • "من أين يمكنني الحصول على جهاز كمبيوتر؟"
  • "أريد الحصول على جهاز كمبيوتر، كيف يمكنني القيام بذلك؟"
  • "متى يمكنني الحصول على جهاز كمبيوتر؟"

المصطلح الأساسي هنا، الكمبيوتر، لا يختلف. استخدم البدائل مثل كمبيوتر سطح المكتب أو الكمبيوتر المحمول أو محطة العمل أو حتى الجهاز فقط. يمكن أن يستنتج LUIS بذكاء المرادفات من السياق؛ ولكن من الأفضل دائمًا أن تغير الألفاظ عند إنشائها للتدريب.

أمثلة على التعبيرات في كل هدف

يجب أن يكون لكل هدف مثال على الألفاظ - 15 على الأقل. إذا كان لديك هدف لا يحتوي على أي تعبيرات نموذجية، فلن تتمكن من تدريب LUIS. إذا كان لديك هدف مع مثال واحد أو عدد قليل من التعبيرات، فقد لا يتنبأ LUIS بدقة بالهدف.

إضافة مجموعات صغيرة من التعبيرات

في كل مرة تقوم فيها بالتكرار على النموذج الخاص بك لتحسينه، لا تضيف كميات كبيرة من الألفاظ. ضع في اعتبارك إضافة الألفاظ بكميات من 15. ثم قم بالتدريب، والنشر، والاختبار مرة أخرى.

ينشئ LUIS نماذج فعالة مع تعبيرات يتم اختيارها بعناية من قبل مؤلف نموذج LUIS. ستؤدي إضافة الكثير من الألفاظ إلى حدوث ارتباك، لذا فإن هذا الأمر لن يفيدك.

من الأفضل البدء ببعض الألفاظ، ثم مراجعة تعبيرات نقطة النهاية للتنبؤ الصحيح بالهدف واستخراج الكيان.

تطبيع اللفظ

تطبيع الألفاظ هو عملية تجاهل تأثيرات أنواع النصوص، مثل علامات الترقيم والعلامات التشكيلية، أثناء التدريب والتنبؤ.

يتم إيقاف تشغيل إعدادات تطبيع التعبيرات بشكل افتراضي. تتضمن هذه الإعدادات:

  • نماذج الكلمات
  • علامات التشكيل
  • علامات الترقيم

إذا شغلت إعداد التطبيع، سوف تغير الدرجات في جزء الاختبار واختبارات الدفعات واستعلامات نقطة النهاية لكافة الألفاظ لإعداد التطبيع هذا.

عند استنساخ إصدار في مدخل LUIS، يتم الاحتفاظ بإعدادات الإصدار في الإصدار المستنسخ الجديد.

قم بتعيين إعدادات إصدار التطبيق باستخدام مدخل LUIS عن طريق تحديد Manage من قائمة التنقل العلوية، في صفحة Application Settings. يمكنك أيضا استخدام واجهة برمجة تطبيقات تحديث إعدادات الإصدار. راجع وثائق المرجع للحصول على مزيد من المعلومات.

نماذج الكلمات

يتجاهل تطبيع نماذج الكلمات الاختلافات في الكلمات التي تتجاوز الجذر.

علامات التشكيل

علامات التشكيل هي علامات أو علامات داخل النص، مثل:

İ ı Ş Ğ ş ğ ö ü

علامات الترقيم

يعني التطبيع علامات الترقيم أنه قبل تدريب نماذجك وقبل توقع استعلامات نقطة النهاية، ستتم إزالة علامات الترقيم من الألفاظ.

علامات الترقيم هي رمز مميز منفصل في تطبيق LUIS. التعبير الذي يحتوي على نقطة في النهاية عبارة منفصلة عن تلك التي لا تحتوي على فترة في النهاية، وقد تحصل على تنبؤين مختلفين.

إذا لم تتم تسوية علامات الترقيم، لا يتجاهل LUIS علامات الترقيم بشكل افتراضي لأن بعض تطبيقات العميل قد تضع أهمية على هذه العلامات. تأكد من تضمين أمثلة على التعبيرات التي تستخدم علامات الترقيم، وتلك التي لا تستخدمها، لكي يرجع كلا النمطين نفس الدرجات النسبية.

تأكد من أن النموذج يعالج علامات الترقيم إما في أمثلة الألفاظ (سواء وجود علامات ترقيم أو عدم وجودها) أو في أنماط حيث يكون من الأسهل تجاهل علامات الترقيم. على سبيل المثال: أتقدم بطلب للحصول على وظيفة {Job} [.]

إذا لم يكن لعلامات الترقيم معنى محدد في تطبيق العميل، ففكر في تجاهل علامات الترقيم عن طريق تسوية علامات الترقيم.

تجاهل الكلمات وعلامات الترقيم

إذا كنت تريد تجاهل كلمات أو علامات ترقيم معينة في الأنماط، استخدم نمطًا مع بناء جملة تجاهل الأقواس المربعة، [].

التدريب مع جميع الألفاظ

التدريب غير محدد: يمكن أن يختلف التنبؤ بالألفاظ قليلا عبر الإصدارات أو التطبيقات. يمكنك إزالة التدريب غير المحدد عن طريق تحديث واجهة برمجة تطبيقات إعدادات الإصدار باستخدام زوج اسم/قيمة UseAllTrainingData لاستخدام جميع بيانات التدريب.

اختبار التعبيرات

يجب أن يبدأ المطورون في اختبار تطبيق LUIS الخاص بهم ببيانات حقيقية عن طريق إرسال التصريحات إلى عنوان URL لنقطة نهاية التنبؤ. تُستخدم هذه الألفاظ لتحسين أداء الأهداف والكيانات مع مراجعة الألفاظ. لا يتم إرسال الاختبارات المرسلة باستخدام جزء الاختبار في مدخل LUIS من خلال نقطة النهاية، ولا تساهم في التعلم النشط.

تحديد الأقوال

بعد التدريب للنموذج الخاص بك ونشره وتلقي استعلامات نقطة النهاية، راجع الألفاظ التي اقترحها LUIS. يحدد LUIS ألفاظ نقطة النهاية التي لها درجات منخفضة للهدف أو الكيان.

أفضل الممارسات

التسمية لمعنى الكلمة

إذا كان اختيار الكلمة أو ترتيب الكلمة هو نفسه، ولكن لا يعني نفس الشيء، فلا تسميه بالوحدة.

في الألفاظ التالية، كلمة fair هي متجانسة، ما يعني أنها مكتوبة بنفس الطريقة ولكن لها معنى مختلف:

  • "ما هي أنواع معارض المقاطعات التي تحدث في منطقة سياتل هذا الصيف؟"
  • "هل تم تصنيف معرض المطاعم حالياً بنجمتين؟

إذا كنت تريد أن يعثر كيان الحدث على جميع بيانات الحدث، فسمِّ الكلمة fair في التعبير الأول، ولكن ليس في الثانية.

لا تتجاهل تباينات التعبير المحتملة

يتوقع LUIS تباينات في تعبيرات الهدف. يمكن أن تختلف الألفاظ مع وجود نفس المعنى العام. يمكن أن تتضمن الاختلافات طول الكلام واختيار الكلمة ووضع الكلمة.

عدم استخدام التنسيق نفسه استخدام تنسيقات مختلفة
شراء تذكرة إلى سياتل شراء تذكرة إلى سياتل
شراء تذكرة إلى Paris حجز تذكرتين على العين الحمراء إلى باريس الاثنين المقبل
شراء تذكرة إلى أورلاندو أود أن أحجز 3 تذاكر إلى أورلاندو لعطلة الربيع

يستخدم العمود الثاني أفعالا مختلفة (شراء، حجز، كتاب)، كميات مختلفة (1، "اثنين"، 3)، وترتيبات مختلفة من الكلمات ولكن لديهم جميعا نفس النية لشراء تذاكر الطيران للسفر.

لا تضيف الكثير من الأمثلة على التعبيرات إلى الأهداف

بعد نشر التطبيق، أضف فقط تعبيرات من التعلم النشط في عملية دورة حياة التطوير. إذا كانت الأقوال متشابهة جدًا، أضف نمطًا.

الخطوات التالية