العبارة الرئيسية استخراج المهارة المعرفية

تقوم مهارة استخراج العبارة الرئيسية بتقييم النص غير المنظم، ولكل سجل، ترجع قائمة بالعبارات الرئيسية. تستخدم هذه المهارة نماذج التعلم الآلي للعبارات الرئيسية التي توفرها Azure Cognitive Services for Language.

هذه الإمكانية مفيدة إذا كنت بحاجة إلى تحديد نقاط الحديث الرئيسية في السجل بسرعة. على سبيل المثال ، بالنظر إلى نص الإدخال "كان الطعام لذيذا وكان هناك موظفون رائعون" ، فإن الخدمة تعيد "الطعام" و "الموظفين الرائعين".

ملاحظة

ترتبط هذه المهارة بالخدمات المعرفية وتتطلب موردا قابلا للفوترة للمعاملات التي تتجاوز 20 مستندا لكل مفهرس يوميا. يتم فرض رسوم على تنفيذ المهارات المضمنة بسعر الخدمات المعرفية الحالي للدفع أولا بأول.

@odata.type

Microsoft.Skills.Text.KeyPhraseExtractionSkill

حدود البيانات

يجب أن يكون الحد الأقصى لحجم السجل 50000 حرف كما تم قياسه بواسطة String.Length. إذا كنت بحاجة إلى تقسيم بياناتك قبل إرسالها إلى مستخرج العبارة الرئيسية ، ففكر في استخدام مهارة تقسيم النص.

معلمات المهارة

المعلمات حساسة لحالة الأحرف.

الإدخالات الوصف
defaultLanguageCode (اختياري) رمز اللغة المراد تطبيقه على المستندات التي لا تحدد اللغة صراحة. إذا لم يتم تحديد رمز اللغة الافتراضي، استخدام اللغة الإنجليزية (en) كرمز اللغة الافتراضي.
راجع القائمة الكاملة للغات المدعومة.
maxKeyPhraseCount (اختياري) الحد الأقصى لعدد العبارات الرئيسية التي يجب إنتاجها.
modelVersion (اختياري) يحدد إصدار النموذج المطلوب استخدامه عند استدعاء العبارة الرئيسية API. سيتم تعيينه افتراضيا إلى أحدث ما هو متاح عند عدم تحديده. نوصيك بعدم تحديد هذه القيمة إلا إذا كان ذلك ضروريا.

مدخلات المهارات

إدخال الوصف
text النص المراد تحليله.
languageCode سلسلة تشير إلى لغة السجلات. إذا لم يتم تحديد هذه المعلمة، استخدام رمز اللغة الافتراضي لتحليل السجلات.
راجع القائمة الكاملة للغات المدعومة.

مخرجات المهارات

المخرجات الوصف
keyPhrases قائمة بالعبارات الرئيسية المستخرجة من نص الإدخال. يتم إرجاع العبارات الرئيسية حسب الأهمية.

نموذج تعريف

ضع في اعتبارك سجل SQL يحتوي على الحقول التالية:

{
    "content": "Glaciers are huge rivers of ice that ooze their way over land, powered by gravity and their own sheer weight. They accumulate ice from snowfall and lose it through melting. As global temperatures have risen, many of the world’s glaciers have already started to shrink and retreat. Continued warming could see many iconic landscapes – from the Canadian Rockies to the Mount Everest region of the Himalayas – lose almost all their glaciers by the end of the century.",
    "language": "en"
}

ثم قد يبدو تعريف مهارتك كما يلي:

 {
    "@odata.type": "#Microsoft.Skills.Text.KeyPhraseExtractionSkill",
    "inputs": [
      {
        "name": "text",
        "source": "/document/content"
      },
      {
        "name": "languageCode",
        "source": "/document/language" 
      }
    ],
    "outputs": [
      {
        "name": "keyPhrases",
        "targetName": "myKeyPhrases"
      }
    ]
  }

عينة الإخراج

على سبيل المثال أعلاه ، ستتم كتابة إخراج مهارتك إلى عقدة جديدة في الشجرة المثرية تسمى "document / myKeyPhrases" لأن هذا هو targetName الذي حددناه. إذا لم تحدد a targetName، فسيكون "مستند / keyPhrases".

مستند/myKeyPhrases

            [
              "world’s glaciers", 
              "huge rivers of ice", 
              "Canadian Rockies", 
              "iconic landscapes",
              "Mount Everest region",
              "Continued warming"
            ]

يمكنك استخدام "مستند/myKeyPhrases" كمدخلات في مهارات أخرى، أو كمصدر لتعيين حقل الإخراج.

تحذيرات

إذا قمت بتوفير رمز لغة غير مدعوم، إنشاء تحذير ولا يتم استخراج العبارات الرئيسية. إذا كان النص فارغا، إصدار تحذير. إذا كان النص أكبر من 50,000 حرف، تحليل أول 50,000 حرف فقط وسيتم إصدار تحذير.

راجع أيضًا