ربط الكيان بين المهارات المعرفية

ترجع مهارة ربط الكيانات قائمة بالكيانات المعترف بها مع روابط إلى مقالات في قاعدة معارف معروف (ويكيبيديا).

ملاحظة

ترتبط هذه المهارة بنماذج التعلم الآلي لربط الكيانات في Azure Cognitive Services for Language وتتطلب موردا قابلا للفوترة للمعاملات التي تتجاوز 20 مستندا لكل مفهرس يوميا. يتم فرض رسوم على تنفيذ المهارات المضمنة بسعر الخدمات المعرفية الحالي للدفع أولا بأول.

@odata.type

Microsoft.Skills.Text.V3.EntityLinkingSkill

حدود البيانات

يجب أن يكون الحد الأقصى لحجم السجل 50000 حرف كما تم قياسه بواسطة String.Length. إذا كنت بحاجة إلى تقسيم بياناتك قبل إرسالها إلى مهارة EntityLinking، ففكر في استخدام مهارة تقسيم النص.

معلمات المهارة

أسماء المعلمات حساسة لحالة الأحرف وكلها اختيارية.

اسم المعلمة الوصف
defaultLanguageCode رمز اللغة لنص الإدخال. إذا لم يتم تحديد رمز اللغة الافتراضي، استخدام اللغة الإنجليزية (en) كرمز اللغة الافتراضي.
راجع القائمة الكاملة للغات المدعومة.
minimumPrecision قيمة بين 0 و 1. إذا كانت درجة الثقة (في الناتج) أقل من هذه القيمة، فلن يتم إرجاع الكيان entities . الافتراضي هو 0.
modelVersion (اختياري) يحدد إصدار النموذج المطلوب استخدامه عند الاتصال بربط الكيان. سيتم تعيينه افتراضيا إلى أحدث ما هو متاح عند عدم تحديده. نوصيك بعدم تحديد هذه القيمة إلا إذا كان ذلك ضروريا.

مدخلات المهارات

اسم الإدخال الوصف
languageCode سلسلة تشير إلى لغة السجلات. إذا لم يتم تحديد هذه المعلمة، استخدام رمز اللغة الافتراضي لتحليل السجلات.
راجع القائمة الكاملة للغات المدعومة.
text النص المراد تحليله.

مخرجات المهارات

اسم الإخراج الوصف
entities صفيف من الأنواع المعقدة التي تحتوي على الحقول التالية:
  • "name" (اسم الكيان الفعلي كما يظهر في النص)
  • "id"
  • "language" (لغة النص كما تحددها المهارة)
  • "url" (عنوان URL المرتبط بهذا الكيان)
  • "bingId" (معرف bingId لهذا الكيان المرتبط)
  • "dataSource" (مصدر البيانات المرتبط بعنوان URL)
  • "matches"(مجموعة من الأنواع المعقدة التي تحتوي على: text، ، offsetlength و confidenceScore)

نموذج تعريف

  {
    "@odata.type": "#Microsoft.Skills.Text.V3.EntityLinkingSkill",
    "context": "/document",
    "defaultLanguageCode": "en", 
    "minimumPrecision": 0.5, 
    "inputs": [
        {
            "name": "text", 
            "source": "/document/content"
        },
        {
            "name": "languageCode", 
            "source": "/document/language"
        }
    ],
    "outputs": [
        {
            "name": "entities", 
            "targetName": "entities" 
        }
    ]
}

عينة الإدخال

{
    "values": [
      {
        "recordId": "1",
        "data":
           {
             "text": "Microsoft is liked by many.",
             "languageCode": "en"
           }
      }
    ]
}

عينة الإخراج

{
  "values": [
    {
      "recordId": "1",
      "data" : 
      {
        "entities": [
          {
            "name": "Microsoft", 
            "id": "Microsoft",
            "language": "en", 
            "url": "https://en.wikipedia.org/wiki/Microsoft", 
            "bingId": "a093e9b9-90f5-a3d5-c4b8-5855e1b01f85", 
            "dataSource": "Wikipedia", 
            "matches": [
                {
                    "text": "Microsoft", 
                    "offset": 0, 
                    "length": 9, 
                    "confidenceScore": 0.13 
                }
            ]
          }
        ],
      }
    }
  ]
}

يتم إرجاع الإزاحات التي يتم إرجاعها للكيانات في إخراج هذه المهارة مباشرة من واجهات برمجة تطبيقات خدمة اللغة، مما يعني أنه إذا كنت تستخدمها للفهرسة في السلسلة الأصلية، فيجب عليك استخدام فئة StringInfo في .NET لاستخراج المحتوى الصحيح. لمزيد من المعلومات، راجع دعم متعدد اللغات والرموز التعبيرية في ميزات خدمة اللغة.

حالات التحذير

إذا كان رمز اللغة الخاص بالمستند غير معتمد، إرجاع تحذير ولا يتم استخراج أي كيانات.

راجع أيضًا