Связывание сущностей когнитивного навыка (версия 3)

Навык связывания сущностей (v3) возвращает список распознанных сущностей со ссылками на статьи в известной база знаний (Википедия).

Примечание.

Этот навык привязан к моделям машинного обучения для связывания сущностей на языке ИИ Azure и требует оплачиваемого ресурса для транзакций, превышающих 20 документов на индексатор в день. За выполнение встроенных навыков взимается плата за существующие службы ИИ Azure по мере использования.

@odata.type

Microsoft.Skills.Text.V3.EntityLinkingSkill

Ограничения данных

Максимальный размер записи — 50 000 знаков по оценке String.Length. Если вам нужно разбить данные перед отправкой для применения навыка "связывание сущностей", используйте навык разделение текста. Если вы используете навык разделения текста, задайте длину страницы равным 5000 для оптимальной производительности.

Параметры навыков

Имена всех параметров чувствительны к регистру и являются необязательными.

Имя параметра Description
defaultLanguageCode Код языка вводимого текста. Если код языка по умолчанию не указан, английский (en) используется как язык по умолчанию.
Полный список поддерживаемых языков.
minimumPrecision Значение от 0 до 1. Если оценка достоверности (в выходных данных entities) меньше этого значения, сущность не возвращается. По умолчанию установлено значение 0.
modelVersion (Необязательно) Указывает версию модели, используемую при вызове связывания сущностей. Если значение не указано, по умолчанию будет использоваться последняя доступная версия. Мы рекомендуем не указывать это значение, если это не необходимо.

Входные данные навыков

Ввод имени Description
languageCode Строка, указывающая язык записей. Если этот параметр не указан, для анализа записей будет использоваться код языка по умолчанию.
Полный список поддерживаемых языков.
text Текст для анализа.

Выходные данные навыка

Имя вывода Description
entities Массив сложных типов, содержащий следующие поля:
  • "name" (Фактическое имя сущности, отображаемого в тексте)
  • "id"
  • "language" (Язык текста, определяемый навыком)
  • "url" (Связанный URL-адрес этой сущности)
  • "bingId" (BingId для этой связанной сущности)
  • "dataSource" (Источник данных, связанный с URL-адресом)
  • "matches"(Массив сложных типов, содержащих: text, offsetlength и confidenceScore)

Пример определения

  {
    "@odata.type": "#Microsoft.Skills.Text.V3.EntityLinkingSkill",
    "context": "/document",
    "defaultLanguageCode": "en", 
    "minimumPrecision": 0.5, 
    "inputs": [
        {
            "name": "text", 
            "source": "/document/content"
        },
        {
            "name": "languageCode", 
            "source": "/document/language"
        }
    ],
    "outputs": [
        {
            "name": "entities", 
            "targetName": "entities" 
        }
    ]
}

Пример ввода

{
    "values": [
      {
        "recordId": "1",
        "data":
           {
             "text": "Microsoft is liked by many.",
             "languageCode": "en"
           }
      }
    ]
}

Пример полученных результатов

{
  "values": [
    {
      "recordId": "1",
      "data" : 
      {
        "entities": [
          {
            "name": "Microsoft", 
            "id": "Microsoft",
            "language": "en", 
            "url": "https://en.wikipedia.org/wiki/Microsoft", 
            "bingId": "a093e9b9-90f5-a3d5-c4b8-5855e1b01f85", 
            "dataSource": "Wikipedia", 
            "matches": [
                {
                    "text": "Microsoft", 
                    "offset": 0, 
                    "length": 9, 
                    "confidenceScore": 0.13 
                }
            ]
          }
        ],
      }
    }
  ]
}

Смещения, возвращаемые для сущностей в выходных данных этого навыка, возвращаются непосредственно из API-интерфейсов языковой службы, что означает, что если вы используете их для индексирования в исходной строке, следует использовать класс StringInfo в .NET для извлечения правильного содержимого. Дополнительные сведения см. в разделе "Поддержка многоязычных и эмодзи" в функциях языковой службы.

Примеры предупреждений

Если код языка для документа не поддерживается, возвращается предупреждение и сущности не извлекаются.

См. также