Share via


Habilidade cognitiva de Reconhecimento de Entidade Nomeada (v2)

A habilidade Reconhecimento de Entidade Nomeada (v2) extrai entidades nomeadas do texto. As entidades disponíveis incluem os tipos person, location e organization.

Importante

A habilidade de reconhecimento de entidade nomeada (v2) (Microsoft.Skills.Text.NamedEntityRecognitionSkill) agora foi descontinuada, substituída por Microsoft.Skills.Text.V3.EntityRecognitionSkill. Siga as recomendações em Habilidades de Pesquisa de IA do Azure preteridas para migrar para uma habilidade suportada.

Nota

À medida que você expande o escopo aumentando a frequência de processamento, adicionando mais documentos ou adicionando mais algoritmos de IA, você precisará anexar um recurso faturável de serviços de IA do Azure. As cobranças se acumulam ao chamar APIs nos serviços de IA do Azure e para extração de imagem como parte do estágio de quebra de documentos no Azure AI Search. Não há taxas para extração de texto de documentos. A execução de habilidades internas é cobrada pelo preço pré-pago dos serviços de IA do Azure existentes.

A extração de imagens é uma cobrança extra medida pelo Azure AI Search, conforme descrito na página de preços. A extração de texto é gratuita.

@odata.type

Microsoft.Skills.Text.NamedEntityRecognitionSkill

Limites de dados

O tamanho máximo de um registo deve ser de 50 000 carateres, medido por String.Length. Se você precisar dividir seus dados antes de enviá-los para o extrator de frase-chave, considere usar a habilidade Divisão de texto. Se você usar uma habilidade de divisão de texto, defina o comprimento da página como 5000 para obter o melhor desempenho.

Parâmetros de habilidade

Os parâmetros diferenciam maiúsculas de minúsculas.

Nome do parâmetro Description
categories Matriz de categorias que devem ser extraídas. Tipos de categorias possíveis: "Person", "Location", "Organization". Se nenhuma categoria for fornecida, todos os tipos serão retornados.
defaultLanguageCode Código linguístico do texto de entrada. Os seguintes idiomas são suportados: de, en, es, fr, it
mínimoPrecisão Um número entre 0 e 1. Se a precisão for menor que esse valor, a entidade não será retornada. A predefinição é 0.

Contributos para as competências

Nome de entrada Description
languageCode Opcional. A predefinição é "en".
text O texto a analisar.

Resultados em termos de competências

Nome da saída Description
Pessoas Uma matriz de cadeias de caracteres onde cada cadeia representa o nome de uma pessoa.
localizações Uma matriz de cadeias de caracteres onde cada cadeia de caracteres representa um local.
organizações Uma matriz de cadeias de caracteres onde cada cadeia de caracteres representa uma organização.
entidades Uma matriz de tipos complexos. Cada tipo complexo inclui os seguintes campos:
  • categoria ("person", "organization", ou "location")
  • value (o nome real da entidade)
  • offset (O local onde foi encontrado no texto)
  • confiança (Um valor entre 0 e 1 que representa essa confiança de que o valor é uma entidade real)

Definição da amostra

  {
    "@odata.type": "#Microsoft.Skills.Text.NamedEntityRecognitionSkill",
    "categories": [ "Person", "Location", "Organization"],
    "defaultLanguageCode": "en",
    "inputs": [
      {
        "name": "text",
        "source": "/document/content"
      }
    ],
    "outputs": [
      {
        "name": "persons",
        "targetName": "people"
      }
    ]
  }

Entrada de exemplo

{
    "values": [
      {
        "recordId": "1",
        "data":
           {
             "text": "This is the loan application for Joe Romero, a Microsoft employee who was born in Chile and who then moved to Australia… Ana Smith is provided as a reference.",
             "languageCode": "en"
           }
      }
    ]
}

Saída de exemplo

{
  "values": [
    {
      "recordId": "1",
      "data" : 
      {
        "persons": [ "Joe Romero", "Ana Smith"],
        "locations": ["Chile", "Australia"],
        "organizations":["Microsoft"],
        "entities":  
        [
          {
            "category":"person",
            "value": "Joe Romero",
            "offset": 33,
            "confidence": 0.87
          },
          {
            "category":"person",
            "value": "Ana Smith",
            "offset": 124,
            "confidence": 0.87
          },
          {
            "category":"location",
            "value": "Chile",
            "offset": 88,
            "confidence": 0.99
          },
          {
            "category":"location",
            "value": "Australia",
            "offset": 112,
            "confidence": 0.99
          },
          {
            "category":"organization",
            "value": "Microsoft",
            "offset": 54,
            "confidence": 0.99
          }
        ]
      }
    }
  ]
}

Casos de alerta

Se o código de idioma do documento não for suportado, um aviso será retornado e nenhuma entidade será extraída.

Consulte também