Como utilizar o reconhecimento de entidade nomeada em análise de textoHow to use Named Entity Recognition in Text Analytics

A API text Analytics permite-lhe tomar texto não estruturado e devolve uma lista de entidades desambiguadas, com links para mais informações na web.The Text Analytics API lets you takes unstructured text and returns a list of disambiguated entities, with links to more information on the web. A API suporta o reconhecimento de entidades nomeadas (NER) e a ligação de entidades.The API supports both named entity recognition (NER) and entity linking.

Ligar à EntidadeEntity Linking

A ligação da entidade é a capacidade de identificar e desambiguar a identidade de uma entidade encontrada em texto (por exemplo, determinar se uma ocorrência da palavra "Marte" se refere ao planeta, ou ao deus romano da guerra).Entity linking is the ability to identify and disambiguate the identity of an entity found in text (for example, determining whether an occurrence of the word "Mars" refers to the planet, or to the Roman god of war). Este processo requer a presença de uma base de conhecimento numa língua apropriada, para ligar entidades reconhecidas em texto.This process requires the presence of a knowledge base in an appropriate language, to link recognized entities in text. A Entity Linking usa a Wikipédia como base de conhecimento.Entity Linking uses Wikipedia as this knowledge base.

Reconhecimento de Entidades Nomeadas (NER)Named Entity Recognition (NER)

Denominado Reconhecimento de Entidade (NER) é a capacidade de identificar diferentes entidades em texto e categorizá-las em classes ou tipos pré-definidos como: pessoa, localização, evento, produto e organização.Named Entity Recognition (NER) is the ability to identify different entities in text and categorize them into pre-defined classes or types such as: person, location, event, product and organization.

Versões e funcionalidades de Reconhecimento de Entidades nomeadasNamed Entity Recognition versions and features

Importante

Texto Analytics API v3 não está disponível nas seguintes regiões: China Norte 2, China Leste.Text Analytics API v3 is not available in the following regions: China North 2, China East.

FuncionalidadeFeature NER v3.0NER v3.0 NER v3.1-pré-visualização.2NER v3.1-preview.2
Métodos para pedidos individuais e de loteMethods for single, and batch requests XX XX
Reconhecimento de entidades expandidas em várias categoriasExpanded entity recognition across several categories XX XX
Pontos finais separados para envio de entidades que ligam e pedidos NER.Separate endpoints for sending entity linking and NER requests. XX XX
Reconhecimento de entidades de informação pessoais PII e de saúde PHIRecognition of personal (PII) and health (PHI) information entities XX

Consulte o suporte linguístico para obter informações.See language support for information.

Tipos de entidadeEntity types

O Nome De Reconhecimento de Entidade v3 fornece deteção expandida em vários tipos.Named Entity Recognition v3 provides expanded detection across multiple types. Atualmente, o NER v3.0 pode reconhecer entidades na categoria de entidades gerais.Currently, NER v3.0 can recognize entities in the general entity category.

O Nome De Reconhecimento de Entidade v3.1-preview.2 inclui as capacidades de deteção de v3.0, e a capacidade de detetar informações pessoais ( PII ) usando o v3.1-preview.2/entities/recognition/pii ponto final.Named Entity Recognition v3.1-preview.2 includes the detection capabilities of v3.0, and the ability to detect personal information (PII) using the v3.1-preview.2/entities/recognition/pii endpoint. Pode utilizar o parâmetro opcional domain=phi para detetar informações confidenciais de saúde PHI ().You can use the optional domain=phi parameter to detect confidential health information (PHI). Consulte o artigo das categorias de entidades e solicite a secção de pontos finais abaixo para obter mais informações.See the entity categories article, and request endpoints section below for more information.

Envio de um pedido de API RESTSending a REST API request

PreparaçãoPreparation

Você deve ter documentos JSON neste formato: ID, texto, idioma.You must have JSON documents in this format: ID, text, language.

Cada documento deve ter menos de 5.120 caracteres e pode ter até 1.000 itens (IDs) por coleção.Each document must be under 5,120 characters, and you can have up to 1,000 items (IDs) per collection. A coleção é enviada no corpo do pedido.The collection is submitted in the body of the request.

Estruturar o pedidoStructure the request

Crie um pedido POST.Create a POST request. Pode utilizar o Carteiro ou a consola de testes API nas seguintes ligações para estruturar e enviar rapidamente uma.You can use Postman or the API testing console in the following links to quickly structure and send one.

Nota

Pode encontrar a sua chave e ponto final para o seu recurso Text Analytics no portal azul.You can find your key and endpoint for your Text Analytics resource on the azure portal. Estarão localizados na página de arranque rápido do recurso, sob gestão de recursos.They will be located on the resource's Quick start page, under resource management.

Solicitar pontos finaisRequest endpoints

O Reconhecimento de Entidades v3.1-preview.2 Nomeadas utiliza pontos finais separados para NER e entidade que ligam pedidos.Named Entity Recognition v3.1-preview.2 uses separate endpoints for NER and entity linking requests. Utilize um formato URL abaixo baseado no seu pedido:Use a URL format below based on your request:

Ligação de entidadesEntity linking

  • https://<your-custom-subdomain>.cognitiveservices.azure.com/text/analytics/v3.1-preview.2/entities/linking

Chamada Entity Recognition versão 3.1-pré-visualização referência para LinkingNamed Entity Recognition version 3.1-preview reference for Linking

NERNER

  • Entidades gerais - https://<your-custom-subdomain>.cognitiveservices.azure.com/text/analytics/v3.1-preview.2/entities/recognition/generalGeneral entities - https://<your-custom-subdomain>.cognitiveservices.azure.com/text/analytics/v3.1-preview.2/entities/recognition/general

Chamada Entity Recognition versão 3.1-pré-visualização referência para GeneralNamed Entity Recognition version 3.1-preview reference for General

  • Informação pessoal PII - https://<your-custom-subdomain>.cognitiveservices.azure.com/text/analytics/v3.1-preview.2/entities/recognition/piiPersonal (PII) information - https://<your-custom-subdomain>.cognitiveservices.azure.com/text/analytics/v3.1-preview.2/entities/recognition/pii

Também pode utilizar o parâmetro opcional domain=phi para detetar informações de saúde PHI () em texto.You can also use the optional domain=phi parameter to detect health (PHI) information in text.

https://<your-custom-subdomain>.cognitiveservices.azure.com/text/analytics/v3.1-preview.2/entities/recognition/pii?domain=phi

Por favor, note a adição do redactedText imóvel na resposta JSON que contém o texto de entrada modificado onde as entidades PII detetadas são substituídas por um * por cada personagem das entidades.Please note the addition of the redactedText property in the response JSON which contains the modified input text where the detected PII entities are replaced by an * for each character of the entities.

Chamada Entity Recognition versão 3.1-pré-visualização referência para PIINamed Entity Recognition version 3.1-preview reference for PII

Desa estatua um cabeçalho de pedido para incluir a sua chave API API de Análise de Texto.Set a request header to include your Text Analytics API key. No órgão de pedido, forneça os documentos JSON que preparou.In the request body, provide the JSON documents you prepared.

Exemplo NER pedidoExample NER request

Segue-se um exemplo de conteúdo que poderá enviar para a API.The following is an example of content you might send to the API. O formato de pedido é o mesmo para ambas as versões da API.The request format is the same for both versions of the API.

{
  "documents": [
    {
        "id": "1",
        "language": "en",
        "text": "Our tour guide took us up the Space Needle during our trip to Seattle last week."
    }
  ]
}

Postar o pedidoPost the request

A análise é realizada aquando da receção do pedido.Analysis is performed upon receipt of the request. Consulte a secção limite de dados na visão geral para obter informações sobre o tamanho e o número de pedidos que pode enviar por minuto e segundo.See the data limits section in the overview for information on the size and number of requests you can send per minute and second.

O Texto Analytics API é apátrida.The Text Analytics API is stateless. Nenhum dado é armazenado na sua conta e os resultados são devolvidos imediatamente na resposta.No data is stored in your account, and results are returned immediately in the response.

Ver resultadosView results

Todos os pedidos post devolvem uma resposta formatada JSON com os IDs e propriedades de entidade detetadas.All POST requests return a JSON formatted response with the IDs and detected entity properties.

O resultado é devolvido imediatamente.Output is returned immediately. Pode transmitir os resultados para uma aplicação que aceite JSON ou guardar o resultado num ficheiro no sistema local e, em seguida, importá-lo para uma aplicação que lhe permita ordenar, procurar e manipular os dados.You can stream the results to an application that accepts JSON or save the output to a file on the local system, and then import it into an application that allows you to sort, search, and manipulate the data. Devido ao suporte multilíngue e emoji, a resposta pode conter compensações de texto.Due to multilingual and emoji support, the response may contain text offsets. Veja como processar as compensações de texto para obter mais informações.See how to process text offsets for more information.

Respostas de exemploExample responses

A versão 3 fornece pontos finais separados para a ligação geral do NER, PII e entidade.Version 3 provides separate endpoints for general NER, PII and entity linking. As respostas para ambas as operações estão abaixo.The responses for both operations are below.

Exemplo de uma resposta PII:Example of a PII response:

{
  "documents": [
    {
    "redactedText": "You can even pre-order from their online menu at *************************, call ************ or send email to ***************************!",
    "id": "0",
    "entities": [
        {
        "text": "www.contososteakhouse.com",
        "category": "URL",
        "offset": 49,
        "length": 25,
        "confidenceScore": 0.8
        }, 
        {
        "text": "312-555-0176",
        "category": "Phone Number",
        "offset": 81,
        "length": 12,
        "confidenceScore": 0.8
        }, 
        {
        "text": "order@contososteakhouse.com",
        "category": "Email",
        "offset": 111,
        "length": 27,
        "confidenceScore": 0.8
        }
      ],
    "warnings": []
    }
  ],
  "errors": [],
  "modelVersion": "2020-07-01"
}

Exemplo de uma resposta de ligação da Entidade:Example of an Entity linking response:

{
  "documents": [
    {
      "id": "1",
      "entities": [
        {
          "bingId": "f8dd5b08-206d-2554-6e4a-893f51f4de7e", 
          "name": "Space Needle",
          "matches": [
            {
              "text": "Space Needle",
              "offset": 30,
              "length": 12,
              "confidenceScore": 0.4
            }
          ],
          "language": "en",
          "id": "Space Needle",
          "url": "https://en.wikipedia.org/wiki/Space_Needle",
          "dataSource": "Wikipedia"
        },
        {
          "bingId": "5fbba6b8-85e1-4d41-9444-d9055436e473",
          "name": "Seattle",
          "matches": [
            {
              "text": "Seattle",
              "offset": 62,
              "length": 7,
              "confidenceScore": 0.25
            }
          ],
          "language": "en",
          "id": "Seattle",
          "url": "https://en.wikipedia.org/wiki/Seattle",
          "dataSource": "Wikipedia"
        }
      ],
      "warnings": []
    }
  ],
  "errors": [],
  "modelVersion": "2020-02-01"
}

ResumoSummary

Neste artigo, aprendeu conceitos e fluxo de trabalho para entidade que liga usando Text Analytics em Serviços Cognitivos.In this article, you learned concepts and workflow for entity linking using Text Analytics in Cognitive Services. Em resumo:In summary:

  • Os documentos JSON no órgão de pedido incluem um ID, texto e código linguístico.JSON documents in the request body include an ID, text, and language code.
  • Os pedidos de CORREIO são enviados para um ou mais pontos finais, utilizando uma chave de acesso personalizada e um ponto final válido para a sua subscrição.POST requests are sent to one or more endpoints, using a personalized access key and an endpoint that is valid for your subscription.
  • A saída de resposta, que consiste em entidades ligadas (incluindo pontuações de confiança, compensações e links web, para cada ID do documento) pode ser utilizada em qualquer aplicaçãoResponse output, which consists of linked entities (including confidence scores, offsets, and web links, for each document ID) can be used in any application

Passos seguintesNext steps