Perguntas mais frequentes sobre o Reconhecimento de Entidades Nomeadas Personalizadas

Encontre respostas a perguntas mais frequentes sobre conceitos e cenários relacionados com o NER personalizado na Linguagem de IA do Azure.

Como devo proceder para começar a utilizar o serviço?

Veja o início rápido para criar rapidamente o seu primeiro projeto ou veja como criar projetos para obter informações mais detalhadas.

Quais são os limites de serviço?

Veja o artigo Limites de serviço para obter mais informações.

Quantos ficheiros etiquetados são necessários?

Geralmente, os dados etiquetados diversos e representativos levam a melhores resultados, dado que a identificação é feita de forma precisa, consistente e completa. Não existe um número definido de instâncias etiquetadas que fará com que cada modelo tenha um bom desempenho. Desempenho altamente dependente do esquema e da ambiguidade do esquema. Os tipos de entidade ambíguos precisam de mais etiquetas. O desempenho também depende da qualidade das suas etiquetas. O número recomendado de instâncias etiquetadas por entidade é 50.

A preparação está a demorar muito tempo, isto é esperado?

O processo de preparação pode demorar muito tempo. Como estimativa aproximada, o tempo de preparação esperado para ficheiros com um comprimento combinado de 12 800 000 carateres é de 6 horas.

Como devo proceder para criar o meu modelo personalizado programaticamente?

Nota

Atualmente, só pode criar um modelo com a API REST ou o Language Studio.

Pode utilizar as APIs REST para criar os seus modelos personalizados. Siga este início rápido para começar a criar um projeto e criar um modelo através de APIs para obter exemplos de como chamar a API de Criação.

Quando estiver pronto para começar a utilizar o modelo para fazer predições, pode utilizar a API REST ou a biblioteca de cliente.

Pode preparar vários modelos no mesmo conjunto de dados no mesmo projeto. Depois de preparar o modelo com êxito, pode ver o respetivo desempenho. Pode implementar e testar o modelo no Language Studio. Pode adicionar ou remover etiquetas dos seus dados, preparar um novo modelo e testá-lo também. Veja os limites de serviçopara saber mais sobre o número máximo de modelos preparados com o mesmo projeto. Quando prepara um modelo, pode determinar como o conjunto de dados é dividido em conjuntos de preparação e teste. Também pode dividir os seus dados aleatoriamente em conjuntos de preparação e teste, onde não há garantias de que a avaliação do modelo refletido seja aproximadamente o mesmo conjunto de testes e os resultados não sejam comparáveis. Recomenda-se que desenvolva o seu próprio conjunto de testes e o utilize para avaliar ambos os modelos para que possa medir a melhoria.

Uma classificação de modelo baixa ou alta garante um desempenho mau ou bom na produção?

A avaliação do modelo pode nem sempre ser abrangente. Depende de:

  • Se o conjunto de testes for demasiado pequeno, as classificações boas/negativas não são representativas do desempenho real do modelo. Além disso, se um tipo de entidade específico estiver em falta ou sub-representado no conjunto de testes, afetará o desempenho do modelo.
  • A diversidade de dados se os seus dados abranger apenas alguns cenários/exemplos do texto esperado na produção, o modelo não será exposto a todos os cenários possíveis e poderá ter um mau desempenho nos cenários em que não foi preparado.
  • A representação de dados se o conjunto de dados utilizado para preparar o modelo não for representativo dos dados que seriam introduzidos no modelo em produção, o desempenho do modelo será muito afetado.

Veja o artigo de seleção de dados e estrutura do esquema para obter mais informações.

Como devo proceder para melhorar o desempenho do modelo?

  • Ver a matriz de confusão do modelo. Se notar que um determinado tipo de entidade não é frequentemente previsto corretamente, considere adicionar mais instâncias etiquetadas para esta classe. Se notar que dois tipos de entidades são frequentemente previstos entre si, isto significa que o esquema é ambíguo e deve considerar intercalá-los num tipo de entidade para um melhor desempenho.

  • Reveja as predições do conjunto de testes. Se um dos tipos de entidade tiver muito mais instâncias etiquetadas do que as outras, o modelo poderá ser tendencioso em relação a este tipo. Adicione mais dados aos outros tipos de entidade ou remova exemplos do tipo dominante.

  • Saiba mais sobre a seleção de dados e design de esquemas.

  • Reveja o conjunto de testes para ver as entidades previstas e etiquetadas lado a lado para que possa ter uma ideia melhor do desempenho do modelo e decidir se são necessárias alterações no esquema ou nas etiquetas.

Por que motivo obtenho resultados diferentes ao voltar a preparar o meu modelo?

  • Ao preparar o modelo, pode determinar se pretende que os seus dados sejam divididos aleatoriamente em conjuntos de preparação e teste. Se o fizer, não há garantias de que a avaliação do modelo refletido esteja no mesmo conjunto de testes, pelo que os resultados não são comparáveis.

  • Se estiver a preparar novamente o mesmo modelo, o conjunto de testes será o mesmo, mas poderá notar uma ligeira alteração nas predições feitas pelo modelo. Isto deve-se ao facto de o modelo preparado não ser suficientemente robusto e este ser um fator de quão representativos e distintos são os seus dados e da qualidade dos seus dados marcados.

Como devo proceder para obter predições em idiomas diferentes?

Primeiro, tem de ativar a opção multilingue ao criar o projeto ou pode ativá-lo mais tarde a partir da página de definições do projeto. Depois de preparar e implementar o modelo, pode começar a consulta em vários idiomas. Pode obter resultados variados para idiomas diferentes. Para melhorar a precisão de qualquer linguagem, adicione mais instâncias etiquetadas ao seu projeto nesse idioma para introduzir o modelo preparado para uma sintaxe superior a essa linguagem.

Treinei o meu modelo, mas não consigo testá-lo

Tem de implementar o modelo antes de o poder testar.

Como devo proceder para utilizar o meu modelo preparado para predições?

Depois de implementar o modelo, chama a API de predição com a API REST ou bibliotecas de cliente.

Privacidade e segurança dos dados

O NER personalizado é um processador de dados para fins de Regulamento Geral sobre a Proteção de Dados (RGPD). Em conformidade com as políticas do RGPD, os utilizadores NER personalizados têm controlo total para ver, exportar ou eliminar qualquer conteúdo de utilizador através do Language Studio ou através de programação através de APIs REST.

Os seus dados só são armazenados na sua conta de Armazenamento do Azure. O NER personalizado só tem acesso para ler a partir do mesmo durante a preparação.

Como clonar o meu projeto?

Para clonar o projeto, tem de utilizar a API de exportação para exportar os recursos do projeto e, em seguida, importá-los para um novo projeto. Veja a referência da API REST para ambas as operações.

Passos seguintes