O que é o reconhecimento personalizado de entidade (NER) (pré-visualização)?

O NER personalizado é uma das funcionalidades oferecidas pelo Azure Cognitive Service for Language. É um serviço API baseado na nuvem que aplica inteligência de aprendizagem automática para permitir que você construa modelos personalizados para tarefas NER personalizadas de texto.

O NER personalizado é oferecido como parte das funcionalidades personalizadas dentro do Azure Cognitive Service for Language. Esta funcionalidade permite aos seus utilizadores construir modelos de IA personalizados para extrair entidades específicas do domínio de textos não estruturados, como contratos ou documentos financeiros. Ao criar um projeto NER personalizado, os desenvolvedores podem etiquetar dados, treinar, avaliar e melhorar o desempenho do modelo antes de os disponibilizar para consumo. A qualidade dos dados marcados tem um impacto muito grande no desempenho do modelo. Para simplificar a construção e personalização do seu modelo, o serviço oferece um portal web personalizado que pode ser acedido através do estúdio Language. Pode começar facilmente com o serviço seguindo os passos neste arranque rápido.

Esta documentação contém os seguintes tipos de artigos:

  • Os quickstarts estão a iniciar instruções para guiá-lo através da realização de pedidos ao serviço.
  • Os conceitos fornecem explicações sobre a funcionalidade e funcionalidades do serviço.
  • Os guias de como fazer contêm instruções para a utilização do serviço de formas mais específicas ou personalizadas.

Cenários de utilização de exemplo

Extração de informação

Muitas organizações financeiras e jurídicas extraem e normalizam dados de milhares de textos complexos não estruturados, tais como extratos bancários, acordos legais ou formulários bancários diariamente. Em vez de processar manualmente estes formulários, o NER personalizado pode ajudar a automatizar este processo e economizar custos, tempo e esforço..

A pesquisa é fundamental para qualquer app que aucie conteúdo de texto aos utilizadores, com cenários comuns, incluindo pesquisa de catálogo ou documento, pesquisa de produtos de retalho ou mineração de conhecimento para a ciência dos dados. Muitas empresas de várias indústrias estão a estudar a construção de uma rica experiência de pesquisa sobre conteúdos privados e heterogéneos, que inclui documentos estruturados e não estruturados. Como parte do seu pipeline, os desenvolvedores podem usar o NER personalizado para extrair entidades do texto que são relevantes para a sua indústria. Estas entidades poderiam ser usadas para enriquecer a indexação do ficheiro para uma experiência de pesquisa mais personalizada.

Auditoria e conformidade

Em vez de rever manualmente ficheiros de texto significativamente longos para auditar e aplicar políticas, os departamentos de TI em empresas financeiras ou legais podem usar o NER personalizado para construir soluções automatizadas. Estas soluções ajudam a impor políticas de conformidade e a criar regras de negócio necessárias baseadas em gasodutos de mineração de conhecimento que processam conteúdos estruturados e não estruturados.

Ciclo de vida de desenvolvimento de aplicações

A utilização de NER personalizado normalmente envolve vários passos diferentes.

The development lifecycle

  1. Defina o seu esquema: Conheça os seus dados e identifique as entidades que pretende extrair. Evitar ambiguidade.

  2. Marque os seus dados: A marcação de dados é um fator chave para determinar o desempenho do modelo. Marque com precisão, consistente e completamente.

    1. Tag precisemente: Marque sempre cada entidade para o seu tipo certo. Inclua apenas o que pretende extraído, evite dados desnecessários na sua etiqueta.
    2. Tag consistentemente: A mesma entidade deve ter a mesma etiqueta em todos os ficheiros.
    3. Tag completamente: Marque todas as instâncias da entidade em todos os seus ficheiros.
  3. Modelo de comboio: O seu modelo começa a aprender com os dados marcados.

  4. Ver os detalhes da avaliação do modelo: Após o treino estar concluído, veja os detalhes da avaliação do modelo e o seu desempenho.

  5. Melhorar o modelo: Depois de rever os detalhes da avaliação do modelo, pode ir em frente e aprender como pode melhorar o modelo.

  6. Implementar o modelo: A implantação de um modelo é para o disponibilizar para utilização.

  7. Entidades de extração: Utilize os seus modelos personalizados para tarefas de extração de entidades.

Passos seguintes

  • Utilize o artigo quickstart para começar a usar o reconhecimento de entidades com nome personalizado.

  • Ao percorrer o ciclo de vida de desenvolvimento de aplicações, reveja o glossário para saber mais sobre os termos utilizados ao longo da documentação para esta funcionalidade.

  • Lembre-se de ver os limites de serviço para informações como a disponibilidade regional.