Treinar modelos com a ferramenta de etiquetagem de amostras

Este conteúdo aplica-se a:Document Intelligence v2.1 checkmarkv2.1.

Gorjeta

  • Para uma experiência melhorada e uma qualidade de modelo avançada, experimente o Document Intelligence v3.0 Studio.
  • O v3.0 Studio suporta qualquer modelo treinado com dados rotulados v2.1.
  • Você pode consultar o guia de migração de API para obter informações detalhadas sobre a migração da v2.1 para a v3.0.
  • Consulte nossos inícios rápidos da API REST ou C#, Java, JavaScript ou Python SDK para começar a usar a versão v3.0.

Neste artigo, você aprenderá como treinar seu modelo de modelo personalizado com tags de tabela (rótulos). Alguns cenários exigem rotulagem mais complexa do que simplesmente alinhar pares chave-valor. Tais cenários incluem extrair informações de formulários com estruturas hierárquicas complexas ou encontrar itens que não são automaticamente detetados e extraídos pelo serviço. Nesses casos, você pode usar tags de tabela para treinar seu modelo de modelo personalizado.

Quando devo usar tags de tabela?

Aqui estão alguns exemplos de quando o uso de tags de tabela seria apropriado:

  • Há dados que você deseja extrair apresentados como tabelas em seus formulários, e a estrutura das tabelas é significativa. Por exemplo, cada linha da tabela representa um item e cada coluna da linha representa um recurso específico desse item. Nesse caso, você pode usar uma marca de tabela onde uma coluna representa recursos e uma linha representa informações sobre cada recurso.
  • Há dados que você deseja extrair que não são apresentados em campos de formulário específicos, mas semanticamente, os dados podem caber em uma grade bidimensional. Por exemplo, seu formulário tem uma lista de pessoas e inclui um nome, um sobrenome e um endereço de e-mail. Você gostaria de extrair essas informações. Nesse caso, você pode usar uma tag de tabela com nome, sobrenome e endereço de e-mail como colunas e cada linha é preenchida com informações sobre uma pessoa da sua lista.

Nota

O Document Intelligence localiza e extrai automaticamente todas as tabelas em seus documentos, estejam elas marcadas ou não. Portanto, você não precisa rotular todas as tabelas do formulário com uma tag de tabela e as tags de tabela não precisam replicar a estrutura da tabela encontrada no formulário. As tabelas extraídas automaticamente pelo Document Intelligence serão incluídas na seção pageResults da saída JSON.

Criar uma etiqueta de tabela com a ferramenta Document Intelligence Sample Labeling

  • Determine se você deseja uma tag de tabela dinâmica ou de tamanho fixo. Se o número de linhas variar de documento para documento, use uma marca de tabela dinâmica. Se o número de linhas for consistente em todos os documentos, use uma tag de tabela de tamanho fixo.
  • Se a tag da tabela for dinâmica, defina os nomes das colunas e o tipo e formato de dados para cada coluna.
  • Se a tabela for de tamanho fixo, defina o nome da coluna, o nome da linha, o tipo de dados e o formato de cada tag. Configure a table tag

Rotular os dados da tag da tabela

  • Se o seu projeto tiver uma tag de tabela, você poderá abrir o painel de rotulagem e preencher a tag como faria com os campos chave-valor. Label with table tags

Próximos passos

Siga nosso guia de início rápido para treinar e usar seu modelo personalizado de Document Intelligence:

Consulte também