Introdução à análise de recibo no Azure

Concluído

A IA do Azure para Informação de Documentos consiste em recursos agrupados por tipos de modelo:

  • Modelos predefinidos: modelos pré-treinados criados para processar tipos de documentos comuns, como faturas, cartões de visita, documentos de identificação e outros. Esses modelos são projetados para reconhecer e extrair campos específicos que são importantes para cada tipo de documento.
  • Modelos personalizados: podem ser treinados para identificar campos específicos que não estão incluídos nos modelos pré-treinados existentes.
  • Análise de documentos: análise geral de documentos que retorna representações de dados estruturados, incluindo regiões de interesse e suas inter-relações.

Modelos predefinidos

Os modelos predefinidos aplicam aprendizado de máquina avançado para identificar e extrair com precisão texto, pares de valores-chave, tabelas e estruturas de formulários e documentos. Esses recursos incluem a extração de:

  • detalhes de clientes e fornecedores de faturas
  • detalhes de vendas e transações de recibos
  • detalhes de identificação e verificação de documentos de identidade
  • detalhes de planos de saúde
  • detalhes de contatos comerciais
  • detalhes de contratos e partes de contratos
  • remuneração tributável, juros hipotecários, detalhes de empréstimos estudantis e muito mais

Por exemplo, considere o modelo de recibo predefinido. Ele processa os recibos por:

  • Correspondência entre nomes de campos e valores
  • Identificação de tabelas de dados
  • Identificação de campos específicos, como datas, números de telefone, endereços, totais e outros

O modelo de recibo foi treinado para reconhecer dados em vários tipos de recibos diferentes, como recibos térmicos (impressos em papel sensível ao calor), recibos de hotel, recibos de gás, recibos de cartão de crédito e recibos de estacionamento.

Os campos reconhecidos incluem:

  • Nome, endereço e número de telefone do comerciante
  • Data e hora da compra
  • Nome, quantidade e preço de cada item comprado
  • Total, subtotais e valores de impostos

Cada campo e par de dados tem um nível de confiança, indicando o provável nível de precisão. Isso poderia ser utilizado para identificar automaticamente quando uma pessoa precisa verificar um recibo.

O modelo foi treinado para reconhecer vários idiomas diferentes, dependendo do tipo de recibo. Para obter melhores resultados ao usar o modelo de recibo predefinido, as imagens devem ser:

  • formato JPEG, PNG, BMP, PDF ou TIFF
  • Tamanho do arquivo inferior a 500 MB para a camada paga (S0) e 4 MB para a camada gratuita (F0)
  • Entre 50 x 50 pixels e 10.000 x 10.000 pixels
  • Para documentos em PDF, não maior do que 17 polegadas x 17 polegadas
  • Um recibo por documento

Você pode começar a treinar modelos no Estúdio de Informação de Documentos, uma interface de usuário para testar a análise de documentos, modelos predefinidos e criar modelos personalizados.

Recurso da IA do Azure para Informação de Documentos

Para usar a IA do Azure para Informação de Documentos, crie um recurso Informação de Documentação ou Serviços de IA do Azure na sua assinatura do Azure. Se você não tiver utilizado a Informação de Documentação antes, selecione a camada gratuita ao criar o recurso. Há algumas restrições na camada gratuita, por exemplo, apenas as duas primeiras páginas são processadas para documentos PDF ou TIFF.

Depois que o recurso for criado, você poderá criar aplicativos clientes que utilizem sua chave e ponto de extremidade para conectar formulários para análise ou usar o recurso no Estúdio de Informação de Documentos.