O que é o Azure AI Document Intelligence?

Importante

  • As versões de visualização pública do Document Intelligence fornecem acesso antecipado a recursos que estão em desenvolvimento ativo.
  • Recursos, abordagens e processos podem mudar, antes da Disponibilidade Geral (GA), com base nos comentários dos usuários.
  • A versão de visualização pública das bibliotecas de cliente do Document Intelligence usa como padrão a versão 2024-02-29-preview.
  • A versão de pré-visualização pública 2024-02-29-preview está atualmente disponível apenas nas seguintes regiões do Azure:
  • E.U.A. Leste
  • Oeste dos EUA2
  • Europa Ocidental

Este conteúdo aplica-se a:marca de verificaçãov4.0 (pré-visualização) | Versões anteriores:Marca de verificação azulv3.1 (GA)Marca de verificação azulv3.0 (GA)Marca de verificação azulv2.1 (GA)

Este conteúdo aplica-se a:marca de verificaçãov3.1 (GA) | Última versão:marca de verificação roxav4.0 (visualização) | Versões anteriores:Marca de verificação azulv3.0Marca de verificação azulv2.1

Este conteúdo aplica-se a:marca de verificaçãov3.0 (GA) | Últimas versões:marca de verificação roxav4.0 (preview)marca de verificação roxav3.1 | Versão anterior:Marca de verificação azulv2.1

Este conteúdo aplica-se a:marca de verificaçãov2.1 | Última versão:Marca de verificação azulv4.0 (pré-visualização)

Nota

O Form Recognizer agora é o Azure AI Document Intelligence!

  • A partir de julho de 2023, os serviços de IA do Azure abrangem todos os que eram anteriormente conhecidos como Serviços Cognitivos e Serviços de IA Aplicada do Azure.
  • Não há alterações nos preços.
  • Os nomes Serviços Cognitivos e IA Aplicada do Azure continuam a ser usados na faturação do Azure, na análise de custos, na lista de preços e nas APIs de preços.
  • Não há alterações significativas nas interfaces de programação de aplicativos (APIs) ou SDKs antes e incluindo a v3.1. A partir da v4.0, APIs e SDKs são atualizados para Document Intelligence.
  • Algumas plataformas ainda aguardam a atualização de renomeação. Todas as menções ao Reconhecedor de Formulários ou Inteligência de Documentos em nossa documentação referem-se ao mesmo serviço do Azure.

O Azure AI Document Intelligence é um serviço de IA do Azure baseado na nuvem que lhe permite criar soluções inteligentes de processamento de documentos. Grandes quantidades de dados, abrangendo uma grande variedade de tipos de dados, são armazenadas em formulários e documentos. A Inteligência Documental permite-lhe gerir eficazmente a velocidade a que os dados são recolhidos e processados e é fundamental para melhorar as operações, tomar decisões informadas baseadas em dados e inovar de forma esclarecida.

| ✔️ Modelos de análise de documentos | ✔️ Modelos pré-construídos | ✔️ Modelos personalizados |

Modelos de análise de documentos

Os modelos de análise de documentos permitem a extração de texto de formulários e documentos e retornam conteúdo estruturado pronto para os negócios pronto para a ação, uso ou progresso da sua organização.


Ler | Extraia texto impresso
e manuscrito.


Layout | Extraia texto,
tabelas e estrutura do documento.


Ler | Extraia texto impresso
e manuscrito.


Layout | Extraia texto,
tabelas e estrutura do documento.


Documento geral | Extraia texto,
estrutura e pares chave-valor.

Modelos pré-criados

Os modelos pré-construídos permitem-lhe adicionar processamento inteligente de documentos às suas aplicações e fluxos sem ter de treinar e construir os seus próprios modelos.


Fatura | Extraia detalhes de clientes
e fornecedores.


Recibo | Extraia detalhes da transação de vendas
.


Identidade | Extraia detalhes de identificação
e verificação.


EULA 1003 | Extraia detalhes da hipoteca.


Formulário 1008 | Extraia detalhes da hipoteca.


Divulgação de Encerramento | Extraia detalhes da hipoteca.


Cartão de seguro de saúde | Extraia detalhes do seguro de saúde
.


Contrato | Extraia os detalhes do contrato
e da parte.


Cartão de crédito/débito | Extraia informações de cartões bancários.


Certidão de Casamento | Extraia informações de certidões de casamento.


Formulário W-2 de imposto dos EUA | Extraia detalhes da compensação tributável
.


Formulário US Tax 1098 | Extraia detalhes de juros de hipoteca.


Formulário US Tax 1098-E | Extraia detalhes de juros de empréstimos estudantis.


Formulário US Tax 1098-T | Extraia detalhes de aulas qualificadas.


Formulário US Tax 1099 | Extraia informações de variações do formulário 1099.


Formulário US Tax 1040 | Extraia informações de variações do formulário 1040.


Fatura | Extraia detalhes de clientes
e fornecedores.


Recibo | Extraia detalhes da transação de vendas
.


Identidade | Extraia detalhes de identificação
e verificação.


Cartão de seguro de saúde | Extraia detalhes do seguro de saúde.


Cartão de visita | Extraia detalhes de contato comercial.


Contrato | Extraia os detalhes do contrato
e da parte.


Formulário W-2 de imposto dos EUA | Extraia detalhes da compensação tributável
.


Formulário US Tax 1098 | Extraia detalhes de juros de hipoteca.


Formulário US Tax 1098-E | Extraia detalhes de juros de empréstimos estudantis.


Formulário US Tax 1098-T | Extraia detalhes de aulas qualificadas.

Modelos personalizados

  • Os modelos personalizados são treinados usando seus conjuntos de dados rotulados para extrair dados distintos de formulários e documentos, específicos para seus casos de uso.
  • Modelos personalizados independentes podem ser combinados para criar modelos compostos.
  • Modelos
    ✔️ de extração Os modelos de extração personalizados são treinados para extrair campos rotulados de documentos.


Modelo personalizado | Extraia dados de layouts estáticos.


Neural personalizado | Extraia dados de documentos de tipo misto.


Composto à medida | Extraia dados usando uma coleção de modelos.

  • Modelo de classificação
    ✔️ Os classificadores personalizados identificam os tipos de documentos antes de invocar um modelo de extração.


Classificador personalizado | Identifique os tipos de documentos designados (classes)
antes de invocar um modelo de extração.

Capacidades adicionais

O Document Intelligence suporta recursos opcionais que podem ser habilitados e desabilitados dependendo do cenário de extração de documentos. Os seguintes recursos complementares estão disponíveis para 2023-07-31 (GA) versões posteriores:

O Document Intelligence suporta recursos opcionais que podem ser habilitados e desabilitados dependendo do cenário de extração de documentos. Os seguintes recursos complementares estão disponíveis para2024-02-29-preview, 2023-10-31-previewe versões posteriores:

Recursos de análise

Model ID Extração de conteúdo Campos de consulta Parágrafos Funções de parágrafo Marcas de seleção Tabelas Pares chave-valor Idiomas Códigos de barras Análise Documental Fórmulas* Fonte de estilo* Alta resolução*
leitura pré-embutida O O O O O
layout pré-construído O O O O O
documento pré-construído O O O O O
cartão de visita pré-construído
contrato pré-construído O O O O O
prebuilt-healthInsuranceCard.us O O O O O
prebuilt-idDocument O O O O O
fatura pré-embutida O O O O O O
recibo pré-embutido O O O O O
prebuilt-marriageCertificate.us O O O O O
cartão de crédito pré-construído O O O O O
pré-construído-hipoteca.us.1003 O O O O O
pré-construído-hipoteca.pt.1008 O O O O O
prebuilt-mortgage.us.closingDivulgação O O O O O
pré-construído-tax.us.w2 O O O O O
pré-construído-tax.us.1098 O O O O O
pré-construído-tax.us.1098E O O O O O
pré-construído-tax.us.1098T O O O O O
prebuilt-tax.us.1099(variações) O O O O O
prebuilt-tax.us.1040(variações) O O O O O
{ customModelName } O O O O O

✓ - Ativado
O - Opcional
* - Os recursos Premium incorrem em custos extras

Modelos e opções de desenvolvimento

Nota

Os seguintes modelos de compreensão de documentos e opções de desenvolvimento são suportados pelo serviço de Inteligência de Documentos v3.0.

Você pode usar a Inteligência Documental para automatizar o processamento de documentos em aplicativos e fluxos de trabalho, aprimorar estratégias orientadas por dados e enriquecer os recursos de pesquisa de documentos. Use os links na tabela para saber mais sobre cada modelo e procurar opções de desenvolvimento.

Lida

Captura de tela da análise do modelo de leitura usando o Document Intelligence Studio.

Model ID Description Casos de uso de automação Opções de desenvolvimento
leitura pré-embutida ● Extraia texto de documentos.
● Extração de dados
● Digitalização de qualquer documento.
● Compliance e auditoria.
● Processamento de notas manuscritas antes da tradução.
● Document Intelligence Studio
API REST
C# SDK
Python SDK
Java SDK
● JavaScript

Esquema

Captura de tela da análise do modelo de layout usando o Document Intelligence Studio.

Model ID Description Casos de uso de automação Opções de desenvolvimento
layout pré-construído ● Extraia texto e informações de layout de documentos.
● Extração de dados
● Indexação e recuperação de documentos por estrutura.
● Análise de relatórios financeiros e médicos.
● Document Intelligence Studio
API REST
C# SDK
Python SDK
Java SDK
● JavaScript

Documento geral (preterido em 2023-10-31-preview)

Captura de tela da análise do modelo de documento geral usando o Document Intelligence Studio.

Model ID Description Casos de uso de automação Opções de desenvolvimento
documento pré-construído ● Extraia texto, layout e pares chave-valor de documentos.
● Extração de dados e campo
● Extração de par chave-valor.
● Processamento de formulários.
● Recolha e análise de dados de inquéritos.
● Estúdio de Inteligência Documental
API REST

Invoice

Captura de tela da análise do modelo de fatura usando o Document Intelligence Studio.

Model ID Description Casos de uso de automação Opções de desenvolvimento
fatura pré-embutida ● Extraia informações importantes de faturas.
● Extração de dados e campo
● Processamento de contas a pagar.
● Registo e relatórios fiscais automatizados.
● Document Intelligence Studio
API REST
C# SDK
Python SDK
Java SDK
● JavaScript

Recibo

Captura de tela da análise do modelo de recibo usando o Document Intelligence Studio.

Model ID Description Casos de uso de automação Opções de desenvolvimento
recibo pré-embutido ● Extraia informações importantes de recibos.
● Extração
de dados e campo● O modelo de recibo v3.0 suporta o processamento de recibos de hotel de página única.
● Gestão de despesas.
● Análise de dados de comportamento do consumidor.
● Programa de fidelização de clientes.
● Processamento de devolução de mercadorias.
● Registo e relatórios fiscais automatizados.
● Document Intelligence Studio
API REST
C# SDK
Python SDK
Java SDK
● JavaScript

Identidade (ID)

Captura de tela da análise do modelo de documento de identidade (ID) usando o Document Intelligence Studio.

Model ID Description Casos de uso de automação Opções de desenvolvimento
prebuilt-idDocument ● Extraia informações importantes de passaportes e bilhetes de identidade.
● Tipos
de documentos● Extraia endossos, restrições e classificações de veículos das carteiras de motorista dos EUA.
● Conheça a conformidade com
as diretrizes de serviços financeiros do seu cliente (KYC).● Gestão de contas médicas.
● Pontos de verificação de identidade e gateways.
● Registo de hotel.
● Document Intelligence Studio
API REST
C# SDK
Python SDK
Java SDK
● JavaScript

Cartão de seguro de doença

Captura de tela da análise do modelo de cartão de seguro de saúde usando o Document Intelligence Studio.

Model ID Description Casos de uso de automação Opções de desenvolvimento
prebuilt-healthInsuranceCard.us ● Extraia informações importantes dos cartões de seguro de saúde dos EUA.
● Extração de dados e campo
● Cobertura e verificação de elegibilidade.
● Modelagem preditiva.
● Análise baseada em valor.
● Document Intelligence Studio
API REST
C# SDK
Python SDK
Java SDK
● JavaScript

Modelo de contrato

Captura de tela da extração do modelo de contrato usando o Document Intelligence Studio.

Model ID Description Opções de desenvolvimento
contrato pré-construído Extraia o contrato e os detalhes da parte. ● Estúdio de Inteligência Documental
API REST

Modelo W-2 Fiscal dos EUA

Captura de tela da análise do modelo W-2 usando o Document Intelligence Studio.

Model ID Description Casos de uso de automação Opções de desenvolvimento
pré-construído-tax.us.W-2 ● Extraia as principais informações dos formulários fiscais W2 do IRS US (ano 2018-2021).
● Extração de dados e campo
● Gestão automatizada de documentos fiscais.
● Processamento de pedidos de crédito hipotecário.
● Document Intelligence Studio
API REST
C# SDK
Python SDK
Java SDK
● JavaScript

Formulário 1098 de imposto dos EUA

Captura de tela do formulário de imposto US 1098 analisado no Document Intelligence Studio.

Model ID Description Opções de desenvolvimento
pré-construído-tax.us.1098 Extraia informações e detalhes sobre juros de hipotecas. ● Estúdio de Inteligência Documental
API REST

Formulário 1098-E de imposto dos EUA

Captura de tela do formulário de imposto US 1098-E analisado no Document Intelligence Studio.

Model ID Description Opções de desenvolvimento
pré-construído-tax.us.1098E Extraia informações e detalhes sobre empréstimos estudantis. ● Estúdio de Inteligência Documental
API REST

Formulário 1098-T de imposto dos EUA

Captura de tela do formulário de imposto US 1098-T analisado no Document Intelligence Studio.

Model ID Description Opções de desenvolvimento
pré-construído-tax.us.1098T Extraia informações e detalhes de matrículas. ● Estúdio de Inteligência Documental
API REST

Formulário 1099 (e Variações) do imposto dos EUA

Captura de tela do formulário de imposto US 1099 analisado no Document Intelligence Studio.

Model ID Description Opções de desenvolvimento
prebuilt-tax.us.1099(Variações) Extraia informações de variações de 1099 formulários. ● Estúdio de Inteligência Documental
API REST

Cartão de visita

Captura de tela da análise do modelo de cartão de visita usando o Document Intelligence Studio.

Model ID Description Casos de uso de automação Opções de desenvolvimento
cartão de visita pré-construído ● Extraia informações importantes de cartões de visita.
● Extração de dados e campo
● Liderança de vendas e gestão de marketing. ● Document Intelligence Studio
API REST
C# SDK
Python SDK
Java SDK
● JavaScript

Visão geral do modelo personalizado

Captura de tela do treinamento de modelo personalizado usando o Document Intelligence Studio.

Sobre Description Casos de uso de automação Opções de desenvolvimento
Modelo personalizado Extrai informações de formulários e documentos em dados estruturados com base em um modelo criado a partir de um conjunto de conjuntos de documentos de treinamento representativos. Extraia dados distintos de formulários e documentos específicos para o seu negócio e casos de uso. ● Document Intelligence Studio
API REST
C# SDK
Java SDK
JavaScript SDK
Python SDK

Modelo personalizado

Captura de tela da análise do modelo de modelo personalizado usando o Document Intelligence Studio.

Nota

Para treinar um modelo de modelo personalizado, defina a buildMode propriedade como template. Para obter mais informações, consulteTreinamento de um modelo de modelo

Sobre Description Casos de uso de automação Opções de desenvolvimento
Modelo de modelo personalizado O modelo de modelo personalizado extrai valores e campos rotulados de documentos estruturados e semiestruturados.
Extraia dados-chave de documentos altamente estruturados com modelos visuais definidos ou layouts visuais comuns, formulários. ● Document Intelligence Studio
API REST
C# SDK
Python SDK
Java SDK
JavaScript SDK

Neural personalizado

Captura de tela da análise do modelo neural personalizado usando o Document Intelligence Studio.

Nota

Para treinar um modelo neural personalizado, defina a buildMode propriedade como neural. Para obter mais informações, consulteTreinando um modelo neural

Sobre Description Casos de uso de automação Opções de desenvolvimento
Modelo neural personalizado O modelo neural personalizado é usado para extrair dados rotulados de documentos estruturados (pesquisas, questionários), semiestruturados (faturas, ordens de compra) e não estruturados (contratos, cartas). Extraia dados de texto, caixas de seleção e campos tabulares de documentos estruturados e não estruturados. Document Intelligence Studio
API REST
C# SDK
Java SDK
JavaScript SDK
Python SDK

Composição personalizada

Captura de ecrã da lista de modelos personalizados compostos no Document Intelligence Studio.

Sobre Description Casos de uso de automação Opções de desenvolvimento
Modelos personalizados compostos Um modelo composto é criado pegando uma coleção de modelos personalizados e atribuindo-os a um único modelo criado a partir de seus tipos de formulário. Útil quando você treina vários modelos e deseja agrupá-los para analisar tipos de formulário semelhantes, como ordens de compra. ● Document Intelligence Studio
API REST
C# SDK
Java SDK
JavaScript SDK
Python SDK

Modelo de classificação personalizado

{alt-text}

Sobre Description Casos de uso de automação Opções de desenvolvimento
Modelo de classificação composto Os modelos de classificação personalizados combinam recursos de layout e idioma para detetar, identificar e classificar documentos em um arquivo de entrada. ● Um pacote de pedido de empréstimo contendo formulário de inscrição, holerite e extrato bancário.
● Uma coleção de faturas digitalizadas.
● Estúdio de Inteligência Documental
API REST

O Azure AI Document Intelligence é um serviço de IA do Azure baseado na nuvem para desenvolvedores criarem soluções inteligentes de processamento de documentos. O Document Intelligence aplica tecnologias de reconhecimento ótico de caracteres (OCR) e compreensão de documentos baseadas em aprendizado de máquina para extrair texto, tabelas, estrutura e pares chave-valor de documentos. Você também pode rotular e treinar modelos personalizados para automatizar a extração de dados de documentos estruturados, semiestruturados e não estruturados. Para saber mais sobre cada modelo, consulte os artigos Conceitos:

Tipo de modelo Nome do modelo
Modelo de análise documental ● Modelo de análise de layout
Modelos pré-construídos ● Modelo
de fatura●
Modelo de recibo
Modelo
de documento de identidade (ID)● Modelo de cartão de visita

Modelos à medida ● Modelo personalizado
Modelo composto

Este conteúdo aplica-se a:marca de verificaçãov2.1 | Última versão:Marca de verificação azulv4.0 (pré-visualização)

Modelos de inteligência documental e opções de desenvolvimento

Gorjeta

  • Para uma experiência melhorada e uma qualidade de modelo avançada, experimente o Document Intelligence v3.0 Studio.
  • O v3.0 Studio suporta qualquer modelo treinado com dados rotulados v2.1.
  • Você pode consultar o guia de migração de API para obter informações detalhadas sobre a migração da v2.1 para a v3.0.

Nota

Os seguintes modelos e opções de desenvolvimento são suportados pelo serviço Document Intelligence v2.1.

Use os links na tabela para saber mais sobre cada modelo e navegue pelas referências da API:

Modelo Description Opções de desenvolvimento
Análise de layout Extração e análise de texto, marcas de seleção, tabelas e coordenadas de caixas delimitadoras, de formulários e documentos. ● Ferramenta
de etiquetagem de Inteligência Documental●
API REST
SDK de biblioteca cliente●
Contêiner Docker de Inteligência Documental
Modelo personalizado Extração e análise de dados de formulários e documentos específicos para distintos dados de negócios e casos de uso. ● Ferramenta
de etiquetagem de inteligência documental●
API REST

Ferramenta
de etiquetagem de amostras● Contêiner Docker de inteligência de documentos
Modelo de fatura Processamento automatizado de dados e extração de informações-chave de faturas de vendas. ● Ferramenta
de etiquetagem de Inteligência Documental●
API REST
SDK de biblioteca cliente●
Contêiner Docker de Inteligência Documental
Modelo de recibo Processamento automatizado de dados e extração de informações-chave de recibos de vendas. ● Ferramenta
de etiquetagem de Inteligência Documental●
API REST
SDK de biblioteca cliente●
Contêiner Docker de Inteligência Documental
Modelo de documento de identidade (ID) Processamento automatizado de dados e extração de informações-chave de carteiras de motorista dos EUA e passaportes internacionais. ● Ferramenta
de etiquetagem de Inteligência Documental●
API REST
SDK de biblioteca cliente●
Contêiner Docker de Inteligência Documental
Modelo de cartão de visita Processamento automatizado de dados e extração de informações-chave de cartões de visita. ● Ferramenta
de etiquetagem de Inteligência Documental●
API REST
SDK de biblioteca cliente●
Contêiner Docker de Inteligência Documental

Privacidade e segurança dos dados

Como acontece com todos os serviços de IA, os desenvolvedores que usam o serviço de Inteligência Documental devem estar cientes das políticas da Microsoft sobre dados de clientes. Consulte a nossa página Dados, privacidade e segurança para Inteligência Documental.

Próximos passos

  • Tente processar seus próprios formulários e documentos com a ferramenta Document Intelligence Sample Labeling.

  • Conclua um início rápido do Document Intelligence e comece a criar um aplicativo de processamento de documentos na linguagem de desenvolvimento de sua escolha.