Explorar funcionalidades da Informação de Documentos

2 minutos

A Informação de Documentos depende de modelos de machine learning treinados para reconhecer dados em texto. A capacidade de extrair pares de texto, layout e chave-valor é conhecida como análise de documentos. A análise de documentos fornece locais de texto em uma página identificados por coordenadas de caixas delimitadoras.

A screenshot of a scanned receipt for the purchase of a Surface Pro and a Surface Pen.

Por exemplo, as informações no recibo 123 Main Street são salvas como um key e address e um value e 123 Main Street. A análise de documentos pode registrar o local do valor do campo como coordenadas de caixas delimitadoras [4.1, 2.2], [4.3, 2.2], [4.3, 2.4], [4.1, 2.4]. Os modelos de machine learning podem interpretar os dados em um documento ou formulário porque são treinados para reconhecer padrões em locais de coordenadas de caixa delimitadora e texto.

Um desafio para automatizar o processo de análise de documentos é que formulários e documentos vêm em todo tipo de formato. Por exemplo, embora formulários fiscais e documentos de carteira de motorista incluam o nome de um indivíduo, as coordenadas de caixa delimitadora para o nome diferem. Modelos de machine learning separados precisam ser treinados para fornecer resultados de alta qualidade para diferentes formulários e documentos. Dessa forma, às vezes você pode usar modelos de machine learning predefinidos que foram treinados em formatos de documento comumente usados. Outras vezes, talvez seja necessário personalizar um modelo de machine learning para reconhecer um formato de documento exclusivo.

Automatizar o processo de leitura de texto e gravação de dados pode acelerar as operações, criar melhores experiências do cliente, melhorar a tomada de decisões e muito mais. Em seguida, você explorará como usar os serviços de IA do Azure para implementar a informação de documentos.

Continuar

Explorar funcionalidades da Informação de Documentos

Comentários