Exploración de funcionalidades de inteligencia de documentos

Completado

La inteligencia de documentos se basa en modelos de aprendizaje automático entrenados para reconocer datos en texto. La capacidad de extraer pares de texto, diseño y clave-valor se conoce como análisis de documentos. El análisis de documentos proporciona ubicaciones de texto en una página identificada mediante coordenadas de cuadro de límite.

A screenshot of a scanned receipt for the purchase of a Surface Pro and a Surface Pen.

Por ejemplo, la información de en el recibo 123 Main Street se guarda comokey, address y un value, 123 Main Street. El análisis de documentos podría registrar la ubicación del valor del campo como coordenadas de cuadro de límite [4.1, 2.2], [4.3, 2.2], [4.3, 2.4], [4.1, 2.4]. Los modelos de Machine Learning pueden interpretar los datos de un documento o formulario porque están entrenados para reconocer patrones en ubicaciones de coordenadas de cuadro de límite y texto.

Un desafío para automatizar el proceso de análisis de documentos es que los formularios y documentos vienen en todos los formatos diferentes. Por ejemplo, aunque los formularios fiscales y los documentos del carné de conducir incluyen el nombre de un individuo, las coordenadas del cuadro de límite para el nombre no son las mismas. Es necesario entrenar modelos de aprendizaje automático independientes para proporcionar resultados de alta calidad para diferentes formularios y documentos. De este modo, a veces es posible que pueda usar modelos de aprendizaje automático creados previamente que se han entrenado en formatos de documento usados habitualmente. En otras ocasiones, es posible que tenga que personalizar un modelo de Machine Learning para reconocer un formato de documento único.

La automatización del proceso de lectura de texto y el registro de datos puede acelerar las operaciones, crear mejores experiencias para los clientes, mejorar la toma de decisiones y mucho más. A continuación, explorará cómo usar los servicios de Azure AI para implementar la inteligencia de documentos.