Modelos personalizados y compuestos de Form Recognizer

Form Recognizer emplea tecnología avanzada de aprendizaje automático para detectar y extraer información de imágenes de documento y devolver los datos extraídos en una salida JSON estructurada. Con Form Recognizer, puede entrenar modelos personalizados independientes o combinar modelos personalizados para crear modelos compuestos.

  • Modelos personalizados. Los modelos personalizados de Form Recognizer permiten analizar y extraer datos de formularios y documentos específicos de su negocio. Los modelos personalizados se entrenan para sus distintos datos y casos de uso.

  • Modelos compuestos. El modelo compuesto se crea tomando una colección de modelos personalizados y asignándolos a un único modelo que abarca sus tipos de formulario. Cuando se envía un documento a un modelo compuesto, el servicio realiza un paso de clasificación para decidir qué modelo personalizado representa con exactitud el formulario presentado para el análisis.

Captura de pantalla: ventana de análisis de un formulario personalizado de la herramienta Form Recognizer.

¿Qué es un dominio personalizado?

Un modelo personalizado es un programa de aprendizaje automático entrenado para reconocer campos de formulario dentro de su contenido distinto y extraer pares clave-valor y datos de tabla. Solo necesita cinco ejemplos del mismo tipo de formulario para empezar y el modelo personalizado se puede entrenar con o sin conjuntos de datos etiquetados.

¿Qué es un modelo compuesto?

Con los modelos compuestos, puede asignar varios modelos personalizados a un modelo compuesto llamado con un único identificador de modelo. Resulta útil cuando se han entrenado varios modelos y se quieren agrupar para analizar tipos de formulario parecidos. Por ejemplo, el modelo compuesto puede incluir modelos personalizados entrenados para analizar sus pedidos de compra de suministros, equipos y mobiliario. En lugar de intentar seleccionar manualmente el modelo adecuado, puede usar un modelo compuesto para determinar el modelo personalizado adecuado para cada análisis y extracción.

Opciones de desarrollo

Los siguientes recursos son compatibles con Form Recognizer v2.1:

Característica Recursos
Modelo personalizado

Los siguientes recursos son compatibles con Form Recognizer v3.0:

Característica Recursos
Modelo personalizado

Probar Form Recognizer

Vea cómo se extraen los datos de los documentos específicos o únicos mediante modelos personalizados. Necesitará lo siguiente:

  • Una suscripción a Azure: puede crear una cuenta gratuita

  • Una instancia de Form Recognizer en Azure Portal. Puede usar el plan de tarifa gratuito (F0) para probar el servicio. Después de implementar el recurso, seleccione Ir al recurso para obtener la clave de API y el punto de conexión.

Captura de pantalla: claves y ubicación del punto de conexión en Azure Portal.

Form Recognizer Studio (versión preliminar)

Nota

Form Recognizer Studio está disponible con la API de versión preliminar (v3.0).

  1. En la página principal de Form Recognizer Studio, seleccione Formulario personalizado.

  2. En Mis proyectos, seleccione + Crear un proyecto.

  3. Complete los campos de detalles del proyecto.

  4. Configure la cuenta de servicio.

  5. Agregue la cuenta de almacenamiento y el contenedor de blobs para conectar el origen de datos de entrenamiento.

  6. Revise y cree el proyecto.

  7. Se ha proporcionado un conjunto de documentos de ejemplo para que compile y pruebe el modelo personalizado.

Herramienta de etiquetado de muestras

Necesitará un conjunto de al menos seis formularios del mismo tipo. Usará estos datos para entrenar el modelo y probar un formulario. Puede usar nuestro conjunto de datos de ejemplo. Descargue y extraiga el sample_data.zip y, a continuación, cargue el contenido en el contenedor de Azure Blob Storage.

En la interfaz de usuario de Form Recognizer:

  1. En la página principal de la herramienta de etiquetado de ejemplo, seleccione Use Custom to train a model with labels and get key value pairs (usar personalizado para entrenar un modelo con etiquetas y obtener pares clave-valor).

    Captura de pantalla: selección de la herramienta FOTT de la opción personalizada.

  2. En la ventana siguiente, seleccione Nuevo proyecto:

    Captura de pantalla: selección de FOTTtools selecciona del nuevo proyecto.

    Para obtener instrucciones más detalladas, consulte nuestro inicio rápido de la herramienta de etiquetado de ejemplo.

Requisitos de entrada

  • Para obtener unos resultados óptimos, proporcione una foto clara o una digitalización de alta calidad por documento.

  • Formatos de archivo admitidos: JPEG, PNG, BMP, TIFF y PDF (texto insertado o digitalizado). Los PDF insertados de texto son mejores para eliminar la posibilidad de error en la extracción de caracteres y en la ubicación.

  • En el caso de PDF y TIFF, se pueden procesar hasta 2000 páginas (con una suscripción de nivel gratuito, solo se procesan las dos primeras páginas).

  • El tamaño del archivo debe ser inferior a 50 MB.

  • Las imágenes deben tener unas dimensiones entre 50 x 50 píxeles y 10 000 x 10 000 píxeles.

  • Los archivos PDF tienen unas dimensiones de hasta 17 x 17 pulgadas, lo que corresponde a los tamaños de papel Legal o A3, o más pequeños.

  • El tamaño total de los datos de entrenamiento es de 500 páginas o menos.

  • Si los archivos PDF están bloqueados con contraseña, debe desbloquearlos antes de enviarlos.

  • Para un aprendizaje sin supervisión (sin datos etiquetados):

    • Los datos deben contener claves y valores.
    • Las claves deben aparecer por encima o a la izquierda de los valores; no pueden aparecer por debajo ni a la derecha.

    Sugerencia

    Datos de aprendizaje

    • Si es posible, use documentos PDF de texto en lugar de documentos basados en imágenes. Los archivos PDF digitalizados se tratan como imágenes.
    • En el caso de los formularios rellenados, use ejemplos en los que estén todos los campos rellenados.
    • Use formularios con valores distintos en cada campo.
    • Si las imágenes de los formularios son de menor calidad, use un conjunto de datos más grande (con entre 10 y 15 imágenes, por ejemplo).

Nota

La herramienta de etiquetado de ejemplo no admite el formato de archivo BMP. Se trata de una limitación de la herramienta, no del servicio Form Recognizer.

Idiomas y configuraciones regionales compatibles

La versión preliminar de Form Recognizer presenta compatibilidad de idioma adicional para los modelos personalizados. Consulte nuestra compatibilidad de idioma para obtener una lista completa de textos manuscritos e impresos compatibles.

Versión preliminar de Form Recognizer v3.0

Form Recognizer v3.0 (versión preliminar) presenta varias características y funcionalidades nuevas:

  • La API del modelo personalizado (v3.0) admite la detección de firmas de formularios personalizados. Al entrenar modelos personalizados, puede especificar determinados campos como firmas. Cuando se analiza un documento con el modelo personalizado, indicará si se ha detectado o no una firma.

  • Siga nuestra guía de migración de Form Recognizer v3.0 para obtener información sobre cómo usar la versión preliminar en las aplicaciones y flujos de trabajo.

  • Explore nuestra API de REST (versión preliminar) para obtener más información sobre la versión preliminar y las nuevas funcionalidades.

Prueba de la detección de firmas

  1. Creación del conjunto de datos de aprendizaje.

  2. Vaya a Form Recognizer Studio y seleccione Formulario personalizado en Modelos personalizados:

    Captura de pantalla: Form Recognizer Studio selecciona una página de formulario personalizada.

  3. Siga el flujo de trabajo para crear un proyecto:

  4. Siga los Requisitos de entrada del modelo personalizado.

  5. Etiquete los documentos. Para los campos de firma, se recomienda usar el etiquetado de región para mejorar la precisión.

  6. Etiquete los documentos. Para los campos de firma, se recomienda usar el etiquetado de región para mejorar la precisión.

    Captura de pantalla: Campo de firma de etiqueta.

Una vez etiquetado el conjunto de entrenamiento, puede entrenar el modelo personalizado y usarlo para analizar documentos. Los campos de firma especificarán si se detectó o no una firma.

Pasos siguientes