Introducción: Form Recognizer Studio | Versión preliminar
Nota
Form Recognizer Studio está actualmente en versión preliminar pública. Es posible que algunas características no se admitan o que tengan funcionalidades limitadas.
La versión preliminar de Form Recognizer Studio es una herramienta en línea para explorar, comprender e integrar visualmente características del servicio Form Recognizer en las aplicaciones. Comience con la exploración de los modelos previamente entrenados con documentos de ejemplo o los suyos propios. Cree proyectos para crear modelos de formulario personalizados y haga referencia a los modelos en las aplicaciones mediante la versión preliminar del SDK de Python y otros inicios rápidos.
Migración desde la herramienta de etiquetado de ejemplo
Si es un usuario anterior de la herramienta de etiquetado de ejemplo, omita los requisitos previos para iniciar sesión en la versión preliminar de Studio para usar su cuenta de Azure existente y los recursos de Form Recognizer o Cognitive Services con Studio.
Para migrar los proyectos personalizados existentes a Studio, vaya a la sección Introducción al modelo personalizado para crear un proyecto y dirigirlo a la misma ubicación de Azure Blob Storage, suponiendo que tenga acceso a él en Azure. Una vez que configure un nuevo proyecto, Studio cargará todos los documentos y archivos provisionales para el etiquetado y el entrenamiento.
Requisitos previos mínimos para nuevos usuarios
- Una cuenta de Azure activa. En caso de no tener ninguna, puede crear una cuenta gratuita.
- Un recurso de Form Recognizer o de servicios múltiples de Cognitive Services.
Requisitos previos adicionales para proyectos personalizados
Además de la cuenta de Azure y un recurso de Form Recognizer o Cognitive Services, necesitará:
Contenedor de Azure Blob Storage
Una cuenta de Azure Blob Storage con un rendimiento estándar. Creará contenedores para almacenar y organizar los datos de los blobs en la cuenta de almacenamiento. Si no sabe cómo crear una cuenta de almacenamiento de Azure con un contenedor, siga estos inicios rápidos:
- Creación de una cuenta de almacenamiento. Al crear la cuenta de almacenamiento, asegúrese de seleccionar rendimiento Estándar en el campo Detalles de instancia → Rendimiento.
- Creación de un contenedor. Al crear un contenedor, establezca el campo Nivel de acceso público en Contenedor (acceso anónimo de lectura para contenedores y blobs) en la ventana Nuevo contenedor.
Configuración de CORS
CORS (uso compartido de recursos entre orígenes) debe configurarse en la cuenta de almacenamiento de Azure para que sea accesible desde Form Recognizer Studio. Para configurar CORS en Azure Portal, necesitará acceso a la hoja CORS de la cuenta de almacenamiento.
- Seleccione la hoja CORS de la cuenta de almacenamiento.
- Empiece por crear una nueva entrada de CORS en Blob service.
- Establezca Orígenes permitidos en https://formrecognizer.appliedai.azure.com .
- Seleccione las ocho opciones disponibles de Métodos permitidos.
- Apruebe todos los encabezados permitidos y los encabezados expuestos; para ello, escriba * en cada campo.
- Establezca la antigüedad máxima en 120 segundos o cualquier valor aceptable.
- Haga clic en el botón Guardar de la parte superior de la página para guardar los cambios.
CORS ahora debe estar configurado para usar la cuenta de almacenamiento de Form Recognizer Studio.
Conjunto de documentos de ejemplo
Vaya a Azure Portal y desplácese de la manera siguiente: Su cuenta de almacenamiento → Almacenamiento de datos → Contenedores
Seleccione un contenedor de la lista.
En el menú de la parte superior de la página, seleccione Cargar.
Aparece la ventana Cargar blob.
Seleccione los archivos que quiere cargar.
Nota
De manera predeterminada, Studio usará los documentos de formulario que se encuentran en la raíz del contenedor. Sin embargo, puede usar datos organizados en carpetas si se especifica en los pasos de creación del proyecto de formulario personalizado. Consulte Organización de los datos en subcarpetas (opcional).
Inicio de sesión en la versión preliminar de Form Recognizer Studio
Una vez completados los requisitos previos, vaya a la versión preliminar de Form Recognizer Studio.
Seleccione una característica del servicio Form Recognizer en la página principal de Studio.
Seleccione la suscripción de Azure, el grupo de recursos y el recurso. (los recursos se pueden cambiar en cualquier momento en "Configuración" en el menú superior).
Revise y confirme las selecciones.
Layout
En la vista Diseño:
Seleccione el comando Analizar para ejecutar el análisis de diseño en el documento de ejemplo o pruebe el documento mediante el comando Agregar.
Observe el texto extraído resaltado, los iconos de tabla que muestran las ubicaciones de tabla extraídas y las marcas de selección están resaltadas.
Use los controles de la parte inferior de la pantalla para acercar y alejar y girar la vista del documento.
Muestre y oculte las capas de texto, tablas y marcas de selección para centrarse en cada una de ellas a la vez.
En la pestaña Resultados de la sección de salida, examine la salida JSON para comprender el formato de respuesta del servicio. Copie y descargue para iniciar la integración.
Modelos creados previamente
Hay varios modelos creados precompilados entre los que elegir, cada uno de los cuales tiene su propio conjunto de campos admitidos. El modelo que se va a usar para la operación de análisis depende del tipo de documento que se va a analizar. Los modelos precompilados admitidos actualmente por el servicio Form Recognizer son los siguientes:
- 🆕 Documento general: análisis y extracción de texto, tablas, estructura, pares clave-valor y entidades con nombre.
- Factura: extrae texto, marcas de selección, tablas, pares clave-valor e información importante de las facturas.
- Recibo: extrae texto e información clave de los recibos.
- Documento de identificación: extrae texto e información clave de permisos de conducir y pasaportes internacionales.
- Tarjeta de presentación: extrae texto e información importante de las tarjetas de presentación.
En la vista pregenerada:
En la página principal de Studio, seleccione uno de los modelos precompilados. En este ejemplo, se usa el modelo de factura.
Seleccione el comando Analizar para ejecutar el análisis en el documento de ejemplo o pruebe la factura mediante el comando Agregar.
En la sección de visualización, observe los campos y valores resaltados y los elementos de las líneas de la factura. También se muestran todo el texto y las tablas que se han extraído.
En la pestaña Campos de la sección de salida, observe los campos y valores enumerados y seleccione los elementos de línea que desea ver en un formato de tabla.
En la pestaña Resultados de la sección de salida, examine la salida JSON para comprender el formato de respuesta del servicio. Copie y descargue para iniciar la integración.
Conceptos básicos del modelo personalizado
Introducción
Para crear modelos personalizados, empiece por configurar el proyecto:
En la página principal de Studio, seleccione el proyecto de formulario personalizado para abrir la página principal del formulario personalizado.
Use el comando "Crear un proyecto" para iniciar el asistente para la configuración del nuevo proyecto.
Escriba los detalles del proyecto, seleccione la suscripción y el recurso de Azure y el contenedor de Azure Blob Storage que contiene los datos.
Revise y envíe los valores para crear el proyecto.
Flujo básico
Después del paso de creación del proyecto, en la fase del modelo personalizado:
En la vista de etiquetado, defina las etiquetas y sus tipos que le interesa extraer.
Seleccione el texto del documento y la etiqueta de la lista desplegable o el panel etiquetas.
Etiquete cuatro documentos más para tener al menos cinco documentos etiquetados.
Seleccione el comando Entrenar y escriba el nombre y la descripción del modelo para empezar a entrenar el modelo personalizado.
Una vez que el modelo esté listo, use el comando Probar para validarlo con los documentos de prueba y observar los resultados.
Otras características
Además, puede ver todos los modelos mediante la pestaña Modelos de la izquierda. En la vista de lista, seleccione los modelos para realizar las siguientes acciones:
Probar el modelo desde la vista de lista.
Usar el comando Eliminar para eliminar modelos que no son necesarios.
Descargar los detalles del modelo para su visualización sin conexión.
Seleccionar varios modelos y componerlos en un nuevo modelo que se usará en las aplicaciones.
Etiquetado como tablas
Al crear los modelos personalizados, es posible que tenga que extraer colecciones de datos de los documentos. Estas pueden aparecer en un par de formatos, usando tablas como patrón visual:
Recuento dinámico o variable de valores (filas) para un conjunto determinado de campos (columnas)
Colección específica de valores para un conjunto determinado de campos (columnas o filas)
Etiquetado como tabla dinámica
Use tablas dinámicas para extraer el recuento variable de valores (filas) para un conjunto determinado de campos (columnas):
Agregue una nueva etiqueta de tipo "Tabla", seleccione el tipo "Tabla dinámica" y asigne un nombre a la etiqueta.
Agregue el número de columnas (campos) y filas (para datos) que necesita.
Seleccione el texto de la página y, a continuación, elija la celda para asignar al texto. Repita el procedimiento para todas las filas y columnas de todas las páginas de todos los documentos.
Etiqueta como tabla fija
Use tablas fijas para extraer una colección específica de valores para un conjunto determinado de campos (columnas o filas):
Cree una nueva etiqueta de tipo "Tabla", seleccione el tipo "Tabla fija" y asigne un nombre a la etiqueta.
Agregue el número de columnas y filas que necesita para los dos conjuntos de campos.
Seleccione el texto de la página y, a continuación, elija la celda para asignar al texto. Repita el procedimiento para otros documentos.
Etiquetado para la detección de firmas
Para etiquetar para la detección de firmas:
En la vista de etiquetado, cree una nueva etiqueta de tipo "Firma" y asigne un nombre a la etiqueta.
Use el comando Región para crear una región rectangular en la ubicación esperada de la firma.
Seleccione la región dibujada y elija la etiqueta Tipo de firma para asignarla a la región dibujada. Repita el procedimiento para otros documentos.
Pasos siguientes
- Siga nuestra guía de migración de Form Recognizer v3.0 para ver las diferencias con respecto a la versión anterior de la API REST.
- Explore nuestros inicios rápidos del SDK de versión preliminar para ver las características en vista previa de las aplicaciones con los nuevos SDK.
- Consulte nuestros inicios rápidos de la API REST en versión preliminar para ver las características en vista previa con la nueva API REST.