Modelo de factura de Form Recognizer
El modelo de factura combina funcionalidades de reconocimiento óptico de caracteres (OCR) eficaces con modelos de aprendizaje profundo para analizar y extraer campos clave y artículos de línea de recibos de ventas. Las facturas pueden ser de distintos formatos y tener diferentes grados de calidad, lo que incluye imágenes capturadas por un teléfono, documentos digitalizados y archivos PDF digitales. La API analiza el texto de las facturas; extrae información clave, como el nombre del cliente, la dirección de facturación, la fecha de vencimiento y el importe a pagar; y devuelve una representación de datos JSON estructurada.
Factura de ejemplo procesada con Form Recognizer Studio :
Opciones de desarrollo
Los siguientes recursos son compatibles con Form Recognizer v2.1:
| Característica | Recursos |
|---|---|
| Modelo de factura |
Los siguientes recursos son compatibles con Form Recognizer v3.0:
| Característica | Recursos | Id. de modelo |
|---|---|---|
| Modelo de factura | prebuilt-invoice |
Probar Form Recognizer
Vea cómo se extraen los datos, incluida la información del cliente, los detalles del proveedor y los elementos de línea, de las facturas mediante Form Recognizer Studio o nuestra herramienta de etiquetado de ejemplo. Necesitará lo siguiente:
Una suscripción a Azure: puede crear una cuenta gratuita
Una instancia de Form Recognizer en Azure Portal. Puede usar el plan de tarifa gratuito (
F0) para probar el servicio. Después de implementar el recurso, seleccione Ir al recurso para obtener la clave de API y el punto de conexión.
Form Recognizer Studio (versión preliminar)
En la página principal de Form Recognizer Studio, seleccione Facturas.
Puede analizar la factura de ejemplo o seleccionar el botón + Agregar para cargar un ejemplo propio.
Seleccione el botón Analizar:
Herramienta de etiquetado de muestras
Necesitará un documento de factura. Puede usar nuestro documento de factura de ejemplo.
En la página principal de la herramienta de etiquetado de ejemplo, seleccione Use prebuilt model to get data (Usar modelo precompilado para obtener datos).
Seleccione Factura en el menú desplegable Tipo de formulario:
Requisitos de entrada
- Para obtener unos resultados óptimos, proporcione una foto clara o una digitalización de alta calidad por documento.
- Formatos de archivo admitidos: JPEG, PNG, BMP, TIFF y PDF (texto insertado o digitalizado). Los PDF insertados de texto son mejores para eliminar la posibilidad de error en la extracción de caracteres y en la ubicación.
- En el caso de PDF y TIFF, se pueden procesar hasta 2000 páginas (con una suscripción de nivel gratuito, solo se procesan las dos primeras páginas).
- El tamaño del archivo debe ser inferior a 50 MB.
- Las imágenes deben tener unas dimensiones entre 50 x 50 píxeles y 10 000 x 10 000 píxeles.
- Los archivos PDF tienen unas dimensiones de hasta 17 x 17 pulgadas, lo que corresponde a los tamaños de papel Legal o A3, o más pequeños.
- El tamaño total de los datos de entrenamiento es de 500 páginas o menos.
- Si los archivos PDF están bloqueados con contraseña, debe desbloquearlos antes de enviarlos.
- Para un aprendizaje sin supervisión (sin datos etiquetados):
- Los datos deben contener claves y valores.
- Las claves deben aparecer por encima o a la izquierda de los valores; no pueden aparecer por debajo ni a la derecha.
Nota
La herramienta de etiquetado de ejemplo no admite el formato de archivo BMP. Se trata de una limitación de la herramienta, no del servicio Form Recognizer.
Idiomas y configuraciones regionales compatibles
| Modelo | Idioma: código de configuración local | Valor predeterminado |
|---|---|---|
| Factura |
|
Inglés (Estados Unidos): en-US |
Extracción de campos
| Nombre | Tipo | Descripción | Salida estandarizada |
|---|---|---|---|
| CustomerName | String | Cliente facturado | |
| CustomerId | String | Identificador de referencia del cliente | |
| PurchaseOrder | String | Número de referencia del pedido de compra | |
| InvoiceId | String | Identificador de esta factura concreta (a menudo "Número de factura") | |
| FechaFactura | Fecha | Fecha en que se generó la factura | aaaa-mm-dd |
| DueDate | Fecha | Fecha de vencimiento de esta factura | aaaa-mm-dd |
| VendorName | String | Nombre del proveedor | |
| VendorAddress | String | Dirección de correo postal del proveedor | |
| VendorAddressRecipient | String | Nombre asociado a VendorAddress | |
| CustomerAddress | String | Dirección de correo del cliente | |
| CustomerAddressRecipient | String | Nombre asociado a CustomerAddress | |
| BillingAddress | String | Dirección facturación del cliente | |
| BillingAddressRecipient | String | Nombre asociado a BillingAddress | |
| ShippingAddress | String | Dirección de envío explícita del cliente | |
| ShippingAddressRecipient | String | Nombre asociado a ShippingAddress | |
| SubTotal | Número | Campo de subtotal identificado en esta factura | Entero |
| TotalTax | Número | Campo de total de impuestos identificado en esta factura | Entero |
| InvoiceTotal | Número (USD) | Total de cargos nuevos asociados a esta factura | Entero |
| AmountDue | Número (USD) | Importe total debido al proveedor | Entero |
| ServiceAddress | String | Dirección de servicio o dirección de propiedad explícitas para el cliente | |
| ServiceAddressRecipient | String | Nombre asociado a ServiceAddress | |
| RemittanceAddress | String | Dirección de remite o de pago explícitas del cliente | |
| RemittanceAddressRecipient | String | Nombre asociado a RemittanceAddress | |
| ServiceStartDate | Fecha | Primera fecha del período de servicio (por ejemplo, un período de servicio de factura de la utilidad) | aaaa-mm-dd |
| ServiceEndDate | Fecha | Fecha de finalización del período de servicio (por ejemplo, un período de servicio de factura de la utilidad) | aaaa-mm-dd |
| PreviousUnpaidBalance | Número | Saldo explícito no pagado previamente | Entero |
Elementos de línea
A continuación se muestran los elementos de línea extraídos de una factura en la respuesta de salida JSON (la siguiente salida usa esta factura de ejemplo)
| Nombre | Tipo | Descripción | Texto (elemento de línea n.º 1) | Valor (salida estándar) |
|---|---|---|---|---|
| Elementos | String | Línea de texto de cadena completa del elemento de línea | 3/4/2021 A123 Consulting Services 2 hours $30.00 10% $60.00 | |
| Amount | Número | La cantidad del elemento de línea | $60.00 | 100 |
| Descripción | String | La descripción de texto para el elemento de la línea de factura | Servicios de consultoría | Servicios de consultoría |
| Cantidad | Number | La cantidad para este elemento de línea de factura | 2 | 2 |
| UnitPrice | Número | El precio neto o bruto (según la configuración de factura bruta de la factura) de una unidad de este elemento | $30.00 | 30 |
| ProductCode | String | Código de producto, número de producto o SKU asociado al elemento de línea específico | A123 | |
| Unidad | String | Unidad del elemento de línea, por ejemplo, kg, lb, etc. | Horas | |
| Date | Date | Fecha correspondiente a cada elemento de línea. Suele ser la fecha en la que se ha enviado el elemento de línea | 3/4/2021 | 2021-03-04 |
| Impuesto | Número | Impuestos asociados a cada elemento de línea. Los valores posibles incluyen importe de impuestos, porcentaje de impuestos e impuesto S/N | 10 % |
Los pares de clave/valor y los elementos de línea de la factura extraídos se encuentran en la sección documentResults de la salida JSON.
Versión preliminar de Form Recognizer v3.0
La versión preliminar de Form Recognizer presenta varias características y funcionalidades nuevas.
Siga nuestra guía de migración de Form Recognizer v3.0 para obtener información sobre cómo usar la versión preliminar en las aplicaciones y flujos de trabajo.
Explore nuestra API de REST (versión preliminar) para obtener más información sobre la versión preliminar y las nuevas funcionalidades.
Pasos siguientes
Completar un inicio rápido de Form Recognizer:
Explorar nuestra API de REST: