Modelo de documentos de identificación de Form Recognizer
El modelo de documentos de identificación combina eficaces funcionalidades de reconocimiento óptico de caracteres (OCR) con modelos de aprendizaje profundo para analizar y extraer información clave de permisos de conducir de EE. UU. (los 50 estados y el distrito de Columbia) y las páginas de información personal de los pasaportes internacionales (excepto los visados y otros documentos de viajes). La API analiza los documentos de identidad, extrae información clave como nombre, apellidos, dirección y fecha de nacimiento, y devuelve una representación de datos JSON estructurada.
Permiso de conducir de EE. UU. de ejemplo procesado con Form Recognizer Studio
Opciones de desarrollo
Los siguientes recursos son compatibles con Form Recognizer v2.1:
| Característica | Recursos |
|---|---|
| Modelo de documentación de id. |
Los siguientes recursos son compatibles con Form Recognizer v3.0:
| Característica | Recursos | Id. de modelo |
|---|---|---|
| Modelo de documentación de id. | prebuilt-idDocument |
Probar Form Recognizer
Consulte cómo se extraen datos, incluidos el nombre, la fecha de nacimiento, el área legible por máquina y la fecha de expiración, de los documentos de identificación mediante Form Recognizer Studio o nuestra herramienta de etiquetado de ejemplo. Necesitará lo siguiente:
Una suscripción a Azure: puede crear una cuenta gratuita
Una instancia de Form Recognizer en Azure Portal. Puede usar el plan de tarifa gratuito (
F0) para probar el servicio. Después de implementar el recurso, seleccione Ir al recurso para obtener la clave de API y el punto de conexión.
Form Recognizer Studio (versión preliminar)
Nota
Form Recognizer Studio está disponible con la API de versión preliminar (v3.0).
En la página principal de Form Recognizer Studio, seleccione Facturas.
Puede analizar la factura de ejemplo o seleccionar el botón + Agregar para cargar un ejemplo propio.
Seleccione el botón Analizar:
Herramienta de etiquetado de muestras
Necesitará un documento de identificación. Puede usar nuestro documento de identificación de ejemplo.
En la página principal de la herramienta de etiquetado de ejemplo, seleccione Use prebuilt model to get data (Usar modelo precompilado para obtener datos).
Seleccione Identity documents (Documentos de identidad) en el menú desplegable Tipo de formulario:
Requisitos de entrada
- Para obtener unos resultados óptimos, proporcione una foto clara o una digitalización de alta calidad por documento.
- Formatos de archivo admitidos: JPEG, PNG, BMP, TIFF y PDF (texto insertado o digitalizado). Los PDF insertados de texto son mejores para eliminar la posibilidad de error en la extracción de caracteres y en la ubicación.
- En el caso de PDF y TIFF, se pueden procesar hasta 2000 páginas (con una suscripción de nivel gratuito, solo se procesan las dos primeras páginas).
- El tamaño del archivo debe ser inferior a 50 MB.
- Las imágenes deben tener unas dimensiones entre 50 x 50 píxeles y 10 000 x 10 000 píxeles.
- Los archivos PDF tienen unas dimensiones de hasta 17 x 17 pulgadas, lo que corresponde a los tamaños de papel Legal o A3, o más pequeños.
- El tamaño total de los datos de entrenamiento es de 500 páginas o menos.
- Si los archivos PDF están bloqueados con contraseña, debe desbloquearlos antes de enviarlos.
- Para un aprendizaje sin supervisión (sin datos etiquetados):
- Los datos deben contener claves y valores.
- Las claves deben aparecer por encima o a la izquierda de los valores; no pueden aparecer por debajo ni a la derecha.
Nota
La herramienta de etiquetado de ejemplo no admite el formato de archivo BMP. Se trata de una limitación de la herramienta, no del servicio Form Recognizer.
Idiomas y configuraciones regionales compatibles v2.1
| Modelo | Idioma: código de configuración local | Valor predeterminado |
|---|---|---|
| Documento de identificación |
|
Inglés (Estados Unidos): en-US |
Extracción de campos
| Nombre | Tipo | Descripción | Salida estandarizada |
|---|---|---|---|
| CountryRegion | countryRegion | Código de país o región que se ajusta a la norma ISO 3166 estándar. | |
| DateOfBirth | Fecha | DOB | aaaa-mm-dd |
| DateOfExpiration | Fecha | Fecha de expiración FDN | aaaa-mm-dd |
| DocumentNumber | String | Número de pasaporte, número de permiso de conducir, etc. pertinente. | |
| FirstName | String | Nombre extraído e inicial del segundo nombre, si procede. | |
| LastName | String | Apellido extraído | |
| Nacionalidad | countryRegion | Código de país o región que se ajusta a la norma ISO 3166 estándar (solo pasaporte). | |
| Sex | String | Los valores extraídos posibles son "M", "F" y "X". | |
| MachineReadableZone | Object | Zona de lectura automática del pasaporte extraída, incluidas dos líneas de 44 caracteres cada una. | "P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<715816" |
| DocumentType | String | Tipo de documento, por ejemplo, pasaporte o permiso de conducir. | "passport" |
| Dirección | String | Dirección extraída (solo permiso de conducir) | |
| Region | String | Valor extraído de región, estado, provincia, etc. (solo permiso de conducir) |
Versión preliminar v3.0 de Form Recognizer
La versión preliminar de Form Recognizer presenta varias características y funcionalidades nuevas:
- El modelo de documentos de identificación (v3.0) admite aprobaciones, restricciones y la extracción de clasificación de vehículos de permisos de conducir de EE. UU.
Extracción de campos de la versión preliminar del documento de identificación
| Nombre | Tipo | Descripción | Salida estandarizada |
|---|---|---|---|
| 🆕 Aprobaciones | String | Privilegios de conducción adicionales concedidos a un conductor, como una moto o un autobús escolar. | |
| 🆕 Restricciones | String | Privilegios de conducción restringidos aplicables a licencias suspendidas o revocadas. | |
| 🆕VehicleClassification | String | Tipos de vehículos que puede conducir un conductor. | |
| CountryRegion | countryRegion | Código de país o región que se ajusta a la norma ISO 3166 estándar. | |
| DateOfBirth | Fecha | DOB | aaaa-mm-dd |
| DateOfExpiration | Fecha | Fecha de expiración FDN | aaaa-mm-dd |
| DocumentNumber | String | Número de pasaporte, número de permiso de conducir, etc. pertinente. | |
| FirstName | String | Nombre extraído e inicial del segundo nombre, si procede. | |
| LastName | String | Apellido extraído | |
| Nacionalidad | countryRegion | Código de país o región que se ajusta a la norma ISO 3166 estándar (solo pasaporte). | |
| Sex | String | Los valores extraídos posibles son "M", "F" y "X". | |
| MachineReadableZone | Object | Zona de lectura automática del pasaporte extraída, incluidas dos líneas de 44 caracteres cada una. | "P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<715816" |
| DocumentType | String | Tipo de documento, por ejemplo, pasaporte o permiso de conducir. | "passport" |
| Dirección | String | Dirección extraída (solo permiso de conducir) | |
| Region | String | Valor extraído de región, estado, provincia, etc. (solo permiso de conducir) |
Guía de migración y API REST v3.0
Siga nuestra guía de migración de Form Recognizer v3.0 para obtener información sobre cómo usar la versión preliminar en las aplicaciones y flujos de trabajo.
Explore nuestra API de REST (versión preliminar) para obtener más información sobre la versión preliminar y las nuevas funcionalidades.
Pasos siguientes
Completar un inicio rápido de Form Recognizer:
Explorar nuestra API de REST: