Modelo de documentos de identificación de Form Recognizer

El modelo de documentos de identificación combina eficaces funcionalidades de reconocimiento óptico de caracteres (OCR) con modelos de aprendizaje profundo para analizar y extraer información clave de permisos de conducir de EE. UU. (los 50 estados y el distrito de Columbia) y las páginas de información personal de los pasaportes internacionales (excepto los visados y otros documentos de viajes). La API analiza los documentos de identidad, extrae información clave como nombre, apellidos, dirección y fecha de nacimiento, y devuelve una representación de datos JSON estructurada.

Permiso de conducir de EE. UU. de ejemplo procesado con Form Recognizer Studio

tarjeta de identidad de ejemplo

Opciones de desarrollo

Los siguientes recursos son compatibles con Form Recognizer v2.1:

Característica Recursos
Modelo de documentación de id.

Los siguientes recursos son compatibles con Form Recognizer v3.0:

Característica Recursos Id. de modelo
Modelo de documentación de id. prebuilt-idDocument

Probar Form Recognizer

Consulte cómo se extraen datos, incluidos el nombre, la fecha de nacimiento, el área legible por máquina y la fecha de expiración, de los documentos de identificación mediante Form Recognizer Studio o nuestra herramienta de etiquetado de ejemplo. Necesitará lo siguiente:

  • Una suscripción a Azure: puede crear una cuenta gratuita

  • Una instancia de Form Recognizer en Azure Portal. Puede usar el plan de tarifa gratuito (F0) para probar el servicio. Después de implementar el recurso, seleccione Ir al recurso para obtener la clave de API y el punto de conexión.

Captura de pantalla: claves y ubicación del punto de conexión en Azure Portal.

Form Recognizer Studio (versión preliminar)

Nota

Form Recognizer Studio está disponible con la API de versión preliminar (v3.0).

  1. En la página principal de Form Recognizer Studio, seleccione Facturas.

  2. Puede analizar la factura de ejemplo o seleccionar el botón + Agregar para cargar un ejemplo propio.

  3. Seleccione el botón Analizar:

    Captura de pantalla: menú para analizar el documento de identificación.

Herramienta de etiquetado de muestras

Necesitará un documento de identificación. Puede usar nuestro documento de identificación de ejemplo.

  1. En la página principal de la herramienta de etiquetado de ejemplo, seleccione Use prebuilt model to get data (Usar modelo precompilado para obtener datos).

  2. Seleccione Identity documents (Documentos de identidad) en el menú desplegable Tipo de formulario:

    Captura de pantalla: menú desplegable de selección del modelo precompilado de la herramienta de etiquetado de ejemplo.

Requisitos de entrada

  • Para obtener unos resultados óptimos, proporcione una foto clara o una digitalización de alta calidad por documento.
  • Formatos de archivo admitidos: JPEG, PNG, BMP, TIFF y PDF (texto insertado o digitalizado). Los PDF insertados de texto son mejores para eliminar la posibilidad de error en la extracción de caracteres y en la ubicación.
  • En el caso de PDF y TIFF, se pueden procesar hasta 2000 páginas (con una suscripción de nivel gratuito, solo se procesan las dos primeras páginas).
  • El tamaño del archivo debe ser inferior a 50 MB.
  • Las imágenes deben tener unas dimensiones entre 50 x 50 píxeles y 10 000 x 10 000 píxeles.
  • Los archivos PDF tienen unas dimensiones de hasta 17 x 17 pulgadas, lo que corresponde a los tamaños de papel Legal o A3, o más pequeños.
  • El tamaño total de los datos de entrenamiento es de 500 páginas o menos.
  • Si los archivos PDF están bloqueados con contraseña, debe desbloquearlos antes de enviarlos.
  • Para un aprendizaje sin supervisión (sin datos etiquetados):
    • Los datos deben contener claves y valores.
    • Las claves deben aparecer por encima o a la izquierda de los valores; no pueden aparecer por debajo ni a la derecha.

Nota

La herramienta de etiquetado de ejemplo no admite el formato de archivo BMP. Se trata de una limitación de la herramienta, no del servicio Form Recognizer.

Idiomas y configuraciones regionales compatibles v2.1

Modelo Idioma: código de configuración local Valor predeterminado
Documento de identificación
  • Inglés (Estados Unidos): en-US (permiso de conducir)
  • Páginas de información personal de los pasaportes internacionales
    (excepto los visados y otros documentos de viajes)

Inglés (Estados Unidos): en-US

Extracción de campos

Nombre Tipo Descripción Salida estandarizada
CountryRegion countryRegion Código de país o región que se ajusta a la norma ISO 3166 estándar.
DateOfBirth Fecha DOB aaaa-mm-dd
DateOfExpiration Fecha Fecha de expiración FDN aaaa-mm-dd
DocumentNumber String Número de pasaporte, número de permiso de conducir, etc. pertinente.
FirstName String Nombre extraído e inicial del segundo nombre, si procede.
LastName String Apellido extraído
Nacionalidad countryRegion Código de país o región que se ajusta a la norma ISO 3166 estándar (solo pasaporte).
Sex String Los valores extraídos posibles son "M", "F" y "X".
MachineReadableZone Object Zona de lectura automática del pasaporte extraída, incluidas dos líneas de 44 caracteres cada una. "P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<715816"
DocumentType String Tipo de documento, por ejemplo, pasaporte o permiso de conducir. "passport"
Dirección String Dirección extraída (solo permiso de conducir)
Region String Valor extraído de región, estado, provincia, etc. (solo permiso de conducir)

Versión preliminar v3.0 de Form Recognizer

La versión preliminar de Form Recognizer presenta varias características y funcionalidades nuevas:

  • El modelo de documentos de identificación (v3.0) admite aprobaciones, restricciones y la extracción de clasificación de vehículos de permisos de conducir de EE. UU.

Extracción de campos de la versión preliminar del documento de identificación

Nombre Tipo Descripción Salida estandarizada
🆕 Aprobaciones String Privilegios de conducción adicionales concedidos a un conductor, como una moto o un autobús escolar.
🆕 Restricciones String Privilegios de conducción restringidos aplicables a licencias suspendidas o revocadas.
🆕VehicleClassification String Tipos de vehículos que puede conducir un conductor.
CountryRegion countryRegion Código de país o región que se ajusta a la norma ISO 3166 estándar.
DateOfBirth Fecha DOB aaaa-mm-dd
DateOfExpiration Fecha Fecha de expiración FDN aaaa-mm-dd
DocumentNumber String Número de pasaporte, número de permiso de conducir, etc. pertinente.
FirstName String Nombre extraído e inicial del segundo nombre, si procede.
LastName String Apellido extraído
Nacionalidad countryRegion Código de país o región que se ajusta a la norma ISO 3166 estándar (solo pasaporte).
Sex String Los valores extraídos posibles son "M", "F" y "X".
MachineReadableZone Object Zona de lectura automática del pasaporte extraída, incluidas dos líneas de 44 caracteres cada una. "P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<715816"
DocumentType String Tipo de documento, por ejemplo, pasaporte o permiso de conducir. "passport"
Dirección String Dirección extraída (solo permiso de conducir)
Region String Valor extraído de región, estado, provincia, etc. (solo permiso de conducir)

Guía de migración y API REST v3.0

Pasos siguientes