Compartir vía


Modelo de certificado de matrimonio de Documento de inteligencia

Este contenido se aplica a:marca de verificaciónv4.0 (versión preliminar)marca de verificación

El modelo de certificado de matrimonio de Documento de inteligencia usa eficaces funcionalidades de reconocimiento óptico de caracteres (OCR) para analizar y extraer campos clave de certificados de matrimonio. Los certificados de matrimonio pueden ser de varios formatos y calidad, incluidas imágenes capturadas por teléfono, documentos escaneados y archivos PDF digitales. La API analiza el texto del documento; extrae información clave como nombres de cónyuge, fecha de emisión y lugar de matrimonio; y devuelve una representación de datos JSON estructurada. El modelo admite actualmente formatos de documentos en inglés.

Procesamiento automatizado de certificados de matrimonio

El procesamiento automatizado de certificados de matrimonio es el proceso de extracción de campos clave de certificados de matrimonio. Históricamente, el proceso de análisis de certificados de matrimonio se logra manualmente y, por lo tanto, muy lento. La extracción precisa de datos clave de certificados de matrimonio suele ser la primera y uno de los pasos más críticos del proceso de automatización de certificados de matrimonio.

Opciones de desarrollo

Documento de inteligencia v4.0 (2024-02-29-preview) admite las siguientes herramientas, aplicaciones y bibliotecas:

Característica Recursos Id. de modelo
prebuilt-marriageCertificate.us Estudio de Documento de inteligencia
API de REST
SDK de C#
SDK de Python
SDK de Java
SDK de JavaScript
prebuilt-marriageCertificate.us

Requisitos de entrada

  • Para obtener unos resultados óptimos, proporcione una foto clara o una digitalización de alta calidad por documento.

  • Formatos de archivos admitidos:

    Modelo PDF Imagen:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) y HTML
    Leer
    Layout ✔ (2024-02-29-preview, 2023-10-31-preview)
    Documento general
    Creada previamente
    Extracción personalizada
    Clasificación personalizada ✔ (2024-02-29-preview)
  • En el caso de PDF y TIFF, se pueden procesar hasta 2000 páginas (con una suscripción de nivel gratuito, solo se procesan las dos primeras páginas).

  • El tamaño de archivo para analizar documentos es de 500 MB para el nivel de pago (S0) y de 4 MB para el nivel gratuito (F0).

  • Las imágenes deben tener unas dimensiones de entre 50 x 50 píxeles y 10 000 x 10 000 píxeles.

  • Si los archivos PDF están bloqueados con contraseña, debe desbloquearlos antes de enviarlos.

  • La altura mínima del texto que se va a extraer es de 12 píxeles para una imagen de 1024 x 768 píxeles. Esta dimensión corresponde aproximadamente a un 8 texto de 150 puntos a 150 puntos por pulgada (DPI).

  • Para el entrenamiento de modelos personalizados, el número máximo de páginas para los datos de entrenamiento es 500 para el modelo de plantilla personalizada y 50 000 para el modelo neuronal personalizado.

    • Para el entrenamiento de modelos de extracción personalizados, el tamaño total de los datos de entrenamiento es de 50 MB para el modelo de plantilla y 1 G-MB para el modelo neuronal.

    • Para el modelo de entrenamiento de clasificación personalizada, el tamaño total de los datos de entrenamiento es 1GB con un máximo de 10 000 páginas.

Probar la extracción de datos de documentos de certificado de matrimonio

Para ver cómo funciona la extracción de datos para el servicio de tarjetas de certificado de matrimonio, necesita los siguientes recursos:

  • Una suscripción a Azure (se puede crear de forma gratuita).

  • Una instancia de Document Intelligence en el Azure Portal. Puede usar el plan de tarifa gratuito (F0) para probar el servicio. Después de implementar el recurso, seleccione Ir al recurso para obtener la clave y el punto de conexión.

Captura de pantalla de ubicación de las claves y el punto de conexión en Azure Portal.

Estudio del documento de inteligencia

  1. En la página principal de Estudio del documento de inteligencia, seleccione Certificado de matrimonio.

  2. Puede analizar los certificados de matrimonio de muestra o cargar sus propios archivos.

  3. Seleccione el botón Ejecutar análisis y, si es necesario, configure las opciones de Análisis :

    Captura de pantalla de los botones Ejecutar análisis y Analizar opciones en Document Intelligence Studio.

Idiomas y configuraciones regionales compatibles

Vea nuestra página de Compatibilidad de idiomas: modelos precompilados para obtener una lista completa de los idiomas admitidos.

Extracción de campos

A continuación se muestran los campos extraídos de un certificado de matrimonio en la respuesta de salida JSON.

Nombre Escribir Descripción Salida de ejemplo
Spouse1FirstName Cadena Nombre del cónyuge 1 Wesley
Spouse1MiddleName Cadena Nombre intermedio del cónyuge 1 M.
Spouse1LastName Cadena Apellido del cónyuge 1 Perry
Spouse1Age Entero Edad del cónyuge 1 26
Spouse1BirthDate Date Fecha de nacimiento del cónyuge 1 16 de noviembre de 1997
Spouse1Address Dirección Dirección del cónyuge 1 4292 Don Jackson Lane, Bloomfield Township, Michigan 48302
Spouse1BirthPlace Cadena Lugar de nacimiento del cónyuge 1 Míchigan
Spouse2FirstName Cadena Nombre del cónyuge 2 Beth
Spouse2MiddleName Cadena Nombre intermedio del cónyuge 2 R.
Spouse2LastName Cadena Apellido del cónyuge 2 Mason
Spouse2Age Entero Edad del cónyuge 2 23
Spouse2BirthDate Date Fecha de nacimiento del cónyuge 2 Jul. 22, 2000
Spouse2Address Dirección Dirección del cónyuge 2 2671 Comfort Court, Madison, Wisconsin 53704
Spouse2BirthPlace Cadena Lugar de nacimiento del cónyuge 2 Wisconsin
DocumentNumber Cadena Número de documento 01976/202
IssueDate Date Fecha de emisión del certificado 10 de octubre de 2023
IssuePlace Cadena Lugar de emisión del certificado 2398 Echo Lane, Hastings, Michigan 49058
MarriageDate Date Fecha de matrimonio 10 de octubre de 2023
MarriagePlace Cadena Lugar de matrimonio 105 Coal Street, Galloway, Wisconsin 54432

Los pares clave-valor del certificado de matrimonio y los elementos de línea extraídos se encuentran en la sección documentResults de la salida JSON.

Pasos siguientes