Modelo de tarjetas de presentación de Form Recognizer
El modelo de tarjeta de presentación combina funcionalidades de reconocimiento óptico de caracteres (OCR) eficaces con modelos de aprendizaje profundo para analizar y extraer información clave de imágenes de tarjetas de presentación. La API analiza tarjetas de presentación impresas; extrae información clave, como el nombre, los apellidos, el nombre de la empresa, la dirección de correo electrónico y el número de teléfono; y devuelve una representación de datos JSON estructurada.
Tarjeta de presentación de ejemplo procesada con Form Recognizer Studio
Opciones de desarrollo
Los siguientes recursos son compatibles con Form Recognizer v2.1:
| Característica | Recursos |
|---|---|
| Modelo de tarjeta de presentación |
Los siguientes recursos son compatibles con Form Recognizer v3.0:
| Característica | Recursos | Id. de modelo |
|---|---|---|
| Modelo de tarjeta de presentación | prebuilt-businessCard |
Probar Form Recognizer
Vea cómo se extraen datos, incluidos el nombre, el puesto, la dirección, el correo electrónico y el nombre de la empresa, de las tarjetas de presentación mediante Form Recognizer Studio o nuestra herramienta de etiquetado de ejemplo. Necesitará lo siguiente:
Una suscripción a Azure: puede crear una cuenta gratuita
Una instancia de Form Recognizer en Azure Portal. Puede usar el plan de tarifa gratuito (
F0) para probar el servicio. Después de implementar el recurso, seleccione Ir al recurso para obtener la clave de API y el punto de conexión.
Form Recognizer Studio (versión preliminar)
Nota
Form Recognizer Studio está disponible con la API de versión preliminar (v3.0).
En la página principal de Form Recognizer Studio, seleccione Tarjetas de presentación.
Puede analizar la tarjeta de presentación de ejemplo o seleccionar el botón + Agregar para cargar un ejemplo propio.
Seleccione el botón Analizar:
Herramienta de etiquetado de muestras
Necesitará un documento de tarjeta de presentación. Puede usar nuestro documento de tarjeta de presentación de ejemplo.
En la página principal de la herramienta de etiquetado de ejemplo, seleccione Use prebuilt model to get data (Usar modelo precompilado para obtener datos).
Seleccione Tarjeta de presentación en el menú desplegable Tipo de formulario:
Requisitos de entrada
- Para obtener unos resultados óptimos, proporcione una foto clara o una digitalización de alta calidad por documento.
- Formatos de archivo admitidos: JPEG, PNG, BMP, TIFF y PDF (texto insertado o digitalizado). Los PDF insertados de texto son mejores para eliminar la posibilidad de error en la extracción de caracteres y en la ubicación.
- En el caso de PDF y TIFF, se pueden procesar hasta 2000 páginas (con una suscripción de nivel gratuito, solo se procesan las dos primeras páginas).
- El tamaño del archivo debe ser inferior a 50 MB.
- Las imágenes deben tener unas dimensiones entre 50 x 50 píxeles y 10 000 x 10 000 píxeles.
- Los archivos PDF tienen unas dimensiones de hasta 17 x 17 pulgadas, lo que corresponde a los tamaños de papel Legal o A3, o más pequeños.
- El tamaño total de los datos de entrenamiento es de 500 páginas o menos.
- Si los archivos PDF están bloqueados con contraseña, debe desbloquearlos antes de enviarlos.
- Para un aprendizaje sin supervisión (sin datos etiquetados):
- Los datos deben contener claves y valores.
- Las claves deben aparecer por encima o a la izquierda de los valores; no pueden aparecer por debajo ni a la derecha.
Nota
La herramienta de etiquetado de ejemplo no admite el formato de archivo BMP. Se trata de una limitación de la herramienta, no del servicio Form Recognizer.
Idiomas y configuraciones regionales compatibles
Nota
No es necesario especificar una configuración regional. Se trata de un parámetro opcional. La tecnología de aprendizaje profundo de Form Recognizer detectará automáticamente el idioma del texto de la imagen.
| Modelo | Idioma: código de configuración local | Valor predeterminado |
|---|---|---|
| Tarjeta de presentación |
|
Detección automática |
Extracción de campos
| Nombre | Tipo | Descripción | Salida estandarizada |
|---|---|---|---|
| ContactNames | Matriz de objetos | Nombre de contacto | |
| FirstName | String | Nombre (de nacimiento) del contacto | |
| LastName | String | Apellidos del contacto | |
| CompanyNames | Matriz de cadenas | Nombre de la empresa | |
| Departments | Matriz de cadenas | Departamento u organización del contacto | |
| JobTitles | Matriz de cadenas | Puesto mostrado del contacto | |
| Correos electrónicos | Matriz de cadenas | Dirección de correo electrónico de contacto | |
| Websites | Matriz de cadenas | Sitio web de la empresa | |
| Direcciones | Matriz de cadenas | Dirección extraída de la tarjeta de presentación | |
| MobilePhones | Matriz de números de teléfono | Número de teléfono móvil de la tarjeta de presentación | +1 xxx xxx xxxx |
| Faxes | Matriz de números de teléfono | Número de fax de la tarjeta de presentación | +1 xxx xxx xxxx |
| WorkPhones | Matriz de números de teléfono | Número de teléfono del trabajo de la tarjeta de presentación | +1 xxx xxx xxxx |
| OtherPhones | Matriz de números de teléfono | Otros números de teléfono de la tarjeta de presentación | +1 xxx xxx xxxx |
Versión preliminar de Form Recognizer v3.0
La versión preliminar de Form Recognizer presenta varias características y funcionalidades nuevas.
Siga nuestra guía de migración de Form Recognizer v3.0 para obtener información sobre cómo usar la versión preliminar en las aplicaciones y flujos de trabajo.
Explore nuestra API de REST (versión preliminar) para obtener más información sobre la versión preliminar y las nuevas funcionalidades.
Pasos siguientes
Completar un inicio rápido de Form Recognizer:
Explorar nuestra API de REST: