¿Qué es Form Recognizer?What is Form Recognizer?

Importante

TLS 1.2 ya se exige en todas las solicitudes HTTP para este servicio.TLS 1.2 is now enforced for all HTTP requests to this service. Para más información, consulte Seguridad de Azure Cognitive Services.For more information, see Azure Cognitive Services security.

Azure Form Recognizer es un servicio cognitivo que le permite crear software de procesamiento de datos automatizado mediante tecnología de aprendizaje automático.Azure Form Recognizer is a cognitive service that lets you build automated data processing software using machine learning technology. Identifique y extraiga texto, pares clave-valor, marcas de selección, tablas y una estructura de sus documentos (el servicio genera datos estructurados que incluyen las relaciones del archivo original, rectángulos delimitadores, confianza, etc).Identify and extract text, key/value pairs, selection marks, tables, and structure from your documents—the service outputs structured data that includes the relationships in the original file, bounding boxes, confidence and more. Obtendrá rápidamente resultados precisos a la medida de su contenido específico sin necesidad de una intervención manual pesada o una amplia experiencia en ciencia de datos.You quickly get accurate results that are tailored to your specific content without heavy manual intervention or extensive data science expertise. Use Form Recognizer para automatizar la introducción de datos en las aplicaciones y mejorar las funcionalidades de búsqueda de documentos.Use Form Recognizer to automate data entry in your applications and enrich your documents search capabilities.

Form Recognizer consta de modelos de procesamiento de documentos personalizados, modelos precompilados de facturas, recibos y tarjetas de presentación y el modelo de diseño.Form Recognizer is composed of custom document processing models, prebuilt models for invoices, receipts and business cards, and the layout model. Puede llamar a los modelos de Form Recognizer mediante una API REST o los SDK de la biblioteca cliente, e integrarlos en su flujo de trabajo o aplicación.You can call Form Recognizer models by using a REST API or client library SDKs to reduce complexity and integrate it into your workflow or application.

Form Recognizer consta de los siguientes servicios:Form Recognizer is composed of the following services:

  • API de diseño : extraiga de los documentos texto, marcas de selección y estructuras de tablas, junto con las coordenadas de sus rectángulos de selección.Layout API - Extract text, selection marks, and tables structures, along with their bounding box coordinates, from documents.
  • Modelos personalizados : extraiga texto, pares clave-valor, marcas de selección y datos de tabla de los formularios.Custom models - Extract text, key/value pairs, selection marks, and table data from forms. Puede entrenar estos modelos con sus propios datos para que se adapten a sus formularios.These models are trained with your own data, so they're tailored to your forms.
  • Modelos precompilados : extraiga datos de tipos de formularios únicos mediante modelos precompilados.Prebuilt models - Extract data from unique form types using prebuilt models. Actualmente, estos son los modelos precompilados que están disponibles:Currently available are the following prebuilt models

PruebaTry it out

Para probar el servicio Form Recognizer, vaya a la herramienta de interfaz de usuario de ejemplo en línea:To try out the Form Recognizer Service, go to the online Sample UI Tool:

Necesitará una suscripción de Azure (cree una gratis) y un punto de conexión de recursos de Form Recognizer, así como la clave para probar el servicio Form Recognizer.You will need an Azure subscription (create one for free) and a Form Recognizer resource endpoint and key to try out the Form Recognizer service.

API de diseñoLayout API

Form Recognizer puede extraer de documentos texto, marcas de selección y estructuras de tablas (los números de fila y columna asociados al texto) mediante el reconocimiento óptico de caracteres (OCR) de alta definición y un modelo de aprendizaje profundo mejorado.Form Recognizer can extract text, selection marks, and table structure (the row and column numbers associated with the text) using high-definition optical character recognition (OCR) and an enhanced deep learning model from documents. Para más información, consulte la guía conceptual sobre diseño.See the Layout conceptual guide for more info.

Tablas de ejemplo

Modelos personalizadosCustom models

Puede entrenar los modelos personalizados de Form Recognizer con sus propios datos y solo necesita cinco formularios de entrada de ejemplo para empezar.Form Recognizer custom models train to your own data, and you only need five sample input forms to start. Un modelo de procesamiento de documentos entrenado puede generar datos estructurados que incluyen las relaciones en el documento de formulario original.A trained document processing model can output structured data that includes the relationships in the original form document. Después de entrenar el modelo, puede probarlo, volver a entrenarlo y finalmente usarlo para extraer datos de forma confiable de más formularios en función de las propias necesidades.After you train the model, you can test and retrain it and eventually use it to reliably extract data from more forms according to your needs.

Tiene las siguientes opciones al entrenar modelos personalizados: entrenamiento con datos etiquetados y sin ellos.You have the following options when you train custom models: training with labeled data and without labeled data.

Entrenamiento sin etiquetasTrain without labels

De forma predeterminada, Form Recognizer usa el aprendizaje sin supervisión para comprender el diseño y las relaciones entre los campos y las entradas de los formularios.By default, Form Recognizer uses unsupervised learning to understand the layout and relationships between fields and entries in your forms. Cuando se envían los formularios de entrada, el algoritmo agrupa los formularios por tipos, descubre qué claves y tablas están presentes y asocia los valores a las claves y entradas a las tablas.When you submit your input forms, the algorithm clusters the forms by type, discovers what keys and tables are present, and associates values to keys and entries to tables. Esto no requiere el etiquetado de datos manual ni una codificación intensiva, ni mantenimiento y se recomienda probar este método primero.This doesn't require manual data labeling or intensive coding and maintenance, and we recommend you try this method first.

Consulte Creación de un conjunto de datos de entrenamiento para ver sugerencias sobre cómo recopilar los documentos de entrenamiento.See Build a training data set for tips on how to collect your training documents.

Entrenamiento con etiquetasTrain with labels

Al entrenar con datos etiquetados, el modelo realiza un aprendizaje supervisado para extraer valores de interés mediante los formularios etiquetados que se proporcionan.When you train with labeled data, the model does supervised learning to extract values of interest, using the labeled forms you provide. Esto da como resultado modelos con un mejor rendimiento y puede generar modelos que funcionen con formularios complejos o formularios que contengan valores sin claves.This results in better-performing models and can produce models that work with complex forms or forms containing values without keys.

Form Recognizer usa la API de diseño para aprender los tamaños y posiciones esperados de los elementos de texto impresos y manuscritos.Form Recognizer uses the Layout API to learn the expected sizes and positions of printed and handwritten text elements. A continuación, usa etiquetas especificadas por el usuario para aprender las asociaciones clave-valor de los documentos.Then it uses user-specified labels to learn the key/value associations in the documents. Se recomienda usar cinco formularios etiquetados manualmente del mismo tipo (la misma estructura) para empezar a entrenar un nuevo modelo y agregar más datos etiquetados según sea necesario para mejorar la precisión del modelo.We recommend that you use five manually labeled forms of the same type (same structure) to get started when training a new model and add more labeled data as needed to improve the model accuracy.

Introducción al entrenamiento con etiquetasGet started with Train with labels

Modelos creados previamentePrebuilt models

Form Recognizer también incluye modelos precompilados para el procesamiento automático de datos de tipos de formularios únicos.Form Recognizer also includes Prebuilt models for automated data processing of unique form types.

Modelo de factura precompiladoPrebuilt Invoice model

El modelo de factura precompilado extrae datos de las facturas en varios formatos y devuelve datos estructurados.The Prebuilt Invoice model extracts data from invoices in a variety of formats and returns structured data. Este modelo extrae información clave como el identificador de factura, los detalles del cliente, los detalles del proveedor, la dirección de envío, la dirección de facturación, el total, los impuestos, el subtotal, etc.This model extracts key information such as the invoice ID, customer details, vendor details, ship to, bill to, total, tax, subtotal and more. Además, este modelo se entrena para analizar y devolver todo el texto y las tablas de la factura.In addition, the prebuilt invoice model is trained to analyze and return all of the text and tables on the invoice. Para más información, consulte la guía conceptual sobre facturas.See the Invoices conceptual guide for more info.

Factura de ejemplo

Modelo de recibo pregeneradoPrebuilt Receipt model

El modelo de recibo pregenerado se usa para leer los recibos de ventas en Inglés de Australia, Canadá, Gran Bretaña, India y Estados Unidos (el tipo que usan los restaurantes, las estaciones de gas, minoristas, etc).The Prebuilt Receipt model is used for reading English sales receipts from Australia, Canada, Great Britain, India, and the United States—the type used by restaurants, gas stations, retail, and so on. Este modelo extrae información clave como la hora y la fecha de la transacción, información del comerciante, importe de los impuestos, totales y mucho más.This model extracts key information such as the time and date of the transaction, merchant information, amounts of taxes, line items, totals and more. Además, el modelo de recibo pregenerado se entrena para analizar y devolver todo el texto en un recibo.In addition, the prebuilt receipt model is trained to analyze and return all of the text on a receipt. Consulte la guía conceptual sobre recibos para más información.See the Receipts conceptual guide for more info.

recibo de ejemplo

Modelo de tarjetas de presentación pregeneradoPrebuilt Business Cards model

El modelo de tarjetas de presentación le permite extraer información como el nombre de la persona, el puesto de trabajo, la dirección, el correo electrónico, la empresa y los números de teléfono de las tarjetas de presentación en inglés.The Business Cards model enables you to extract information such as the person's name, job title, address, email, company, and phone numbers from business cards in English. Consulte la guía conceptual sobre tarjetas de presentación para más información.See the Business cards conceptual guide for more info.

tarjeta de presentación de ejemplo

IntroducciónGet started

Use la herramienta Form Recognizer de ejemplo o siga un inicio rápido para empezar a extraer datos de formularios.Use the Sample Form Recognizer tool or follow a quickstart to get started extracting data from your forms. Se recomienda usar el servicio gratuito cuando se está aprendiendo la tecnología.We recommend that you use the free service when you're learning the technology. Recuerde que el número de páginas gratuitas se limita a 500 al mes.Remember that the number of free pages is limited to 500 per month.

Revisión de las API RESTReview the REST APIs

Va a utilizar las siguientes API para entrenar modelos y extraer datos estructurados de formularios.You'll use the following APIs to train models and extract structured data from forms.

NombreName DescripciónDescription
Análisis de diseñoAnalyze Layout Analice un documento pasado como secuencia para extraer de él texto, marcas de selección, tablas y su estructuraAnalyze a document passed in as a stream to extract text, selection marks, tables and structure from the document
Entrenamiento de modelos personalizadosTrain Custom Model Entrene un nuevo modelo para analizar los formularios con cinco formularios del mismo tipo.Train a new model to analyze your forms by using five forms of the same type. Establezca el parámetro useLabelFile en true para entrenar con datos etiquetados manualmente.Set the useLabelFile parameter to true to train with manually labeled data.
Análisis de formulariosAnalyze Form Analice un formulario pasado como una secuencia para extraer texto, pares clave-valor y tablas del formulario con su modelo personalizado.Analyze a form passed in as a stream to extract text, key/value pairs, and tables from the form with your custom model.
Análisis de facturasAnalyze Invoice Analice una factura para extraer de ella información clave, tablas y otro tipo de texto.Analyze a invoice to extract key information, tables, and other invoice text.
Análisis de recibosAnalyze Receipt Analice un recibo para extraer de él la información clave y cualquier otro texto.Analyze a receipt document to extract key information, and other receipt text.
Análisis de una tarjeta de presentaciónAnalyze Business Card Analice una tarjeta de presentación para extraer el texto y la información más importante.Analyze a business card to extract key information and text.

Explore la documentación de referencia de API REST para más información.Explore the REST API reference documentation to learn more. Si está familiarizado con una versión anterior de la API, consulte el artículo sobre novedades para más información sobre los cambios recientes.If you're familiar with a previous version of the API, see the What's new article to learn about recent changes.

Requisitos de entradaInput requirements

Form Recognizer trabaja con documentos de entrada que cumplen estos requisitos:Form Recognizer works on input documents that meet these requirements:

  • El formato debe ser JPG, PNG o PDF (texto o digitalizado) o TIFF.Format must be JPG, PNG, PDF (text or scanned), or TIFF. Los PDF insertados de texto son mejores porque no hay posibilidad de error en la extracción de caracteres y en la ubicación.Text-embedded PDFs are best because there's no possibility of error in character extraction and location.
  • El tamaño del archivo debe ser inferior a 50 MB.File size must be less than 50 MB.
  • Las imágenes deben tener unas dimensiones entre 50 x 50 píxeles y 10 000 x 10 000 píxeles.Image dimensions must be between 50 x 50 pixels and 10000 x 10000 pixels.
  • Los archivos PDF deben tener unas dimensiones de 17 x 17 pulgadas como máximo, lo que se corresponde con los tamaños de papel Legal o A3 y más pequeños.PDF dimensions must be at most 17 x 17 inches, corresponding to Legal or A3 paper sizes and smaller.
  • En el caso de PDF y TIFF, solo se procesan las primeras 200 páginas (con una suscripción de nivel gratuitos, solo se procesan las dos primeras páginas).For PDF and TIFF, only the first 200 pages are processed (with a free tier subscription, only the first two pages are processed).
  • El tamaño total del conjunto de datos de aprendizaje puede ser de 500 páginas o menos.The total size of the training data set must be 500 pages or less.
  • Si los archivos PDF están bloqueados con contraseña, debe quitar el bloqueo antes de enviarlos.If your PDFs are password-locked, you must remove the lock before submitting them.
  • Si se digitalizan desde documentos en papel, los formularios deben ser digitalizaciones de alta calidad.If scanned from paper documents, forms should be high-quality scans.
  • El texto debe usar el alfabeto latino (caracteres ingleses).Text must use the Latin alphabet (English characters).
  • En el caso del aprendizaje sin supervisión (sin datos etiquetados), los datos deben contener claves y valores.For unsupervised learning (without labeled data), data must contain keys and values.
  • En el caso del aprendizaje sin supervisión (sin datos etiquetados), las claves deben aparecer por encima o a la izquierda de los valores; no pueden aparecer por abajo ni a la derecha.For unsupervised learning (without labeled data), keys must appear above or to the left of the values; they can't appear below or to the right.

Implementación local mediante contenedores de DockerDeploy on premises using Docker containers

Use contenedores de Form Recognizer (versión preliminar) para implementar características de API locales.Use Form Recognizer containers (preview) to deploy API features on-premises. Este contenedor de Docker permite acercar el servicio a los datos para mejorar el cumplimiento, la seguridad o por otras razones operativas.This Docker container enables you to bring the service closer to your data for compliance, security or other operational reasons.

Disponibilidad y redundancia del servicioService availability and redundancy

¿Tiene el servicio Form Recognizer resistencia de zona?Is Form Recognizer service zone-resilient?

Sí.Yes. El servicio Form Recognizer tiene resistencia de zona de manera predeterminada.The Form Recognizer service is zone-resilient by default.

¿Cómo se configura el servicio Form Recognizer para que tenga resistencia de zona?How do I configure the Form Recognizer service to be zone-resilient?

No es necesaria ninguna configuración de parte del cliente para habilitar la resistencia de zonas.No customer configuration is necessary to enable zone-resiliency. La resistencia de zonas para los recursos de Form Recognizer está disponible de manera predeterminada y la administra el propio servicio.Zone-resiliency for Form Recognizer resources is available by default and managed by the service itself.

Seguridad y privacidad de datosData privacy and security

Al igual que sucede con todas las instancias de Cognitive Services, los desarrolladores que usan el servicio Form Recognizer deben estar al tanto de las directivas de Microsoft sobre los datos de los clientes.As with all the cognitive services, developers using the Form Recognizer service should be aware of Microsoft policies on customer data. Para más información, consulte la página de Cognitive Services en Microsoft Trust Center.See the Cognitive Services page on the Microsoft Trust Center to learn more.

Pasos siguientesNext steps

Complete un inicio rápido para empezar a escribir una aplicación de procesamiento de formularios con Form Recognizer en el lenguaje de desarrollo que prefiera.Complete a quickstart to get started writing a forms processing app with Form Recognizer in the development language of your choice.