Novedades en Azure Form Recognizer

El servicio Form Recognizer se actualiza de forma continuada. Marque esta página para mantenerse al día con las notas de la versión, las mejoras de características y las actualizaciones de la documentación.

Octubre de 2021

Nueva versión preliminar de Form Recognizer

La nueva versión preliminar de Form Recognizer presenta varias características y funcionalidades nuevas:

  • El modelo de documento general es una nueva API que usa un modelo entrenado previamente para extraer texto, tablas, estructura, pares clave-valor y entidades con nombre de formularios y documentos.

  • El modelo de recibo de hotel se agregó al procesamiento de recibos precompilados.

  • El modelo de id. de campos ampliados de documento de identificación admite aprobaciones, restricciones y la extracción de clasificación de vehículos de permisos de conducir de EE. UU.

  • Campo de firma es un nuevo tipo de campo en formularios personalizados para detectar la presencia de una firma en un campo de formulario.

  • Expansión de idiomas Compatibilidad con 122 idiomas (impresión) y 7 idiomas (manuscritos). El diseño y el formulario personalizado de Form Recognizer amplían los idiomas admitidos a 122 con su versión preliminar más reciente. Incluye la extracción de texto con texto impreso en 49 nuevos idiomas, entre los que se incluyen el ruso y el búlgaro, así como otros idiomas cirílicos y procedentes del latín. Además, la extracción de texto manuscrito ahora admite 7 idiomas que incluyen inglés y nuevas versiones preliminares de chino simplificado, francés, alemán, italiano, portugués y español.

  • Mejoras en las tablas y la extracción de texto El diseño ahora admite la extracción de tablas de una sola fila también denominadas tablas de clave-valor. Las mejoras de extracción de texto incluyen un mejor procesamiento de archivos PDF digitales y texto de zona legible por máquina (MRZ) en documentos de identidad, junto con el rendimiento general.

  • Form Recognizer Studio Para simplificar el uso del servicio, ahora puede acceder a Form Recognizer Studio para probar los diferentes modelos o etiquetas precompilados y entrenar un modelo personalizado.

Comience con la nueva API de REST, Python o el SDK de .NET para la API de versión preliminar v3.0.

Extracción de datos del modelo de Form Recognizer

Modelo Extracción de texto Pares clave-valor Marcas de selección Tablas Entidades
🆕Documento general
Layout
Factura
Recibo
Documento de identificación
Tarjeta de presentación
Personalizado

Septiembre de 2021

  • Características avanzadas del explorador de métricas de Azure disponibles en la página de descripción general de recursos de Form Recognizer en Azure Portal.

    Menú Supervisión

    Captura de pantalla que muestra el menú de supervisión en Azure Portal

    Gráficos

    Captura de pantalla que muestra un gráfico de métricas de ejemplo en Azure Portal

  • Actualización del modelo de documento de identificador: los nombres especificados, incluido un sufijo, con o sin un punto (punto final), se procesan correctamente:

    Texto de entrada Resultado con actualización
    William Isaac Kirby Jr. FirstName: William Isaac

    LastName: Kirby Jr.
    Henry Caleb Ross Sr FirstName: Henry Caleb

    LastName: Ross Sr

Julio de 2021

Compatibilidad con la identidad administrada asignada por el sistema

Ahora puede habilitar una identidad administrada asignada por el sistema para conceder a Form Recognizer acceso limitado a cuentas de almacenamiento privadas, incluidas las protegidas por una red virtual (VNet) o un firewall, o bien tener habilitada la funcionalidad Bring Your Own Storage (BYOS). Consulte Creación y uso de identidades administradas para el recurso de Form Recognizer para más información.

Junio de 2021

Publicación de contenedores de Form Recognizer v2.1 en versión preliminar validada

Las características de Form Recognizer son ahora compatibles con seis contenedores de características: Diseño, Tarjeta de presentación, Documento de identificación, Recibo, Factura y Personalizado. Para usarlos, debe enviar una solicitud en línea y recibir la aprobación.

Consulte Instalación y ejecución de contenedores de Docker para Form Recognizer y Configuración de contenedores de Form Recognizer.

Publicación del conector de Form Recognizer en versión preliminar

El conector de Form Recognizer se integra con Azure Logic Apps, Microsoft Power Automate y Microsoft Power Apps. El conector admite acciones y desencadenadores de flujo de trabajo para extraer y analizar los datos y la estructura de los documentos de formularios, facturas, recibos, tarjetas de presentación y documentos de identificación personalizados y creados previamente.

Revisión del SDK de Form Recognizer v3.1.0 a v3.1.1 para C#, Java y Python

La revisión aborda las facturas sin campos de elementos de sublínea detectados, como un elemento FormField con Text, pero sin información de BoundingBox o Page.

Mayo de 2021

API de Form Recognizer 2.1, versión de disponibilidad general (GA)

Primeros pasos

Vaya a la herramienta de ejemplo de Form Recognizer y siga el inicio rápido.

Adición de encabezados de tabla por diseño

La característica de tabla de la API de diseño actualizada agrega el reconocimiento de encabezados con encabezados de columna que pueden abarcar varias filas. Cada celda de tabla tiene un atributo que indica si forma parte de un encabezado o no. Esto se puede usar para identificar qué filas son el encabezado de tabla.

Actualizaciones del SDK

| Documentación de referencia | Paquete NuGet, versión 3.0.1 |

Cambios secundarios

  • La clase FormRecognizerModelFactory admite ahora actualizaciones de TextAppearance y ReadingOrder y la eliminación de modelos TextStyle. Consulte Cambios importantes.

Cambios importantes (mayo)

  • El cliente tiene como valor predeterminado la versión más reciente del servicio compatible, actualmente la v2.1. Puede especificar la versión 2.0 en la propiedad Version del objeto FormRecognizerClientOptions.

  • StartRecognizeIdentityDocuments. Se ha cambiado el nombre de los métodos y los parámetros de método que usaban Identity para reemplazar la palabra clave Id en el caso de todas las funcionalidades de API de reconocimiento de documentos de identidad relacionadas.

  • FormReadingOrder. ReadingOrder ha pasado a denominarse FormReadingOrder.

  • AsCountryRegion. AsCountryCode ha pasado a denominarse AsCountryRegion.

  • TextAppearance incluye ahora las propiedades StyleName y StyleConfidence (anteriormente parte del objeto TextStyle).

  • FieldValueType. Se ha eliminado el valor Gender del modelo.

  • Se ha eliminado el modelo TextStyle.

  • Se ha eliminado el tipo FieldValueGender.

Abril de 2021

Actualizaciones de la versión preliminar del SDK para la API versión 2.1-preview.3

Paquete NuGet, versión 3.1.0-beta.4

  • Nuevos métodos para analizar datos de documentos de identidad:

    StartRecognizeIdDocumentsFromUriAsync

    StartRecognizeIdDocumentsAsync

    Para obtener una lista de los valores de campos, consulte Campos extraídos en la documentación de Form Recognizer.

  • Se ha ampliado el conjunto de idiomas de documento que se pueden proporcionar al método StartRecognizeContent .

  • Nueva propiedad Pages compatible con las clases siguientes:

    RecognizeBusinessCardsOptions
    RecognizeCustomFormsOptions
    RecognizeInvoicesOptions
    RecognizeReceiptsOptions

    La propiedad Pages le permite seleccionar páginas individuales o un intervalo de ellas para los documentos PDF y TIFF de varias páginas. Si quiere elegir páginas individuales, escriba el número de página: por ejemplo, 3. Si quiere elegir un intervalo de páginas (como las páginas 2 y 5-7), escriba los números de página y los intervalos separados por comas: 2, 5-7.

  • Nueva propiedad ReadingOrder compatible con las clases siguientes:

    RecognizeContentOptions

    La propiedad ReadingOrder es un parámetro opcional que permite especificar cuál algoritmo de orden de lectura, basic o natural, se debe aplicar para ordenar la extracción de los elementos de texto. Si no se especifica, el valor predeterminado es basic.

Cambios importantes (abril)

  • El cliente tiene como valor predeterminado la versión del servicio más reciente que sea compatible. Actualmente, es 2.1-preview.3.

  • El método StartRecognizeCustomForms ahora genera una excepción RequestFailedException() cuando se pasa un archivo no válido.

Marzo de 2021

Ya está disponible la versión preliminar pública 3 de Form Recognizer v2.1. Se ha publicado la versión v2.1-preview.3, que incluye las siguientes características:

  • Nuevo modelo de identificación precompilado El nuevo modelo de identificación precompilado permite a los clientes tomar identificaciones y devolver datos estructurados para automatizar el procesamiento. Combina nuestras potentes capacidades de reconocimiento óptico de caracteres (OCR) con modelos de reconocimiento de identificación para extraer información clave de los pasaportes y los carnés de conducir de EE. UU., como el nombre, la fecha de nacimiento, la fecha de la fecha de caducidad, etc.

    Más información sobre el modelo de identificación precompilado

    ejemplo de pasaporte

  • Extracción de elemento de línea para modelo de factura: el modelo de factura precompilado ahora admite la extracción de elementos de línea; ahora se extraen los elementos completos y sus partes: descripción, importe, cantidad, id. de producto, fecha y mucho más. Con una sencilla llamada de API/SDK, puede extraer datos útiles de las facturas (texto, tabla, pares clave-valor y elementos de línea).

    Más información sobre el modelo de factura

  • Etiquetado y entrenamiento de tablas supervisados, etiquetado de valores vacíos: además de las funciones de aprendizaje profundo para la extracción de tablas automáticamentede Form Recognizer, ahora permite que los clientes etiqueten y entrenen tablas. Esta nueva versión incluye la posibilidad de etiquetar y entrenar en elementos de línea y tablas (dinámicas y fijas) y entrenar un modelo personalizado para extraer pares clave-valor y elementos de línea. Una vez que se entrena un modelo, este extrae los elementos de línea como parte de la salida JSON en la sección documentResults.

    Etiquetado de tabla

    Además de etiquetar tablas, ahora puede etiquetar regiones y valores vacíos. Si algunos documentos del conjunto de entrenamiento no tienen valores para determinados campos, puede etiquetarlos para que el modelo sepa que se van a extraer los valores correctamente de los documentos analizados.

  • Compatibilidad con 66 nuevos idiomas: la API de diseño y los modelos personalizados de Form Recognizer ahora admiten 73 idiomas.

    Más información sobre la compatibilidad con idiomas de Form Recognizer

  • Orden de lectura natural, clasificación de escritura a mano y selección de página: con esta actualización, puede optar por obtener los resultados de la línea de texto en el orden de lectura natural, en lugar de la ordenación predeterminada de izquierda a derecha y de arriba hacia abajo. Use el nuevo parámetro de consulta readingOrder y establézcalo en el valor "natural" para obtener una salida de orden de lectura más fácil de usar. Además, en el caso de los idiomas latinos, Form Recognizer clasificará las líneas de texto como estilo manuscrito o no y dará una puntuación de confianza.

  • Mejoras en la calidad del modelo de recepción precompilado: esta actualización incluye varias mejoras de calidad para el modelo de recepción precompilado, especialmente en lo que respecta a la extracción de elementos de línea.

Noviembre de 2020

Nuevas características

Ya está disponible la versión preliminar pública 2 de Form Recognizer v2.1. Se ha publicado la versión V2.1-preview.2, que incluye las siguientes características:

  • Nuevo modelo de factura precompilado: el nuevo modelo de factura precompilado permite a los clientes tomar facturas en muchos formatos y devolver datos estructurados para automatizar el procesamiento de facturas. Combina nuestras eficaces funcionalidades de reconocimiento óptico de caracteres (OCR) con modelos de aprendizaje profundo de reconocimiento de facturas para extraer información clave de facturas en inglés. Extrae el texto clave, las tablas y la información como el cliente, el proveedor, el identificador de la factura, la fecha de vencimiento de la factura, el total, el importe debido, el importe de los impuestos, la dirección de envío y la dirección de facturación.

    Más información sobre el modelo de factura precompilado

    Ejemplo de factura

  • Extracción de tablas mejorada: Form Recognizer ahora proporciona una extracción de tablas mejorada, que combina nuestras eficaces funcionalidades de reconocimiento óptico de caracteres (OCR) con un modelo de extracción de tablas de aprendizaje profundo. Form Recognizer puede extraer datos de tablas, lo que incluye tablas complejas con columnas combinadas, filas, sin bordes, etc.

    Tablas de ejemplo

    Más información sobre la extracción de Layout

  • Actualización de la biblioteca cliente: las versiones más recientes de las bibliotecas cliente para .NET, Python, Java y JavaScript admiten la API de Form Recognizer 2.1.

  • Nuevo idioma admitido ( japonés): ahora se admite el siguiente idiomas nuevos para AnalyzeLayout y AnalyzeCustomForm: japonés (ja). Compatibilidad con idiomas

  • Indicación de estilo de línea de texto (manuscrito/otros) (solo idiomas romance) : Form Recognizer ahora genera un objeto appearance que clasifica si cada línea de texto tiene estilo manuscrito o no, junto con una puntuación de confianza. Esta característica solo es compatible con los idiomas derivados del latín.

  • Mejoras en la calidad: mejoras en la extracción, lo que incluye mejoras en la extracción de dígitos individuales.

  • Nueva característica para realizar pruebas en las herramientas de etiquetado y de ejemplo de Form Recognizer: mediante la herramienta de etiquetado de ejemplo de Form Recognizer se pueden probar los modelos de factura, recibo y tarjeta de presentación precompilados y la API Layout. Vea cómo se extraen los datos sin escribir código.

    Probar la herramienta de etiquetado de ejemplo de Form Recognizer

    Captura de pantalla: herramienta de etiquetado de ejemplo

  • Bucle de comentarios: si se usa la herramienta de etiquetado de ejemplo para analizar archivos, ahora también se puede agregar al conjunto de entrenamiento, ajustar las tablas si fuera necesario y entrenar para mejorar el modelo.

  • Etiquetado automático de documentos: etiqueta automáticamente documentos adicionales en función de documentos ya etiquetados existentes en el proyecto.

Agosto de 2020

Nuevas características

Ya está disponible la versión preliminar pública de Form Recognizer v2.1. Se ha publicado V2.1-preview.1, incluidas las siguientes características:

  • Está disponible la referencia de la API de REST: vea la referencia de v2.1-preview.1
  • Se admiten nuevos idiomas además del inglés: ahora se admiten los siguientes idiomas para Layout y Train Custom Model: inglés (en), chino (simplificado) (zh-Hans), neerlandés (nl), francés (fr), alemán (de), italiano (it), portugués (pt) y español (es).
  • Detección de marcas de selección o casillas: Form Recognizer admite la detección y extracción de marcas de selección, como casillas y botones de radio. Las marcas de selección se extraen de Layout y ahora también es posible etiquetar y entrenar en Train Custom Model - Entrenamiento con etiquetas para extraer pares clave-valor de marcas de selección.
  • Composición de modelos: permite que se compongan varios modelos y que se llamen con un único identificador de modelo. Cuando envía un documento para que se analice con un identificador de modelo compuesto, primero se realiza un paso de clasificación para enrutarlo al modelo personalizado correcto. La composición de modelos está disponible para Train Custom Model - Entrenamiento con etiquetas.
  • Nombre de modelo: agregue un nombre descriptivo a los modelos personalizados para facilitar su administración y seguimiento.
  • Nuevo modelo precompilado para tarjetas de presentación para extraer campos comunes de tarjetas de presentación (en inglés).
  • Nuevas configuraciones regionales para recibos precompilados : además de EN-US, ahora se admiten EN-AU, EN-CA, EN-GB y EN-IN.
  • Mejoras de calidad para Layout, Train Custom Model - Entrenamiento sin etiquetas y Entrenamiento con etiquetas.

La versión 2.0 incluye la siguiente actualización:

  • Las bibliotecas cliente para NET, Python, Java y JavaScript ahora tienen disponibilidad general.

Hay nuevos ejemplos disponibles en GitHub.

Julio de 2020

Nuevas características

  • Referencia de v2.0 disponible: consulte la referencia de la API v2.0 y los SDK actualizados para .NET, Python, Java y JavaScript.

  • Mejoras en tablas y extracciones: incluye mejoras tanto en la precisión como en las extracciones de tablas, en concreto, la funcionalidad para aprender encabezados y estructuras de tablas en el entrenamiento personalizado sin etiquetas.

  • Compatibilidad de divisas: detección y extracción de símbolos de moneda globales.

  • Azure Gov: Form Recognizer ya está disponible también en Azure Gov.

  • Características de seguridad mejoradas:

    • Bring Your Own Key: Form Recognizer cifra automáticamente los datos cuando se guardan en la nube para protegerlos y para ayudarle a satisfacer los compromisos de cumplimiento y de seguridad de la organización. De forma predeterminada, su suscripción usa claves de cifrado administradas por Microsoft. Ahora también puede administrar la suscripción con sus propias claves de cifrado. Las claves administradas por el cliente (CMK), que también se conocen como Bring Your Own Key, ofrecen más flexibilidad para crear, rotar, deshabilitar y revocar controles de acceso. También permite auditar las claves de cifrado que se usan para proteger los datos.
    • Puntos de conexión privados: le permiten acceder de forma segura a los datos a través de Private Link en una red virtual.

Junio de 2020

Nuevas características

Abril de 2020

Nuevas características

  • Compatibilidad del SDK con la versión preliminar pública de la API Form Recognizer v2.0: este mes hemos ampliado nuestro servicio de soporte técnico para incluir un SDK de versión preliminar para la versión 2.0 (versión preliminar) de Form Recognizer. Use los vínculos siguientes para empezar a trabajar con el lenguaje que prefiera:

    El nuevo SDK es compatible con todas las características de la API REST v 2.0 de Form Recognizer. Por ejemplo, puede entrenar un modelo con o sin etiquetas y extraer texto, pares clave-valor y tablas de los formularios; extraer datos de las confirmaciones con el servicio de confirmaciones pregeneradas; y extraer texto y tablas con el servicio de diseño de los documentos. Puede compartir sus comentarios sobre los SDK mediante el formulario de comentarios de SDK.

  • Copia del modelo personalizado Ahora puede copiar modelos entre regiones y suscripciones mediante la nueva característica Copiar modelo personalizado. Antes de invocar la API Copy Custom Model, primero debe obtener la autorización para realizar copias en el recurso de destino mediante la llamada a la operación de autorización de copia en el punto de conexión del recurso de destino.

Mejoras de seguridad

Marzo de 2020

Nuevas características

  • Tipos de valor para etiquetar: ahora puede especificar los tipos de valores que va a etiquetar con la herramienta de etiquetado de ejemplo de Form Recognizer. Actualmente se admiten los siguientes tipos de valor y variaciones:

    • string
      • predeterminado, no-whitespaces, alphanumeric
    • number
      • predeterminado, currency
    • date
      • predeterminado, dmy, mdy, ymd
    • time
    • integer

    Para aprender a usar esta característica, consulte la herramienta de etiquetado de ejemplo.

  • Visualización de tablas: la herramienta de etiquetado de ejemplo ahora muestra las tablas que se reconocieron en el documento. Esta característica permite ver las tablas que se han reconocido y extraído del documento antes de etiquetarlas y analizarlas. Esta característica se puede activar o desactivar mediante la opción de capas.

    La siguiente imagen es un ejemplo de cómo se reconocen y extraen las tablas:

    Visualización de tablas mediante la herramienta de etiquetado de ejemplo

    Las tablas extraídas están disponible en la salida JSON en "pageResults".

    Importante

    No se admite el etiquetado de tablas. Si las tablas no se reconocen ni se extraen automáticamente, solo se pueden etiquetar como pares clave-valor. Al etiquetar tablas como pares clave-valor, etiquete cada celda como un valor único.

Mejoras de extracción

Esta versión incluye mejoras de extracción y mejoras de precisión, en concreto, la capacidad de etiquetar y extraer varios pares clave-valor en la misma línea de texto.

La herramienta de etiquetado de ejemplo ahora es de código abierto

La herramienta de etiquetado de ejemplo de Form Recognizer ahora está disponible como proyecto de código abierto. Puede integrarla en sus soluciones y realizar cambios específicos del cliente para satisfacer sus necesidades.

Para más información sobre la herramienta de etiquetado de ejemplo de Form Recognizer, revise la documentación disponible en GitHub.

Cumplimiento de TLS 1.2

TLS 1.2 ya se exige en todas las solicitudes HTTP para este servicio. Para más información, consulte Seguridad de Azure Cognitive Services.

Enero de 2020

En esta versión se introduce Form Recognizer 2.0 (versión preliminar). En las secciones siguientes encontrará más información sobre nuevas características, mejoras y cambios.

Nuevas características

  • Modelo personalizado

    • Entrenar con etiquetas Ahora puede entrenar un modelo personalizado con datos etiquetados manualmente. Este método genera modelos con un mejor rendimiento y puede generar modelos que funcionen con formularios complejos o formularios que contengan valores sin claves.
    • API asincrónica Puede usar llamadas API asincrónicas para entrenar y analizar grandes conjuntos de datos y archivos.
    • Compatibilidad con archivos TIFF Ahora puede entrenar y extraer datos de documentos TIFF.
    • Mejoras en la precisión de la extracción
  • Modelo de recibo pregenerado

    • Importes de propinas Ahora puede extraer importes de propina y otros valores escritos a mano.
    • Extracción de elementos de línea Puede extraer valores de elementos de línea de recibos.
    • Valores de confianza Puede ver la confianza del modelo para cada valor extraído.
    • Mejoras en la precisión de la extracción
  • Extracción de diseño Ahora puede usar la API de diseño para extraer datos de texto y datos de tabla de los formularios.

Cambios en la API del modelo personalizado

Se ha cambiado el nombre de todas las API de entrenamiento y uso de modelos personalizados y algunos métodos sincrónicos son asincrónicos ahora. A continuación se indican los cambios principales:

  • El proceso de entrenamiento de un modelo es ahora asincrónico. Inicie el entrenamiento mediante la llamada API /custom/models. Esta llamada devuelve un identificador de operación, que se puede pasar a custom/models/{modelID} para devolver los resultados del entrenamiento.
  • La extracción de clave y valor se inicia ahora mediante la llamada API /custom/models/{modelID}/analyze. Esta llamada devuelve un identificador de operación, que se puede pasar a custom/models/{modelID}/analyzeResults/{resultID} para devolver los resultados de la extracción.
  • Los identificadores de operación de la operación de entrenamiento se encuentran ahora en el encabezado Location de las respuestas HTTP, no en el encabezado Operation-Location.

Cambios en la API del recibo

Se ha cambiado el nombre de las API para leer recibos de venta.

  • La extracción de datos de recibo ahora se inicia mediante la llamada API /prebuilt/receipt/analyze. Esta llamada devuelve un identificador de operación, que se puede pasar a /prebuilt/receipt/analyzeResults/{resultID} para devolver los resultados de la extracción.

Cambios del formato de salida

Las respuestas JSON para todas las llamadas API tienen nuevos formatos. Algunas claves y valores se han agregado, quitado o cambiado de nombre. Consulte las guías de inicio rápido para obtener ejemplos de los formatos JSON actuales.

Pasos siguientes

Complete un inicio rápido para empezar a escribir una aplicación de procesamiento de formularios con Form Recognizer en el lenguaje de desarrollo que prefiera.

Consulte también