Novedades de Documento de inteligencia de Azure AI

Este contenido se aplica a:checkmarkv4.0 (versión preliminar)checkmarkv3.1 (GA)checkmarkv3.0 (GA)checkmarkv2.1 (GA)

El servicio Documento de inteligencia se actualiza de forma continua. Marque esta página para mantenerse al día con las notas de la versión, las mejoras de características y la documentación más reciente.

Importante

Las versiones preliminares de la API se retiran una vez publicada la API de disponibilidad general. La versión 2023-02-28-preview de la API se va a retirar. Si sigue usando la API de la versión preliminar o las versiones del SDK asociadas, actualice el código de forma que indique la última versión de la API, 2023-07-31 (GA).

Febrero de 2024

La API de REST de Documento de inteligencia 2024-02-29-preview ya está disponible. Esta API en versión preliminar presenta funcionalidades nuevas y actualizadas:

  • La versión preliminar pública 2024-02-29-preview solo está disponible actualmente en las siguientes regiones de Azure:

    • Este de EE. UU.
    • Oeste de EE. UU. 2
    • Oeste de Europa
  • El modelo de diseño ahora admite la detección de imágenes y el análisis jerárquico de la estructura de documentos (secciones y subsecciones). También se ha mejorado la calidad de inteligencia artificial del orden de lectura y la detección de roles lógicos.

  • Modelos de extracción personalizados

    • Los modelos de extracción personalizados admiten ahora puntuaciones de confianza de nivel de celda, fila y tabla. Obtenga más información sobre la confianza de tabla, fila y celda.
    • Los modelos de extracción personalizados cuentan con mejoras de calidad de la IA para la extracción de campos.
    • El modelo de extracción de plantillas personalizado admite ahora la extracción de campos superpuestos. Obtenga más información sobre los campos superpuestos y cómo se usan.
  • Modelos de clasificación personalizados

    • El modelo de clasificación personalizado admite ahora el entrenamiento incremental para los escenarios en los que es necesario actualizar el modelo de clasificador con ejemplos o clases adicionales. Obtenga más información sobre el entrenamiento incremental.
    • El modelo de clasificación personalizado agrega compatibilidad con ciertos tipos de documentos de Office (.docx, .pptx y .xls). Obtenga más información sobre la compatibilidad ampliada con tipos de documento.
  • Modelo de factura

    • Compatibilidad con nuevas configuraciones regionales:
    Configuración regional Código
    Árabe (ar)
    Búlgaro (bg)
    Griego (el)
    Hebreo (he)
    Macedonio (mk)
    Ruso (ru) Serbio cirílico (sr-cyrl)
    Ucraniano (uk)
    Tailandés (th)
    Turco (tr)
    Vietnamita (vi)
    • Compatibilidad con nuevos códigos de moneda:
    Moneda Configuración regional Código
    BAM Marco convertible de Bosnia (ba)
    BGN Lev búlgaro (bg)
    ILS Nuevo séquel israelí (il)
    MKD Denar de Macedonia (mk)
    RUB Rublo ruso (ru)
    THB Baht tailandés (th)
    TRY Lira turca (tr)
    UAH Grivna de Ucrania (ua)
    VND Dong vietnamita (vn)
    • Los elementos fiscales admiten la expansión para Alemania (de), España (es), Portugal (pt), Inglés de Canadá en-CA.
  • Modelo de identificador

  • 🆕 Documentos de hipotecas

    • Extraiga información de solicitud uniforme de préstamo residencial (formulario 1003).
    • Extraiga información de la suscripción uniforme y el resumen de transmisión o el formulario 1008.
    • Extraiga información de la divulgación de cierre de hipoteca.
  • 🆕 Modelo de tarjeta de crédito o débito

    • Extraiga información de las tarjetas bancarias.
  • 🆕 Certificado de matrimonio

    • Nuevo elemento precompilado para extraer información de los certificados de matrimonio.

Diciembre de 2023

Las bibliotecas cliente de Document Intelligence que tienen como destino la API REST 2023-10-31-preview ya están disponibles para su uso.

Noviembre de 2023

La API REST de Documento de inteligencia 2023-10-31-preview ya está disponible. Esta API en versión preliminar presenta funcionalidades nuevas y actualizadas:

  • Actualmente, la versión preliminar pública 2023-10-31-preview solo está disponible en las siguientes regiones de Azure:

    • Este de EE. UU.
    • Oeste de EE. UU. 2
    • Oeste de Europa
  • Modelo de lectura

    • Ampliación de idiomas para la escritura a mano: ruso (ru), árabe (ar), tailandés (th).
    • Cumplimiento de la Orden Ejecutiva Cibernética (EO).
  • Modelo de diseño

    • Compatibilidad con archivos de Office y HTML.
    • Compatibilidad con la salida de Markdown.
    • Mejoras en la extracción de tablas, el orden de lectura y la detección de encabezados de sección.
    • A partir de Documento de inteligencia 2023-10-31-preview, el modelo de documento general (prebuilt-document) queda en desuso. En el futuro, para extraer pares clave-valor de los documentos, use el modelo prebuilt-layout con el parámetro opcional de cadena de consulta features=keyValuePairs habilitado.
  • Modelo de recibo

    • Ahora se extrae la moneda de todos los campos relacionados con el precio.
  • Modelo de tarjeta de seguro médico

    • Compatibilidad de nuevos campos para la información de Medicare y Medicaid.
  • Modelos de documentos fiscales de EE. UU.

    • Nuevo modelo fiscal 1099. Admite el formulario 1099 y las variaciones siguientes: A, B, C, CAP, DIV, G, H, INT, K, LS, LTC, MISC, NEC, OID, PATR, Q, QA, R, S, SA, SB.
  • Modelo de factura

    • Compatibilidad con el campo KVK.
    • Compatibilidad con el campo BPAY.
    • Numerosos refinamientos de campo.
  • Clasificación personalizada

    • Compatibilidad con documentos de varios idiomas.
    • Nuevas opciones de división de páginas: división automática, división siempre por página, sin división.
  • Funcionalidades de complementos

    • Los campos de consulta están disponibles con la versión 2023-10-31-preview.
    • Las funcionalidades de complementos están disponibles en todos los modelos, excepto el modelo de lectura.

Nota:

Con la versión de disponibilidad general (GA) de la API 2022-08-31, las API de versión preliminar asociadas están en desuso. Si usa las versiones preliminares de la API 2021-09-30, 2022-01-30 o 2022-06-30, actualice las aplicaciones para que tengan como destino la versión de la API 2022-08-31. Para obtener más información sobre algunos cambios menores relacionados, consulte la guía de migración.

Julio de 2023

Nota:

Form Recognizer ahora es Documento de inteligencia de Azure AI.

  • Los servicios de Azure AI de documentación engloban todo lo que antes se conocía como Cognitive Services y Azure Applied AI Services.
  • No hay ningún cambio en los precios.
  • Los nombres Cognitive Services y Azure Applied AI siguen utilizándose en las API de facturación, análisis de costes, listas de precios y precios de Azure.
  • No hay cambios importantes en las interfaces de programación de aplicaciones (API) ni en las bibliotecas de cliente.
  • Algunas plataformas siguen esperando la actualización de cambio de nombre. Todas las menciones de Form Recognizer o Documento de inteligencia en nuestra documentación se refieren al mismo servicio de Azure.

Documento de inteligencia v3.1 (GA)

La API de Documento de inteligencia versión 3.1 ya está disponible con carácter general (GA). La versión de la API se corresponde con 2023-07-31. La API v3.1 presenta funcionalidades nuevas y actualizadas:

Actualizaciones de la experiencia del usuario de Document Intelligence Studio

✔️ Opciones de análisis

  • Document Intelligence ahora admite funcionalidades de análisis más sofisticadas y Studio permite un punto de entrada (botón Opciones de análisis) para configurar las funcionalidades del complemento con facilidad.

  • Según el escenario de extracción de documentos, configure el intervalo de análisis, el intervalo de páginas del documento, la detección opcional y las características de detección premium.

    Animated screenshot showing use of the analyze-options button to configure options in Studio.

    Nota:

    La extracción de fuentes no se visualiza en Document Intelligence Studio. Sin embargo, puede comprobar la sección de estilos de la salida JSON para los resultados de detección de fuentes.

✔️ Etiquetado automático de documentos con modelos precompilados o uno de sus propios modelos

  • En la página de etiquetado de modelos de extracción personalizados, ahora puede etiquetar automáticamente los documentos con uno de los modelos precompilados del servicio Documento de inteligencia o con modelos que haya entrenado antes.

    Animated screenshot showing auto labeling in Studio.

  • Para algunos documentos, puede haber etiquetas duplicadas después de ejecutar la etiqueta automática. Asegúrese de modificar las etiquetas para que no haya etiquetas duplicadas en la página de etiquetado después.

    Screenshot showing duplicate label warning after auto labeling.

✔️ Tablas de etiquetado automático

  • En la página de etiquetado del modelo de extracción personalizada, ahora puede etiquetar automáticamente las tablas del documento sin tener que etiquetar las tablas manualmente.

    Animated screenshot showing auto table labeling in Studio.

✔️ Agregar archivos de prueba directamente al conjunto de datos de entrenamiento

  • Una vez que haya entrenado un modelo de extracción personalizado, use la página de prueba para mejorar la calidad del modelo cargando documentos de prueba en el conjunto de datos de entrenamiento si es necesario.

  • Si se devuelve una puntuación de confianza baja para algunas etiquetas, asegúrese de que están etiquetadas correctamente. Si no es así, agréguelos al conjunto de datos de entrenamiento y vuelva a etiquetarlos para mejorar la calidad del modelo.

Animated screenshot showing how to add test files to training dataset.

✔️ Usar las opciones y filtros de la lista de documentos en proyectos personalizados

  • Use la página de etiquetado del modelo de extracción personalizado. Ahora puede navegar por los documentos de entrenamiento con facilidad mediante la búsqueda, el filtro y la ordenación por característica.

  • Utilice la vista de cuadrícula para obtener una vista previa de los documentos o use la vista de lista para desplazarse por los documentos más fácilmente.

    Screenshot showing document list view options and filters.

✔️ Uso compartido de proyectos

Mayo de 2023

Introducción a la documentación actualizada para Build 2023

abril de 2023

Anuncio de la versión preliminar pública de la biblioteca cliente de Documento de inteligencia más reciente

Marzo de 2023

Importante

Actualmente, 2023-02-28-preview capacidades solo están disponibles en las siguientes regiones:

  • Oeste de Europa
  • Oeste de EE. UU. 2
  • Este de EE. UU.

Febrero de 2023


Enero de 2023

  • Modelo de recibo precompilado: se admiten idiomas agregados. El modelo de recibo ahora admite estos idiomas y configuraciones regionales agregados:

    • Japonés, Japón (ja-JP)
    • Francés, Canadá (fr-CA)
    • Holandés, Países Bajos (nl-NL)
    • Inglés, Emiratos Árabes Unidos (en-AE)
    • Portugués, Brasil (pt-br)
  • Modelo de factura precompilado: se admiten idiomas agregados. El modelo de factura ahora admite estos idiomas y configuraciones regionales agregados:

    • Inglés: Estados Unidos (en-US), Australia (en-AU), Canadá (en-CA), Reino Unido (en-UK), India (en-IN)
    • Español: España (es-ES)
    • Francés: Francia (fr-FR)
    • Italiano: Italia (it-IT)
    • Portugués: Portugal (pt-PT)
    • Holandés, Países Bajos (nl-NL)
  • Modelo de factura precompilado: se reconocen campos agregados. El modelo de factura ahora reconoce estos campos agregados:

    • Código de moneda
    • Opciones de pago
    • Descuento total
    • Elementos fiscales (solo en-IN)
  • Modelo de identificación precompilado: se admiten tipos de documento agregados. El modelo de identificación ahora admite estos tipos de documento agregados:

    • Identificación militar de EE. UU.

Sugerencia

Todas las actualizaciones de enero de 2023 están disponibles con la versión API de REST 2022-08-31 (disponibilidad general).

  • Modelo precompilado de recibos (compatibilidad con idiomas adicionales):

    El modelo de recibo precompilado agrega compatibilidad con los siguientes idiomas:

    • Inglés, Emiratos Árabes Unidos (en-AE)
    • Holandés, Países Bajos (nl-NL)
    • Francés, Canadá (fr-CA)
    • Alemán: (de-DE)
    • Italiano: (it-IT)
    • Japonés, Japón (ja-JP)
    • Portugués, Brasil (pt-br)
  • Modelo precompilado de factura (compatibilidad con idiomas adicional y extracciones de campo)

    El modelo de factura precompilado agrega compatibilidad con los siguientes idiomas:

    • Inglés: Australia (en-AU), Canadá (en-CA), Reino Unido (en-UK), India (en-IN)
    • Portugués, Brasil (pt-br)

    El modelo de factura precompilado ahora admite las siguientes extracciones de campos:

    • Código de moneda
    • Opciones de pago
    • Descuento total
    • Elementos fiscales (solo en-IN)
  • Modelo precompilado de documento de id. (compatibilidad con tipos de documentos adicional)

    El modelo de documento de identificación precompilado ahora agrega compatibilidad con los siguientes tipos de documentos:

    • Expansión de licencias de conducir que respalda la India, Canadá, Reino Unido y Australia
    • Documentos y tarjetas de identificación militares estadounidenses
    • Documentos y tarjetas de identificación de la India (PAN y Aadhaar)
    • Tarjetas de identificación y documentos de Australia (tarjeta de foto, id. Key-pass)
    • Tarjetas de identificación y documentos de Canadá (tarjeta de identificación, tarjeta Maple)
    • Tarjetas de identificación y documentos del Reino Unido (tarjeta de identidad nacional/regional)

Diciembre de 2022

  • Actualizaciones de Document Intelligence Studio

    En la versión de diciembre de Document Intelligence Studio se incluyen las actualizaciones más recientes de Document Intelligence Studio. Hay importantes mejoras en la experiencia del usuario, principalmente con compatibilidad con el etiquetado de modelos personalizado.

    • Intervalo de páginas Ahora Studio admite el análisis de páginas especificadas desde un documento.

    • Etiquetado de modelos personalizados:

      • Ejecución de la API de diseño automáticamente. Puede optar por ejecutar la API de diseño para todos los documentos automáticamente en el almacenamiento de blobs durante el proceso de configuración del modelo personalizado.

      • Búsqueda. Studio ahora incluye la funcionalidad de búsqueda para buscar palabras dentro de un documento. Esta mejora permite una navegación más sencilla mientras se etiqueta.

      • Navegación Puede seleccionar etiquetas para dirigirse a palabras etiquetadas dentro de un documento.

      • Etiquetado automático de tablas Después de seleccionar el icono de tabla dentro de un documento, puedes optar por etiquetar automáticamente la tabla extraída en la vista de etiquetado.

      • Subtipos de etiqueta y subtipos de segundo nivel Studio admite ahora subtipos para columnas de tabla, filas de tabla y subtipos de segundo nivel para tipos como fechas y números.

  • La creación de modelos neuronales personalizados ahora se admite en la región US Gov Virginia.

  • Las versiones preliminares de la API 2022-01-30-preview y 2021-09-30-preview se retirarán el 31 de enero de 2023. Actualice a la versión de la API 2022-08-31 para evitar cualquier interrupción del servicio.


Noviembre de 2022

  • Anuncio de la versión estable más reciente de las bibliotecas de Documento de inteligencia de Azure AI
    • Esta versión incluye cambios y actualizaciones importantes para las bibliotecas cliente de .NET, Java, JavaScript y Python. Para obtener más información, consulteDevBlog del SDK de Azure.
    • Las mejoras más significativas consisten en la introducción de dos nuevos clientes, DocumentAnalysisClient y DocumentModelAdministrationClient.

Octubre de 2022

  • Contenido con versiones de Documento de inteligencia

    • La documentación de Documento de inteligencia se ha actualizado para presentar una experiencia con versiones. Ahora, puede elegir ver el contenido orientado a la experiencia de v3.0 GA o a la experiencia de v2.1 GA. La experiencia v3.0 es la predeterminada.

      Screenshot of the Document Intelligence landing page denoting the version dropdown menu.

  • Código de ejemplo de Document Intelligence Studio

    • El código de ejemplo para la experiencia de etiquetado de Document Intelligence Studio ya está disponible en GitHub. Los clientes pueden desarrollar e integrar Documento de inteligencia en su propia experiencia del usuario, o bien crearla mediante el código de ejemplo de Document Intelligence Studio.
  • Expansión de idioma

    • Con la versión preliminar más reciente, los modelos de plantillas de lectura (OCR), diseño y personalización de Documento de inteligencia admiten 134 nuevos idiomas. Estas adiciones lingüísticas incluyen griego, letón, serbio, tailandés, ucraniano y vietnamita, junto con varios idiomas latinos y cirílicos. Ahora Documento de inteligencia admite un total de 299 idiomas en las versiones de disponibilidad general más recientes y nuevas versiones preliminares. Consulte la página idiomas admitidos para ver todos los idiomas admitidos.
    • Use el parámetro api-version=2022-06-30-preview de la API de REST al usar la API o el SDK correspondiente para admitir los nuevos lenguajes de las aplicaciones.
  • Nuevo modelo de contrato precompilado

    • Nuevo modelo precompilado que extrae información de contratos, como entidades, título, id. de contrato, fecha de ejecución y mucho más. el modelo de contratos está actualmente en versión preliminar y solicita acceso aquí.
  • Expansión de regiones para entrenar modelos neuronales personalizados

    • Ahora el entrenamiento de modelos neuronales personalizados es compatible con regiones agregadas.
      • Este de EE. UU.
      • Este de EE. UU. 2
      • US Gov: Arizona

Septiembre de 2022

Nota:

A partir de la versión 4.0.0, se ha introducido un nuevo conjunto de clientes para aprovechar las características más recientes del servicio Documento de inteligencia.

La versión de disponibilidad general de la versión 4.0.0 del SDK incluye las siguientes actualizaciones:

  • Versión 4.0.0 GA (2022-09-08)
  • Compatibilidad con clientes de REST API v3.0 y v2.0

Paquete (NuGet)

Registro de cambios/Historial de versiones

Guía de migración

Léame

Muestras

  • La expansión de regiones para entrenar modelos neuronales personalizados ahora se admite en seis nuevas regiones

    • Este de Australia
    • Centro de EE. UU.
    • Este de Asia
    • Centro de Francia
    • Sur de Reino Unido 2
    • Oeste de EE. UU. 2
    • Para ver una lista completa de las regiones en que se admite el entrenamiento, consulte modelos neuronales personalizados.

    • Versión 4.0.0 GA del SDK de Documento de inteligencia:

      • Bibliotecas de cliente de Document Intelligence versión 4.0.0 (.NET/C#, Java, JavaScript) y la versión 3.2.0 (Python) están disponibles con carácter general y listos para su uso en aplicaciones de producción.
      • Para obtener más información sobre las bibliotecas cliente de Document Intelligence, consulte la introducción a SDK.
      • Actualice las aplicaciones mediante la guía de migración del lenguaje de programación.

Agosto de 2022

La versión preliminar beta del SDK de Documento de inteligencia de agosto de 2022 incluye las siguientes actualizaciones:

  • Documento de inteligencia v3.0 está disponible con carácter general

    • La API REST de Documento de inteligencia v3.0 ya está disponible con carácter general y lista para su uso en aplicaciones de producción. Actualice las aplicaciones con la API REST versión 2022-08-31.
  • Actualizaciones de Document Intelligence Studio

    • Pasos siguientes. En cada página de modelo, Studio ahora tiene una sección de pasos siguientes. Los usuarios pueden hacer referencia rápidamente al código de ejemplo, a las directrices de solución de problemas y a la información de precios.
    • Modelos personalizados. Studio ahora incluye la capacidad de reordenar etiquetas en proyectos de modelos personalizados para mejorar la eficacia del etiquetado.
    • Copia de modelos Los modelos personalizados se pueden copiar entre los servicios de Documento de inteligencia desde Studio. Esta operación permite la promoción de un modelo entrenado a otros entornos y regiones.
    • Eliminar documentos. Studio ahora admite la eliminación de documentos del conjunto de datos etiquetado dentro de proyectos personalizados.
  • Actualizaciones del servicio Documento de inteligencia

    • prebuilt-read. El modelo de lectura OCR ahora también está disponible en Documento de inteligencia con detección de idioma y párrafos como dos nuevas características. La lectura de Documento de inteligencia está orientada a escenarios de documentos avanzados que se alinean con las funcionalidades de inteligencia documental más amplias de Documento de inteligencia.
    • prebuilt-layout. El modelo de diseño extrae párrafos e identifica si el texto extraído es un párrafo, título, encabezado de sección, nota al pie de página, encabezad de página o número de página.
    • prebuilt-invoice. Los campos TotalVAT y Line/VAT se resolverán ahora en los campos existentes TotalTax y Line/Tax respectivamente.
    • prebuilt-idDocument. Compatibilidad con la extracción de datos para el identificador de estado de EE. UU., la seguridad social y las tarjetas verdes. Soporte para la información de visado de pasaporte.
    • prebuilt-receipt. Compatibilidad ampliada con configuración regional para francés (fr-FR), español (es-ES), portugués (pt-PT), italiano (it-IT) y alemán (de-DE).
    • prebuilt-businessCard. Soporte de análisis de direcciones para extraer subcampos para componentes de direcciones, como la dirección, ciudad, estado, país/región y el código postal.
  • Mejoras de calidad de la IA

    • prebuilt-read. Compatibilidad mejorada con caracteres individuales, fechas manuscritas, cantidades, nombres y otros datos clave que se encuentran habitualmente en recibos y facturas y un procesamiento mejorado de documentos PDF digitales.
    • prebuilt-layout. Compatibilidad con una mejor detección de tablas recortadas, tablas sin bordes y reconocimiento mejorado de celdas de expansión larga.
    • prebuilt-document. Valor mejorado y detección de casillas.
    • custom-neural. Precisión mejorada para la detección y extracción de tablas.

Junio de 2022

  • La versión preliminar beta del SDK de Documento de inteligencia de junio de 2022 incluye las siguientes actualizaciones:

Febrero de 2022

  • La versión preliminar de Document Intelligence v3.0 presenta varias características, funcionalidades y mejoras nuevas:

    • El modelo neuronal personalizado o el modelo de documento personalizado es un nuevo modelo personalizado para extraer texto y marcas de selección de formularios estructurados, documentos semiestructurados y no estructurados.
    • El modelo precompilado W-2 es un nuevo modelo precompilado para extraer campos de formularios W-2 para escenarios de informes fiscales y comprobación de ingresos.
    • Lectura La API extrae líneas de texto impresas, palabras, ubicaciones de texto, idiomas detectados y texto manuscrito, si se detecta.
    • El modelo entrenado previamente para documentos generales ahora se actualiza para admitir marcas de selección, además de texto de API, tablas, estructura, y pares clave-valor de formularios y documentos.
    • API de factura El modelo precompilado de factura amplía la compatibilidad con las facturas en español.
    • Document Intelligence Studio agrega nuevas demostraciones para lectura, W2, ejemplos de recibos de hotel y compatibilidad con el entrenamiento de los nuevos modelos neuronales personalizados.
    • Expansión de lenguaje Los formularios de lectura, diseño y personalización de Documento de inteligencia agregan compatibilidad con 42 nuevos idiomas, incluidos el árabe, el hindi y otros idiomas que usan scripts de árabe y devanagari para expandir la cobertura a 164 idiomas. La compatibilidad con idiomas manuscritos se expande a japonés y coreano.
  • Introducción a la nueva API REST, Python o el SDK de .NET para la API de versión preliminar v3.0.

  • Extracción de datos del modelo de Inteligencia de documentos:

    Modelo Extracción de texto Pares clave-valor Marcas de selección Tablas Firmas
    Lectura
    Documento general
    Layout
    Factura
    Recibo
    Documento de identificación
    Tarjeta de presentación
    Plantilla personalizada
    Neuronal personalizado
  • La versión preliminar beta del SDK de Documento de inteligencia incluye las siguientes actualizaciones:


Noviembre de 2021

  • La actualización de la versión preliminar del SDK de Documento de inteligencia v3.0 (beta.2) incorpora correcciones de errores y actualizaciones de características secundarias.

Octubre de 2021

  • La versión 4.0.0-beta.1 (2021-10-07) de Documento de inteligencia v3.0 (versión preliminar) presenta varias características y funcionalidades nuevas:

    • El modelo de documento general es una nueva API que usa un modelo entrenado previamente para extraer texto, tablas, estructura, y pares clave-valor de formularios y documentos.

    • El modelo de recibo de hotel se agregó al procesamiento de recibos precompilados.

    • El modelo de id. de campos ampliados de documento de identificación admite aprobaciones, restricciones y la extracción de clasificación de vehículos de permisos de conducir de EE. UU.

    • Campo de firma es un nuevo tipo de campo en formularios personalizados para detectar la presencia de una firma en un campo de formulario.

    • Expansión de idiomas Compatibilidad con 122 idiomas (impresión) y 7 idiomas (manuscritos). Los formularios de diseño y personalización de Documento de inteligencia amplían los idiomas admitidos a 122 con su versión preliminar más reciente. La versión preliminar incluye la extracción de texto con texto impreso en 49 nuevos idiomas, entre los que se incluyen el ruso y el búlgaro, así como otros idiomas cirílicos y procedentes del latín. Además, la extracción de texto manuscrito ahora admite siete idiomas que incluyen inglés y nuevas versiones preliminares de chino simplificado, francés, alemán, italiano, portugués y español.

    • Mejoras en las tablas y la extracción de texto El diseño ahora admite la extracción de tablas de una sola fila también denominadas tablas de clave-valor. Las mejoras de extracción de texto incluyen un mejor procesamiento de archivos PDF digitales y texto de zona legible por máquina (MRZ) en documentos de identidad, junto con el rendimiento general.

    • Document Intelligence Studio Para simplificar el uso del servicio, ahora puede acceder a Document Intelligence Studio para probar los diferentes modelos precompilados o etiquetar y entrenar un modelo personalizado.

    • Introducción a la nueva API REST, Python o el SDK de .NET para la API de versión preliminar v3.0.

  • Extracción de datos del modelo de Documento de inteligencia

    Modelo Extracción de texto Pares clave-valor Marcas de selección Tablas
    Documento general
    Layout
    Factura
    Recibo
    Documento de identificación
    Tarjeta de presentación
    Personalizado

Septiembre de 2021

  • Las características avanzadas del explorador de métricas de Azure están disponibles en la página de información general de recursos de Documento de inteligencia en Azure Portal.

  • Menú de supervisión:

    Screenshot showing the monitoring menu in the Azure portal.

  • Gráficos:

    Screenshot showing an example metric chart in the Azure portal.

  • Actualización del modelo de documento de identificador: los nombres especificados, incluido un sufijo, con o sin un punto (punto final), se procesan correctamente:

    Texto de entrada Resultado con actualización
    William Isaac Kirby Jr. FirstName: William Isaac

    LastName: Kirby Jr.
    Henry Caleb Ross Sr FirstName: Henry Caleb

    LastName: Ross Sr.

Julio de 2021

  • Compatibilidad con la identidad administrada asignada por el sistema: ahora puede habilitar una identidad administrada asignada por el sistema para conceder a Documento de inteligencia acceso limitado a cuentas de almacenamiento privadas, incluidas las protegidas por una red virtual, mediante un firewall, o bien con la funcionalidad BYOS (Traiga su propio almacenamiento). VeaCreación y uso de identidades administradas para el recurso de Documento de inteligencia para más información.

Junio de 2021


Mayo de 2021

  • Documento de inteligencia 2.1 está disponible con carácter general. La versión de disponibilidad general (GA) marca la estabilidad de los cambios introducidos en versiones anteriores del paquete de versión preliminar 2.1. Esta versión le permite detectar y extraer información y datos de los tipos de documentos siguientes:

  • Para empezar, pruebe la herramienta de ejemplo de Documento de inteligencia y siga el inicio rápido.

  • La característica de tabla de la API de diseño actualizada agrega el reconocimiento de encabezados con encabezados de columna que pueden abarcar varias filas. Cada celda de tabla tiene un atributo que indica si forma parte de un encabezado o no. Esta actualización se puede usar para identificar qué filas son el encabezado de tabla.


Abril de 2021

  • Paquete NuGet, versión 3.1.0-beta.4

  • Registro de cambios/Historial de versiones.

  • Nuevos métodos para analizar datos de documentos de identidad:

    StartRecognizeIdDocumentsFromUriAsync

    StartRecognizeIdDocumentsAsync

    Para obtener una lista de los valores de campos, veaCampos extraídos en la documentación de Documento de inteligencia.

  • Se ha ampliado el conjunto de idiomas de documento que se pueden proporcionar al método StartRecognizeContent .

  • Nueva propiedad Pages compatible con las clases siguientes:

    RecognizeBusinessCardsOptions
    RecognizeCustomFormsOptions
    RecognizeInvoicesOptions
    RecognizeReceiptsOptions

    La propiedad Pages le permite seleccionar páginas individuales o un intervalo de ellas para los documentos PDF y TIFF de varias páginas. Si quiere elegir páginas individuales, escriba el número de página: por ejemplo, 3. Si quiere elegir un intervalo de páginas (como las páginas 2 y 5-7), escriba los números de página y los intervalos separados por comas: 2, 5-7.

  • Nueva propiedad ReadingOrder compatible con las clases siguientes:

    RecognizeContentOptions

    La propiedad ReadingOrder es un parámetro opcional que permite especificar cuál algoritmo de orden de lectura, basic o natural, se debe aplicar para ordenar la extracción de los elementos de texto. Si no se especifica, el valor predeterminado es basic.

  • Las actualizaciones de versión preliminar de SDK para la versión API 2.1-preview.3 presentan actualizaciones y mejoras de funciones.

Marzo de 2021

La versión preliminar pública v2.1 de Documento de inteligencia v2.1-preview.3 se ha publicado e incluye las siguientes características:

  • Nuevo modelo de identificación precompilado El nuevo modelo de identificación precompilado permite a los clientes tomar identificaciones y devolver datos estructurados para automatizar el procesamiento. Combina nuestras eficaces funcionalidades de reconocimiento óptico de caracteres (OCR) con modelos de reconocimiento de id. para extraer información clave de pasaportes y de permisos de conducir de EE. UU.

    Más información sobre el modelo de identificación precompilado

    Screenshot of a sample passport.

  • Extracción de elemento de línea para modelo de factura: el modelo de factura precompilado ahora admite la extracción de elementos de línea; ahora se extraen los elementos completos y sus partes: descripción, importe, cantidad, id. de producto, fecha y mucho más. Con una sencilla llamada de API/SDK, puede extraer datos útiles de las facturas (texto, tabla, pares clave-valor y elementos de línea).

    Más información sobre el modelo de factura

  • Etiquetado y entrenamiento de tablas supervisados, etiquetado de valores vacíos: además de las funciones de última generación de extracción automática de tablas de aprendizaje profundo de Documento de inteligencia, ahora permite que los clientes etiqueten y entrenen tablas. Esta nueva versión incluye la posibilidad de etiquetar y entrenar en elementos de línea y tablas (dinámicas y fijas) y entrenar un modelo personalizado para extraer pares clave-valor y elementos de línea. Una vez que se ha entrenado un modelo, este extrae los elementos de línea como parte de la salida JSON en la sección documentResults.

    Screenshot of the table labeling feature.

    Además de etiquetar tablas, ahora puede etiquetar valores y regiones vacíos. Si algunos documentos del conjunto de entrenamiento no tienen valores para determinados campos, puede etiquetarlos para que el modelo sepa que se van a extraer los valores correctamente de los documentos analizados.

  • Compatibilidad con 66 nuevos idiomas: la API de diseño y los modelos personalizados de Documento de inteligencia ahora admiten 73 idiomas.

    Más información sobre la compatibilidad con idiomas de Documento de inteligencia

  • Orden de lectura natural, clasificación de escritura a mano y selección de página: con esta actualización, puede optar por obtener los resultados de la línea de texto en el orden de lectura natural, en lugar de la ordenación predeterminada de izquierda a derecha y de arriba hacia abajo. Use el nuevo parámetro de consulta readingOrder y establézcalo en el valor "natural" para obtener una salida de orden de lectura más fácil de usar. Además, para los idiomas procedentes del latín, Documento de inteligencia clasifica las líneas de texto como de estilo manuscrito o no y da una puntuación de confianza.

  • Mejoras en la calidad del modelo de recepción precompilado: esta actualización incluye varias mejoras de calidad para el modelo de recepción precompilado, especialmente en lo que respecta a la extracción de elementos de línea.


Noviembre de 2020

  • La versión de Documento de inteligencia v2.1-preview.2 se ha publicado e incluye las siguientes características:

    • Nuevo modelo de factura precompilado: el nuevo modelo de factura precompilado permite a los clientes tomar facturas en muchos formatos y devolver datos estructurados para automatizar el procesamiento de facturas. Combina nuestras eficaces funcionalidades de reconocimiento óptico de caracteres (OCR) con modelos de aprendizaje profundo de reconocimiento de facturas para extraer información clave de facturas en inglés. Extrae el texto clave, las tablas y la información como el cliente, el proveedor, el identificador de la factura, la fecha de vencimiento de la factura, el total, el importe debido, el importe de los impuestos, la dirección de envío y la dirección de facturación.

      Más información sobre el modelo de factura precompilado

      Screenshot of a sample invoice.

    • Extracción de tablas mejorada: Documento de inteligencia ahora proporciona una extracción de tablas mejorada, que combina nuestras eficaces funcionalidades de reconocimiento óptico de caracteres (OCR) con un modelo de extracción de tablas de aprendizaje profundo. Documento de inteligencia puede extraer datos de tablas, lo que incluye tablas complejas con columnas combinadas, filas, sin bordes, etc.

      Screenshot of tables analysis.

      Más información sobre la extracción del diseño

    • Actualización de la biblioteca cliente: las versiones más recientes de las bibliotecas cliente para .NET, Python, Java y JavaScript admiten la API de Documento de inteligencia 2.1.

    • Nuevo idioma admitido: japonés: ahora se admiten los siguientes idiomas nuevos para AnalyzeLayout y AnalyzeCustomForm: japonés (ja). Compatibilidad con idiomas

    • Indicación de estilo de línea de texto (manuscrito/otros) (solo idiomas procedentes del latín): Documento de inteligencia ahora genera un objeto appearance que clasifica si cada línea de texto tiene estilo manuscrito o no, junto con una puntuación de confianza. Esta característica solo es compatible con los idiomas derivados del latín.

    • Mejoras en la calidad: mejoras en la extracción, lo que incluye mejoras en la extracción de dígitos individuales.

    • Nueva característica para realizar pruebas en las herramientas de etiquetado y de ejemplo de Documento de inteligencia: mediante la herramienta de etiquetado de ejemplo de Documento de inteligencia se pueden probar los modelos precompilados de factura, recibo y tarjeta de presentación y la API de diseño. Vea cómo se extraen los datos sin escribir código.

    • Pruebe la herramienta de etiquetado de ejemplo de Documento de inteligencia

      Screenshot of the Sample Labeling tool homepage.

      • Bucle de comentarios: si se usa la herramienta de etiquetado de ejemplo para analizar archivos, ahora también se puede agregar al conjunto de entrenamiento, ajustar las tablas si fuera necesario y entrenar para mejorar el modelo.
      • Etiquetado automático de documentos: etiqueta automáticamente los documentos agregados en función de documentos ya etiquetados existentes en el proyecto.

Agosto de 2020

  • **Documento de inteligencia v2.1-preview.1 incluye las siguientes características:

    • La referencia de la API de REST está disponible: vea v2.1-preview.1 reference.
    • Se admiten nuevos idiomas además del inglés: ahora se admiten los siguientes idiomas para Layout y Train Custom Model: inglés (en), chino (simplificado) (zh-Hans), neerlandés (nl), francés (fr), alemán (de), italiano (it), portugués (pt) y español (es).
    • Detección de marcas de selección o casillas: Documento de inteligencia admite la detección y extracción de marcas de selección, como casillas y botones de radio. Las marcas de selección se extraen de Layout y ahora también es posible etiquetar y entrenar en Train Custom Model - Layout para extraer pares clave-valor de marcas de selección.
    • Composición de modelos: permite que se compongan varios modelos y que se llamen con un único identificador de modelo. Cuando envía un documento para que se analice con un identificador de modelo compuesto, primero se realiza un paso de clasificación para enrutarlo al modelo personalizado correcto. La composición de modelos está disponible para Train Custom Model - Train Custom Model.
    • Nombre de modelo: agregue un nombre descriptivo a los modelos personalizados para facilitar su administración y seguimiento.
    • Nuevo modelo precompilado para tarjetas de presentación a fin de extraer campos comunes de tarjetas de presentación (en inglés).
    • Nuevas configuraciones regionales para recibos precompilados, además de EN-US, ahora se admiten EN-AU, EN-CA, EN-GB y EN-IN.
    • Mejoras de calidad para Layout, Train Custom Model - Entrenamiento sin etiquetas y Entrenamiento con etiquetas.
  • La versión 2.0 incluye la siguiente actualización:

    • Las bibliotecas cliente para NET, Python, Java y JavaScript están disponibles con carácter general.

    Hay nuevos ejemplos disponibles en GitHub.


Julio de 2020

  • Referencia de Documento de inteligencia v2.0 disponible: consulte la referencia de la API v2.0 y las bibliotecas de cliente actualizadas para .NET, Python, Java y JavaScript.
    • Mejoras en tablas y extracciones: incluye mejoras tanto en la precisión como en las extracciones de tablas, en concreto, la funcionalidad para aprender encabezados y estructuras de tablas en el entrenamiento personalizado sin etiquetas.

    • Compatibilidad de divisas: detección y extracción de símbolos de moneda globales.

    • Azure Gov: Documento de inteligencia ya está disponible también en Azure Gov.

    • Características de seguridad mejoradas:

      • Bring Your Own Key: Documento de inteligencia cifra automáticamente los datos cuando se guardan en la nube para protegerlos y para ayudarle a satisfacer los compromisos de cumplimiento y de seguridad de la organización. De forma predeterminada, su suscripción usa claves de cifrado administradas por Microsoft. Ahora también puede administrar la suscripción con sus propias claves de cifrado. Las claves administradas por el cliente (CMK), que también se conocen como Bring Your Own Key, ofrecen más flexibilidad para crear, rotar, deshabilitar y revocar controles de acceso. También permite auditar las claves de cifrado que se usan para proteger los datos.
      • Puntos de conexión privados: le permiten acceder de forma segura a los datos a través de Private Link en una red virtual.

Junio de 2020


Abril de 2020

  • Compatibilidad del SDK con la versión preliminar pública de la API de Documento de inteligencia v2.0: este mes hemos ampliado nuestro servicio de soporte técnico para incluir un SDK de versión preliminar para la versión 2.0 de Documento de inteligencia. Use estos vínculos para empezar a trabajar con el lenguaje que prefiera:
  • SDK de .NET
  • SDK de Java
  • SDK de Python
  • SDK de JavaScript

El nuevo SDK es compatible con todas las características de la API REST v2.0 de Documento de inteligencia. Puede compartir sus comentarios sobre las bibliotecas cliente a través del Formulario comentarios de SDK.

  • Copia del modelo personalizado Ahora puede copiar modelos entre regiones y suscripciones mediante la nueva característica Copiar modelo personalizado. Antes de invocar Copy Custom Model API, debe obtener la autorización para realizar copias en el recurso de destino. Esta autorización está protegida mediante una llamada a la operación de autorización de copia en el punto de conexión del recurso de destino.

  • Genere una autorización de copia: API de REST.

  • Copie un modelo personalizado: API de REST.

  • Mejoras de seguridad.

  • Las claves administradas por el cliente Customer-Managed Keys ya están disponibles para Form Recognizer. Para más información, vea Cifrado de datos en reposo para Documento de inteligencia.

  • Use Identidades administradas para acceder a los recursos de Azure con Azure Active Directory. Para obtener más información, consulte Autorización para obtener acceso a identidades administradas.


Marzo de 2020

  • Tipos de valor para etiquetado: ahora puede especificar los tipos de valores que va a etiquetar con la herramienta de etiquetado de ejemplo de Documento de inteligencia. Actualmente se admiten los siguientes tipos de valor y variaciones:
  • string
    • predeterminado, no-whitespaces, alphanumeric
  • number
    • predeterminado, currency
  • date
    • predeterminado, dmy, mdy, ymd
  • time
  • integer

Para aprender a usar esta característica, consulte la herramienta de etiquetado de ejemplo.

  • Visualización de tablas: la herramienta de etiquetado de ejemplo ahora muestra las tablas que se reconocieron en el documento. Esta característica le permite ver las tablas reconocidas y extraídas del documento antes de etiquetar y analizar. Esta característica se puede activar o desactivar mediante la opción de capas.

  • La siguiente imagen es un ejemplo de cómo se reconocen y extraen las tablas:

    Screenshot of table visualization using the Sample Labeling tool.

  • Las tablas extraídas están disponible en la salida JSON en "pageResults".

    Importante

    No se admite el etiquetado de tablas. Si las tablas no se reconocen ni se extraen automáticamente, solo se pueden etiquetar como pares clave-valor. Al etiquetar tablas como pares clave-valor, etiquete cada celda como un valor único.

  • Mejoras de extracción

  • Esta versión incluye mejoras de extracción y mejoras de precisión, en concreto, la capacidad de etiquetar y extraer varios pares clave-valor en la misma línea de texto.

  • La herramienta de etiquetado de ejemplo ahora es de código abierto.

  • La herramienta de etiquetado de ejemplo de Documento de inteligencia ya está disponible como proyecto de código abierto. Puede integrarla en sus soluciones y realizar cambios específicos del cliente para satisfacer sus necesidades.

  • Para más información sobre la herramienta de etiquetado de ejemplo de Documento de inteligencia, revise la documentación disponible en GitHub.

  • TLS 1.2 cumplimiento

  • TLS 1.2 ahora se aplica para todas las solicitudes HTTP a este servicio. Para más información, consulte Seguridad de servicios de Azure AI.


Enero de 2020

En esta versión se presenta Documento de inteligencia 2.0. En las secciones siguientes encontrará más información sobre nuevas características, mejoras y cambios.

  • Nuevas características

    • Modelo personalizado

      • Entrenar con etiquetas Ahora puede entrenar un modelo personalizado con datos etiquetados manualmente. Este método genera modelos con un mejor rendimiento y puede generar modelos que funcionen con formularios complejos o formularios que contengan valores sin claves.
      • API asincrónica Puede usar llamadas API asincrónicas para entrenar y analizar grandes conjuntos de datos y archivos.
      • Compatibilidad con archivos TIFF Ahora puede entrenar y extraer datos de documentos TIFF.
      • Mejoras en la precisión de la extracción
    • Modelo de recibo pregenerado

      • Importes de propinas Ahora puede extraer importes de propina y otros valores escritos a mano.
      • Extracción de elementos de línea Puede extraer valores de elementos de línea de recibos.
      • Valores de confianza Puede ver la confianza del modelo para cada valor extraído.
      • Mejoras en la precisión de la extracción
      • Extracción de diseño Ahora puede usar la API de diseño para extraer datos de texto y datos de tabla de los formularios.
  • Cambios en la API del modelo personalizado

    Se ha cambiado el nombre de todas las API de entrenamiento y uso de modelos personalizados y algunos métodos sincrónicos son asincrónicos ahora. A continuación se indican los cambios principales:

    • El proceso de entrenamiento de un modelo es ahora asincrónico. Inicie el entrenamiento mediante la llamada API /custom/models. Esta llamada devuelve un identificador de operación, que se puede pasar a custom/models/{modelID} para devolver los resultados del entrenamiento.
    • La extracción de clave y valor se inicia ahora mediante la llamada API /custom/models/{modelID}/analyze. Esta llamada devuelve un identificador de operación, que se puede pasar a custom/models/{modelID}/analyzeResults/{resultID} para devolver los resultados de la extracción.
    • Los identificadores de operación de la operación de entrenamiento se encuentran ahora en el encabezado Location de las respuestas HTTP, no en el encabezado Operation-Location.
  • Cambios en la API del recibo

    • Se ha cambiado el nombre de las API para leer recibos de venta.

    • La extracción de datos de recibo ahora se inicia mediante la llamada API /prebuilt/receipt/analyze. Esta llamada devuelve un identificador de operación, que se puede pasar a /prebuilt/receipt/analyzeResults/{resultID} para devolver los resultados de la extracción.

  • Cambios del formato de salida

    • Las respuestas JSON para todas las llamadas API tienen nuevos formatos. Algunas claves y valores se han agregado, quitado o cambiado de nombre. Consulte las guías de inicio rápido para obtener ejemplos de los formatos JSON actuales.

Pasos siguientes