Novedades de Documento de inteligencia de Azure AI
Este contenido se aplica a:v4.0 (versión preliminar)v3.1 (GA)v3.0 (GA)v2.1 (GA)
El servicio Documento de inteligencia se actualiza de forma continua. Marque esta página para mantenerse al día con las notas de la versión, las mejoras de características y la documentación más reciente.
Importante
Las versiones preliminares de la API se retiran una vez publicada la API de disponibilidad general. La versión 2023-02-28-preview de la API se va a retirar. Si sigue usando la API de la versión preliminar o las versiones del SDK asociadas, actualice el código de forma que indique la última versión de la API, 2023-07-31 (GA).
Mayo de 2024
Document Intelligence Studio ha agregado compatibilidad con la autenticación de Microsoft Entra (anteriormente Azure Active Directory). Para más información, consulteIntroducción a Document Intelligence Studio.
Febrero de 2024
La API de REST de Documento de inteligencia 2024-02-29-preview ya está disponible. Esta API en versión preliminar presenta funcionalidades nuevas y actualizadas:
La versión preliminar pública 2024-02-29-preview solo está disponible actualmente en las siguientes regiones de Azure:
- Este de EE. UU.
- Oeste de EE. UU. 2
- Oeste de Europa
El modelo de diseño ahora admite la detección de imágenes y el análisis jerárquico de la estructura de documentos (secciones y subsecciones). También se ha mejorado la calidad de inteligencia artificial del orden de lectura y la detección de roles lógicos.
Modelos de extracción personalizados
- Los modelos de extracción personalizados admiten ahora puntuaciones de confianza de nivel de celda, fila y tabla. Obtenga más información sobre la confianza de tabla, fila y celda.
- Los modelos de extracción personalizados cuentan con mejoras de calidad de la IA para la extracción de campos.
- El modelo de extracción de plantillas personalizado admite ahora la extracción de campos superpuestos. Obtenga más información sobre los campos superpuestos y cómo se usan.
Modelos de clasificación personalizados
- El modelo de clasificación personalizado admite ahora el entrenamiento incremental para los escenarios en los que es necesario actualizar el modelo de clasificador con ejemplos o clases adicionales. Obtenga más información sobre el entrenamiento incremental.
- El modelo de clasificación personalizado agrega compatibilidad con ciertos tipos de documentos de Office (.docx, .pptx y .xls). Obtenga más información sobre la compatibilidad ampliada con tipos de documento.
-
- Compatibilidad con nuevas configuraciones regionales:
Configuración regional Código Árabe ( ar
)Búlgaro ( bg
)Griego ( el
)Hebreo ( he
)Macedonio ( mk
)Ruso ( ru
)Serbio cirílico ( sr-cyrl
)Ucraniano ( uk
)Tailandés ( th
)Turco ( tr
)Vietnamita ( vi
)- Compatibilidad con nuevos códigos de moneda:
Moneda Configuración regional Código BAM Marco convertible de Bosnia ( ba
)BGN Lev búlgaro ( bg
)ILS Nuevo séquel israelí ( il
)MKD Denar de Macedonia ( mk
)RUB Rublo ruso ( ru
)THB Baht tailandés ( th
)TRY Lira turca ( tr
)UAH Grivna de Ucrania ( ua
)VND Dong vietnamita ( vn
)- Los elementos fiscales admiten la expansión para Alemania (
de
), España (es
), Portugal (pt
), Inglés de Canadáen-CA
.
-
- Compatibilidad de campo ampliada para los documentos de identificación y el permiso de conducir de la Unión Europea.
-
- Extraiga información de solicitud uniforme de préstamo residencial (formulario 1003).
- Extraiga información de la suscripción uniforme y el resumen de transmisión o el formulario 1008.
- Extraiga información de la divulgación de cierre de hipoteca.
🆕 Modelo de tarjeta de crédito o débito
- Extraiga información de las tarjetas bancarias.
-
- Nuevo elemento precompilado para extraer información de los certificados de matrimonio.
Diciembre de 2023
Las bibliotecas cliente de Document Intelligence que tienen como destino la API REST 2023-10-31-preview ya están disponibles para su uso.
Noviembre de 2023
La API REST de Documento de inteligencia 2023-10-31-preview ya está disponible. Esta API en versión preliminar presenta funcionalidades nuevas y actualizadas:
Actualmente, la versión preliminar pública 2023-10-31-preview solo está disponible en las siguientes regiones de Azure:
- Este de EE. UU.
- Oeste de EE. UU. 2
- Oeste de Europa
-
- Ampliación de idiomas para la escritura a mano: ruso (
ru
), árabe (ar
), tailandés (th
). - Cumplimiento de la Orden Ejecutiva Cibernética (EO).
- Ampliación de idiomas para la escritura a mano: ruso (
-
- Compatibilidad con archivos de Office y HTML.
- Compatibilidad con la salida de Markdown.
- Mejoras en la extracción de tablas, el orden de lectura y la detección de encabezados de sección.
- A partir de Documento de inteligencia 2023-10-31-preview, el modelo de documento general (prebuilt-document) queda en desuso. En el futuro, para extraer pares clave-valor de los documentos, use el modelo
prebuilt-layout
con el parámetro opcional de cadena de consultafeatures=keyValuePairs
habilitado.
-
- Ahora se extrae la moneda de todos los campos relacionados con el precio.
Modelo de tarjeta de seguro médico
- Compatibilidad de nuevos campos para la información de Medicare y Medicaid.
Modelos de documentos fiscales de EE. UU.
- Nuevo modelo fiscal 1099. Admite el formulario 1099 y las variaciones siguientes: A, B, C, CAP, DIV, G, H, INT, K, LS, LTC, MISC, NEC, OID, PATR, Q, QA, R, S, SA, SB.
-
- Compatibilidad con el campo
KVK
. - Compatibilidad con el campo
BPAY
. - Numerosos refinamientos de campo.
- Compatibilidad con el campo
-
- Compatibilidad con documentos de varios idiomas.
- Nuevas opciones de división de páginas: división automática, división siempre por página, sin división.
Funcionalidades de complementos
- Los campos de consulta están disponibles con la versión
2023-10-31-preview
. - Las funcionalidades de complementos están disponibles en todos los modelos, excepto el modelo de lectura.
- Los campos de consulta están disponibles con la versión
Nota:
Con la versión de disponibilidad general (GA) de la API 2022-08-31, las API de versión preliminar asociadas están en desuso. Si usa las versiones preliminares de la API 2021-09-30, 2022-01-30 o 2022-06-30, actualice las aplicaciones para que tengan como destino la versión de la API 2022-08-31. Para obtener más información sobre algunos cambios menores relacionados, consulte la guía de migración.
Julio de 2023
Nota:
Form Recognizer ahora es Documento de inteligencia de Azure AI.
- Los servicios de Azure AI de documentación engloban todo lo que antes se conocía como Cognitive Services y Azure Applied AI Services.
- No hay ningún cambio en los precios.
- Los nombres Cognitive Services y Azure Applied AI siguen utilizándose en las API de facturación, análisis de costes, listas de precios y precios de Azure.
- No hay cambios importantes en las interfaces de programación de aplicaciones (API) ni en las bibliotecas de cliente.
- Algunas plataformas siguen esperando la actualización de cambio de nombre. Todas las menciones de Form Recognizer o Documento de inteligencia en nuestra documentación se refieren al mismo servicio de Azure.
Documento de inteligencia v3.1 (GA)
La API de Documento de inteligencia versión 3.1 ya está disponible con carácter general (GA). La versión de la API se corresponde con 2023-07-31
.
La API v3.1 presenta funcionalidades nuevas y actualizadas:
- Las API de Inteligencia de documentos ahora son más modulares y admiten características opcionales. Ahora puede personalizar la salida para incluir específicamente las características que necesita. Más información sobre los parámetros opcionales.
- API de clasificación de documentos para dividir un único archivo en documentos individuales. Más información sobre la clasificación de documentos.
- Modelo de contrato precompilado.
- Modelo precompilado del formulario de impuestos estadounidenses 1098.
- Compatibilidad con tipos de archivo de Office con Read API.
- Reconocimiento de códigos de barras en documentos.
- Funcionalidad del complemento de reconocimiento de fórmulas.
- Funcionalidad del complemento de reconocimiento de fuentes.
- Compatibilidad con documentos de alta resolución.
- Ahora los modelos neuronales personalizados necesiten un único ejemplo etiquetado para el entrenamiento.
- Expansión del lenguaje de modelos neuronales personalizados. Entrenamiento de un modelo neuronal para documentos en 30 idiomas. Consulte la compatibilidad con idiomas para obtener la lista completa de los idiomas admitidos.
- 🆕 Modelo precompilado de tarjeta de seguro médico.
- Expansión precompilada de la configuración regional del modelo de factura.
- Expansión precompilada de la configuración regional y lenguaje de modelo de recibo con más de 100 idiomas admitidos.
- El modelo de identificador precompilado ahora admite identificadores europeos.
Actualizaciones de la experiencia del usuario de Document Intelligence Studio
✔️ Opciones de análisis
Document Intelligence ahora admite funcionalidades de análisis más sofisticadas y Studio permite un punto de entrada (botón Opciones de análisis) para configurar las funcionalidades del complemento con facilidad.
Según el escenario de extracción de documentos, configure el intervalo de análisis, el intervalo de páginas del documento, la detección opcional y las características de detección premium.
Nota:
La extracción de fuentes no se visualiza en Document Intelligence Studio. Sin embargo, puede comprobar la sección de estilos de la salida JSON para los resultados de detección de fuentes.
✔️ Etiquetado automático de documentos con modelos precompilados o uno de sus propios modelos
En la página de etiquetado de modelos de extracción personalizados, ahora puede etiquetar automáticamente los documentos con uno de los modelos precompilados del servicio Documento de inteligencia o con modelos que haya entrenado antes.
Para algunos documentos, puede haber etiquetas duplicadas después de ejecutar la etiqueta automática. Asegúrese de modificar las etiquetas para que no haya etiquetas duplicadas en la página de etiquetado después.
✔️ Tablas de etiquetado automático
En la página de etiquetado del modelo de extracción personalizada, ahora puede etiquetar automáticamente las tablas del documento sin tener que etiquetar las tablas manualmente.
✔️ Agregar archivos de prueba directamente al conjunto de datos de entrenamiento
Una vez que haya entrenado un modelo de extracción personalizado, use la página de prueba para mejorar la calidad del modelo cargando documentos de prueba en el conjunto de datos de entrenamiento si es necesario.
Si se devuelve una puntuación de confianza baja para algunas etiquetas, asegúrese de que están etiquetadas correctamente. Si no es así, agréguelos al conjunto de datos de entrenamiento y vuelva a etiquetarlos para mejorar la calidad del modelo.
✔️ Usar las opciones y filtros de la lista de documentos en proyectos personalizados
Use la página de etiquetado del modelo de extracción personalizado. Ahora puede navegar por los documentos de entrenamiento con facilidad mediante la búsqueda, el filtro y la ordenación por característica.
Utilice la vista de cuadrícula para obtener una vista previa de los documentos o use la vista de lista para desplazarse por los documentos más fácilmente.
✔️ Uso compartido de proyectos
- Comparta proyectos de extracción personalizados con facilidad. Para obtener más información, vea Uso compartido de proyectos con modelos personalizados.
Mayo de 2023
Introducción a la documentación actualizada para Build 2023
🆕 La información general de Documento de inteligencia tiene navegación mejorada, puntos de acceso estructurados e imágenes enriquecidas.
🆕 Elegir un modelo de Documento de inteligencia proporciona instrucciones para elegir la mejor solución de Documento de inteligencia para los proyectos y flujos de trabajo.
abril de 2023
Anuncio de la versión preliminar pública de la biblioteca cliente de Documento de inteligencia más reciente
La versión 2023-02-28-preview de la API de REST de Document Intelligence admite las bibliotecas cliente de la versión preliminar pública. Esta versión incluye las siguientes características y funcionalidades nuevas disponibles para .NET/C# (4.1.0-beta-1), Java (4.1.0-beta-1), JavaScript (4.1.0-beta-1) y Bibliotecas cliente de Python (3.3.0b.1):
Para más información, vea elSDK de Documento de inteligencia (versión preliminar pública) y las notas de la versión de marzo de 2023
Marzo de 2023
Importante
Actualmente, 2023-02-28-preview
capacidades solo están disponibles en las siguientes regiones:
- Oeste de Europa
- Oeste de EE. UU. 2
- Este de EE. UU.
- El modelo de clasificación personalizado es una nueva funcionalidad dentro de Documento de inteligencia que comienza con la API
2023-02-28-preview
. Pruebe la funcionalidad de clasificación de documentos con Document Intelligence Studio o la API REST. - Las funcionalidades de los campos de consulta, agregadas al modelo de documento general, usan modelos de Azure OpenAI para extraer campos específicos de los documentos. Pruebe la característica Documentos generales con campos de consulta mediante Document Intelligence Studio. Actualmente, los campos de consulta solo están activos para los recursos de la región
East US
. - Funcionalidades de complementos:
- Extracción de fuentes ahora se reconoce con la API
2023-02-28-preview
. - Extracción de fórmulas ahora se reconoce con la API
2023-02-28-preview
. - Extracción de alta resolución ahora se reconoce con la API
2023-02-28-preview
.
- Extracción de fuentes ahora se reconoce con la API
- Actualizaciones de los modelos de extracción personalizados:
- Los modelos neuronales personalizados ahora admiten idiomas agregados para el entrenamiento y el análisis. Entrene modelos neuronales para neerlandés, francés, alemán, italiano y español.
- El modelo de plantilla personalizado ahora tiene una capacidad de detección de firmas mejorada.
- Actualizaciones de Document Intelligence Studio:
- Además de la compatibilidad con todas las características nuevas, como la clasificación y los campos de consulta, Studio ahora habilita el uso compartido de proyectos de modelos personalizados.
- Adiciones de nuevos modelos en versión preliminar cerrada: tarjetas de vacunación, contratos, impuesto 1098 de EE. UU., impuesto 1098-E de EE. UU. e impuesto 1098-T de EE. UU. Para solicitar acceso a modelos de versión preliminar validados, complete y envíe el formulario de solicitud de versión preliminar privada de Documento de inteligencia.
- Actualizaciones del modelo de recibo:
- El modelo de recibo agrega compatibilidad con los recibos térmicos.
- El modelo de recibo ahora es compatible con 18 idiomas y tres idiomas regionales (inglés, francés y portugués).
- El modelo de recibo ahora admite la extracción de
TaxDetails
.
- El modelo de diseño ahora mejora el reconocimiento de tablas.
- El modelo de lectura ahora incluye mejoras para el reconocimiento de caracteres de un solo dígito.
Febrero de 2023
Hay determinados contenedores de Documento de inteligencia para v3.0 que ya están disponibles para su uso.
Actualmente, los contenedores de Read v3.0 y Layout v3.0 están disponibles.
Para más información, consulteInstalar y ejecutar contenedores de Documento de inteligencia.
Enero de 2023
Modelo de recibo precompilado: se admiten idiomas agregados. El modelo de recibo ahora admite estos idiomas y configuraciones regionales agregados:
- Japonés, Japón (ja-JP)
- Francés, Canadá (fr-CA)
- Holandés, Países Bajos (nl-NL)
- Inglés, Emiratos Árabes Unidos (en-AE)
- Portugués, Brasil (pt-br)
Modelo de factura precompilado: se admiten idiomas agregados. El modelo de factura ahora admite estos idiomas y configuraciones regionales agregados:
- Inglés: Estados Unidos (en-US), Australia (en-AU), Canadá (en-CA), Reino Unido (en-UK), India (en-IN)
- Español: España (es-ES)
- Francés: Francia (fr-FR)
- Italiano: Italia (it-IT)
- Portugués: Portugal (pt-PT)
- Holandés, Países Bajos (nl-NL)
Modelo de factura precompilado: se reconocen campos agregados. El modelo de factura ahora reconoce estos campos agregados:
- Código de moneda
- Opciones de pago
- Descuento total
- Elementos fiscales (solo en-IN)
Modelo de identificación precompilado: se admiten tipos de documento agregados. El modelo de identificación ahora admite estos tipos de documento agregados:
- Identificación militar de EE. UU.
Sugerencia
Todas las actualizaciones de enero de 2023 están disponibles con la versión API de REST 2022-08-31 (disponibilidad general).
Modelo precompilado de recibos (compatibilidad con idiomas adicionales):
El modelo de recibo precompilado agrega compatibilidad con los siguientes idiomas:
- Inglés, Emiratos Árabes Unidos (en-AE)
- Holandés, Países Bajos (nl-NL)
- Francés, Canadá (fr-CA)
- Alemán: (de-DE)
- Italiano: (it-IT)
- Japonés, Japón (ja-JP)
- Portugués, Brasil (pt-br)
Modelo precompilado de factura (compatibilidad con idiomas adicional y extracciones de campo)
El modelo de factura precompilado agrega compatibilidad con los siguientes idiomas:
- Inglés: Australia (en-AU), Canadá (en-CA), Reino Unido (en-UK), India (en-IN)
- Portugués, Brasil (pt-br)
El modelo de factura precompilado ahora admite las siguientes extracciones de campos:
- Código de moneda
- Opciones de pago
- Descuento total
- Elementos fiscales (solo en-IN)
Modelo precompilado de documento de id. (compatibilidad con tipos de documentos adicional)
El modelo de documento de identificación precompilado ahora agrega compatibilidad con los siguientes tipos de documentos:
- Expansión de licencias de conducir que respalda la India, Canadá, Reino Unido y Australia
- Documentos y tarjetas de identificación militares estadounidenses
- Documentos y tarjetas de identificación de la India (PAN y Aadhaar)
- Tarjetas de identificación y documentos de Australia (tarjeta de foto, id. Key-pass)
- Tarjetas de identificación y documentos de Canadá (tarjeta de identificación, tarjeta Maple)
- Tarjetas de identificación y documentos del Reino Unido (tarjeta de identidad nacional/regional)
Diciembre de 2022
Actualizaciones de Document Intelligence Studio
En la versión de diciembre de Document Intelligence Studio se incluyen las actualizaciones más recientes de Document Intelligence Studio. Hay importantes mejoras en la experiencia del usuario, principalmente con compatibilidad con el etiquetado de modelos personalizado.
Intervalo de páginas Ahora Studio admite el análisis de páginas especificadas desde un documento.
Etiquetado de modelos personalizados:
Ejecución de la API de diseño automáticamente. Puede optar por ejecutar la API de diseño para todos los documentos automáticamente en el almacenamiento de blobs durante el proceso de configuración del modelo personalizado.
Búsqueda. Studio ahora incluye la funcionalidad de búsqueda para buscar palabras dentro de un documento. Esta mejora permite una navegación más sencilla mientras se etiqueta.
Navegación Puede seleccionar etiquetas para dirigirse a palabras etiquetadas dentro de un documento.
Etiquetado automático de tablas Después de seleccionar el icono de tabla dentro de un documento, puedes optar por etiquetar automáticamente la tabla extraída en la vista de etiquetado.
Subtipos de etiqueta y subtipos de segundo nivel Studio admite ahora subtipos para columnas de tabla, filas de tabla y subtipos de segundo nivel para tipos como fechas y números.
La creación de modelos neuronales personalizados ahora se admite en la región US Gov Virginia.
Las versiones preliminares de la API
2022-01-30-preview
y2021-09-30-preview
se retirarán el 31 de enero de 2023. Actualice a la versión de la API2022-08-31
para evitar cualquier interrupción del servicio.
Noviembre de 2022
- Anuncio de la versión estable más reciente de las bibliotecas de Documento de inteligencia de Azure AI
- Esta versión incluye cambios y actualizaciones importantes para las bibliotecas cliente de .NET, Java, JavaScript y Python. Para obtener más información, consulteDevBlog del SDK de Azure.
- Las mejoras más significativas consisten en la introducción de dos nuevos clientes,
DocumentAnalysisClient
yDocumentModelAdministrationClient
.
Octubre de 2022
Contenido con versiones de Documento de inteligencia
La documentación de Documento de inteligencia se ha actualizado para presentar una experiencia con versiones. Ahora, puede elegir ver el contenido orientado a la experiencia de
v3.0 GA
o a la experiencia dev2.1 GA
. La experiencia v3.0 es la predeterminada.
Código de ejemplo de Document Intelligence Studio
- El código de ejemplo para la experiencia de etiquetado de Document Intelligence Studio ya está disponible en GitHub. Los clientes pueden desarrollar e integrar Documento de inteligencia en su propia experiencia del usuario, o bien crearla mediante el código de ejemplo de Document Intelligence Studio.
Expansión de idioma
- Con la versión preliminar más reciente, los modelos de plantillas de lectura (OCR), diseño y personalización de Documento de inteligencia admiten 134 nuevos idiomas. Estas adiciones lingüísticas incluyen griego, letón, serbio, tailandés, ucraniano y vietnamita, junto con varios idiomas latinos y cirílicos. Ahora Documento de inteligencia admite un total de 299 idiomas en las versiones de disponibilidad general más recientes y nuevas versiones preliminares. Consulte la página idiomas admitidos para ver todos los idiomas admitidos.
- Use el parámetro
api-version=2022-06-30-preview
de la API de REST al usar la API o el SDK correspondiente para admitir los nuevos lenguajes de las aplicaciones.
Nuevo modelo de contrato precompilado
- Nuevo modelo precompilado que extrae información de contratos, como entidades, título, id. de contrato, fecha de ejecución y mucho más. el modelo de contratos está actualmente en versión preliminar y solicita acceso aquí.
Expansión de regiones para entrenar modelos neuronales personalizados
- Ahora el entrenamiento de modelos neuronales personalizados es compatible con regiones agregadas.
- Este de EE. UU.
- Este de EE. UU. 2
- US Gov: Arizona
- Ahora el entrenamiento de modelos neuronales personalizados es compatible con regiones agregadas.
Septiembre de 2022
Nota:
A partir de la versión 4.0.0, se ha introducido un nuevo conjunto de clientes para aprovechar las características más recientes del servicio Documento de inteligencia.
La versión de disponibilidad general de la versión 4.0.0 del SDK incluye las siguientes actualizaciones:
- Versión 4.0.0 GA (2022-09-08)
- Compatibilidad con clientes de REST API v3.0 y v2.0
La expansión de regiones para entrenar modelos neuronales personalizados ahora se admite en seis nuevas regiones
- Este de Australia
- Centro de EE. UU.
- Este de Asia
- Centro de Francia
- Sur de Reino Unido 2
- Oeste de EE. UU. 2
Para ver una lista completa de las regiones en que se admite el entrenamiento, consulte modelos neuronales personalizados.
Versión
4.0.0 GA
del SDK de Documento de inteligencia:- Bibliotecas de cliente de Document Intelligence versión 4.0.0 (.NET/C#, Java, JavaScript) y la versión 3.2.0 (Python) están disponibles con carácter general y listos para su uso en aplicaciones de producción.
- Para obtener más información sobre las bibliotecas cliente de Document Intelligence, consulte la introducción a SDK.
- Actualice las aplicaciones mediante la guía de migración del lenguaje de programación.
Agosto de 2022
La versión preliminar beta del SDK de Documento de inteligencia de agosto de 2022 incluye las siguientes actualizaciones:
Versión 4.0.0-beta.5 (2022-08-09)
Documento de inteligencia v3.0 está disponible con carácter general
- La API REST de Documento de inteligencia v3.0 ya está disponible con carácter general y lista para su uso en aplicaciones de producción. Actualice las aplicaciones con la API REST versión 2022-08-31.
Actualizaciones de Document Intelligence Studio
- Pasos siguientes. En cada página de modelo, Studio ahora tiene una sección de pasos siguientes. Los usuarios pueden hacer referencia rápidamente al código de ejemplo, a las directrices de solución de problemas y a la información de precios.
- Modelos personalizados. Studio ahora incluye la capacidad de reordenar etiquetas en proyectos de modelos personalizados para mejorar la eficacia del etiquetado.
- Copia de modelos Los modelos personalizados se pueden copiar entre los servicios de Documento de inteligencia desde Studio. Esta operación permite la promoción de un modelo entrenado a otros entornos y regiones.
- Eliminar documentos. Studio ahora admite la eliminación de documentos del conjunto de datos etiquetado dentro de proyectos personalizados.
Actualizaciones del servicio Documento de inteligencia
- prebuilt-read. El modelo de lectura OCR ahora también está disponible en Documento de inteligencia con detección de idioma y párrafos como dos nuevas características. La lectura de Documento de inteligencia está orientada a escenarios de documentos avanzados que se alinean con las funcionalidades de inteligencia documental más amplias de Documento de inteligencia.
- prebuilt-layout. El modelo de diseño extrae párrafos e identifica si el texto extraído es un párrafo, título, encabezado de sección, nota al pie de página, encabezad de página o número de página.
- prebuilt-invoice. Los campos TotalVAT y Line/VAT se resolverán ahora en los campos existentes TotalTax y Line/Tax respectivamente.
- prebuilt-idDocument. Compatibilidad con la extracción de datos para el identificador de estado de EE. UU., la seguridad social y las tarjetas verdes. Soporte para la información de visado de pasaporte.
- prebuilt-receipt. Compatibilidad ampliada con configuración regional para francés (fr-FR), español (es-ES), portugués (pt-PT), italiano (it-IT) y alemán (de-DE).
- prebuilt-businessCard. Soporte de análisis de direcciones para extraer subcampos para componentes de direcciones, como la dirección, ciudad, estado, país/región y el código postal.
Mejoras de calidad de la IA
- prebuilt-read. Compatibilidad mejorada con caracteres individuales, fechas manuscritas, cantidades, nombres y otros datos clave que se encuentran habitualmente en recibos y facturas y un procesamiento mejorado de documentos PDF digitales.
- prebuilt-layout. Compatibilidad con una mejor detección de tablas recortadas, tablas sin bordes y reconocimiento mejorado de celdas de expansión larga.
- prebuilt-document. Valor mejorado y detección de casillas.
- custom-neural. Precisión mejorada para la detección y extracción de tablas.
Junio de 2022
- La versión preliminar beta del SDK de Documento de inteligencia de junio de 2022 incluye las siguientes actualizaciones:
Versión 4.0.0-beta.4 (2022-06-08)
Document Intelligence Studio La versión de junio es la actualización más reciente de Document Intelligence Studio. Hay considerables mejoras de experiencia de usuario y accesibilidad abordadas en esta actualización:
- Ejemplo de código para Javascript y C# La pestaña Código de Studio ahora agrega ejemplos de código de JavaScript y C# además del existente de Python.
- Nueva interfaz de usuario de carga de documentos. Studio ahora admite la carga de un documento con el método de arrastrar y colocar en la nueva interfaz de usuario de carga.
- Nueva característica para proyectos personalizados. Los proyectos personalizados ahora admiten la creación de cuentas de almacenamiento y blobs al configurar el proyecto. Además, el proyecto personalizado ahora admite la carga de archivos de entrenamiento directamente en Studio y la copia del modelo personalizado existente.
La versión 2022-06-30-preview de Documento de inteligencia v3.0 presenta amplias actualizaciones en las API de características:
- Diseño amplía la extracción de estructuras. Ahora Diseño incluye elementos de estructura agregados, como secciones, encabezados de sección y párrafos. Esta actualización permite escenarios de segmentación de documentos más precisos. Para obtener una lista completa de los elementos de estructura identificados, veaestructura mejorada.
- Compatibilidad con campos tabulares del modelo neuronal personalizado. Ahora los modelos de documentos personalizados admiten campos tabulares. De forma predeterminada, los campos tabulares también son de varias páginas. Para más información sobre los campos tabulares en modelos neuronales personalizados, veaCampos tabulares.
- Los campos tabulares del modelo de plantilla personalizados admiten tablas entre páginas. Ahora los modelos de formulario personalizados admiten campos tabulares entre páginas. Para más información sobre los campos tabulares en modelos de plantilla personalizados, veaCampos tabulares.
- La salida del modelo de factura ahora incluye pares clave-valor de documento generales. Cuando las facturas contienen campos obligatorios más allá de los incluidos en el modelo precompilado, el modelo de documento general complementa la salida con pares clave-valor. VeaPares clave-valor.
- Expansión del idioma de las facturas. El modelo de factura incluye compatibilidad con idiomas expandidos. VeaIdiomas admitidos.
- La tarjeta de presentación precompilada ahora incluye compatibilidad con el idioma japonés. VeaIdiomas admitidos.
- Modelo de documento de identificador precompilado. Ahora el modelo de documento de identificador extrae valores DateOfIssue, Height, Weight, EyeColor, HairColor y DocumentDiscriminator de los permisos de conducir de EE. UU. VeaExtracción de campos.
- El modelo de lectura ahora admite tipos de documentos comunes de Microsoft Office. Ahora se admiten tipos de documento como Word (docx), Excel (xlsx) y PowerPoint (pptx) con Read API. Consulte Extraer datos de lectura.
Febrero de 2022
Version 4.0.0-beta.3 (2022-02-10)
La versión preliminar de Document Intelligence v3.0 presenta varias características, funcionalidades y mejoras nuevas:
- El modelo neuronal personalizado o el modelo de documento personalizado es un nuevo modelo personalizado para extraer texto y marcas de selección de formularios estructurados, documentos semiestructurados y no estructurados.
- El modelo precompilado W-2 es un nuevo modelo precompilado para extraer campos de formularios W-2 para escenarios de informes fiscales y comprobación de ingresos.
- Lectura La API extrae líneas de texto impresas, palabras, ubicaciones de texto, idiomas detectados y texto manuscrito, si se detecta.
- El modelo entrenado previamente para documentos generales ahora se actualiza para admitir marcas de selección, además de texto de API, tablas, estructura, y pares clave-valor de formularios y documentos.
- API de factura El modelo precompilado de factura amplía la compatibilidad con las facturas en español.
- Document Intelligence Studio agrega nuevas demostraciones para lectura, W2, ejemplos de recibos de hotel y compatibilidad con el entrenamiento de los nuevos modelos neuronales personalizados.
- Expansión de lenguaje Los formularios de lectura, diseño y personalización de Documento de inteligencia agregan compatibilidad con 42 nuevos idiomas, incluidos el árabe, el hindi y otros idiomas que usan scripts de árabe y devanagari para expandir la cobertura a 164 idiomas. La compatibilidad con idiomas manuscritos se expande a japonés y coreano.
Introducción a la nueva API REST, Python o el SDK de .NET para la API de versión preliminar v3.0.
Extracción de datos del modelo de Inteligencia de documentos:
Modelo Extracción de texto Pares clave-valor Marcas de selección Tablas Firmas Lectura ✓ Documento general ✓ ✓ ✓ ✓ Layout ✓ ✓ ✓ Factura ✓ ✓ ✓ ✓ Recibo ✓ ✓ ✓ Documento de identificación ✓ ✓ Tarjeta de presentación ✓ ✓ Plantilla personalizada ✓ ✓ ✓ ✓ ✓ Neuronal personalizado ✓ ✓ ✓ ✓ La versión preliminar beta del SDK de Documento de inteligencia incluye las siguientes actualizaciones:
Modelos y modos de documentos personalizados:
- Plantilla personalizada (anteriormente formulario personalizado).
- Neuronal personalizado.
- Modelo personalizado: modo de compilación.
Modelo precompilado W-2 (prebuilt-tax.us.w2).
Modelo precompilado de lectura (prebuilt-read).
Modelo precompilado de factura (español) (prebuilt-invoice).
Noviembre de 2021
Version 4.0.0-beta.2 (2021-11-09)
| Paquete (NuGet) | Registro de cambios o historial de versiones | Documentación de referencia de API
- La actualización de la versión preliminar del SDK de Documento de inteligencia v3.0 (beta.2) incorpora correcciones de errores y actualizaciones de características secundarias.
Octubre de 2021
La versión 4.0.0-beta.1 (2021-10-07) de Documento de inteligencia v3.0 (versión preliminar) presenta varias características y funcionalidades nuevas:
El modelo de documento general es una nueva API que usa un modelo entrenado previamente para extraer texto, tablas, estructura, y pares clave-valor de formularios y documentos.
El modelo de recibo de hotel se agregó al procesamiento de recibos precompilados.
El modelo de id. de campos ampliados de documento de identificación admite aprobaciones, restricciones y la extracción de clasificación de vehículos de permisos de conducir de EE. UU.
Campo de firma es un nuevo tipo de campo en formularios personalizados para detectar la presencia de una firma en un campo de formulario.
Expansión de idiomas Compatibilidad con 122 idiomas (impresión) y 7 idiomas (manuscritos). Los formularios de diseño y personalización de Documento de inteligencia amplían los idiomas admitidos a 122 con su versión preliminar más reciente. La versión preliminar incluye la extracción de texto con texto impreso en 49 nuevos idiomas, entre los que se incluyen el ruso y el búlgaro, así como otros idiomas cirílicos y procedentes del latín. Además, la extracción de texto manuscrito ahora admite siete idiomas que incluyen inglés y nuevas versiones preliminares de chino simplificado, francés, alemán, italiano, portugués y español.
Mejoras en las tablas y la extracción de texto El diseño ahora admite la extracción de tablas de una sola fila también denominadas tablas de clave-valor. Las mejoras de extracción de texto incluyen un mejor procesamiento de archivos PDF digitales y texto de zona legible por máquina (MRZ) en documentos de identidad, junto con el rendimiento general.
Document Intelligence Studio Para simplificar el uso del servicio, ahora puede acceder a Document Intelligence Studio para probar los diferentes modelos precompilados o etiquetar y entrenar un modelo personalizado.
Introducción a la nueva API REST, Python o el SDK de .NET para la API de versión preliminar v3.0.
Extracción de datos del modelo de Documento de inteligencia
Modelo Extracción de texto Pares clave-valor Marcas de selección Tablas Documento general ✓ ✓ ✓ ✓ Layout ✓ ✓ ✓ Factura ✓ ✓ ✓ ✓ Recibo ✓ ✓ Documento de identificación ✓ ✓ Tarjeta de presentación ✓ ✓ Personalizado ✓ ✓ ✓ ✓
Septiembre de 2021
Las características avanzadas del explorador de métricas de Azure están disponibles en la página de información general de recursos de Documento de inteligencia en Azure Portal.
Menú de supervisión:
Gráficos:
Actualización del modelo de documento de identificador: los nombres especificados, incluido un sufijo, con o sin un punto (punto final), se procesan correctamente:
Texto de entrada Resultado con actualización William Isaac Kirby Jr. FirstName: William Isaac
LastName: Kirby Jr.Henry Caleb Ross Sr FirstName: Henry Caleb
LastName: Ross Sr.
Julio de 2021
- Compatibilidad con la identidad administrada asignada por el sistema: ahora puede habilitar una identidad administrada asignada por el sistema para conceder a Documento de inteligencia acceso limitado a cuentas de almacenamiento privadas, incluidas las protegidas por una red virtual, mediante un firewall, o bien con la funcionalidad BYOS (Traiga su propio almacenamiento). VeaCreación y uso de identidades administradas para el recurso de Documento de inteligencia para más información.
Junio de 2021
Los contenedores de Documento de inteligencia v2.1 se han publicado en versión preliminar validada y son ahora compatibles con seis contenedores de características: Diseño, Tarjeta de presentación, Documento de identificación, Recibo, Factura y Personalizado. Para usarlos, debe enviar una solicitud en línea y recibir la aprobación.
Publicación del conector de Documento de inteligencia en versión preliminar: el conector de Documento de inteligencia se integra con Azure Logic Apps, Microsoft Power Automate y Microsoft Power Apps. El conector admite acciones y desencadenadores de flujo de trabajo para extraer y analizar los datos y la estructura de los documentos de formularios, facturas, recibos, tarjetas de presentación y documentos de identificación personalizados y creados previamente.
Revisión del SDK de Documento de inteligencia v3.1.0 a v3.1.1 para C#, Java y Python. La revisión aborda las facturas sin campos de elementos de sublínea detectados, como un elemento
FormField
conText
, pero sin información deBoundingBox
oPage
.
Mayo de 2021
- Versión 3.1.0 (2021-05-26)
Registro de cambios o historial de versiones| Documentación de referencia | Versión 3.0.1 del paquete NuGet |
Documento de inteligencia 2.1 está disponible con carácter general. La versión de disponibilidad general (GA) marca la estabilidad de los cambios introducidos en versiones anteriores del paquete de versión preliminar 2.1. Esta versión le permite detectar y extraer información y datos de los tipos de documentos siguientes:
Para empezar, pruebe la herramienta de ejemplo de Documento de inteligencia y siga el inicio rápido.
La característica de tabla de la API de diseño actualizada agrega el reconocimiento de encabezados con encabezados de columna que pueden abarcar varias filas. Cada celda de tabla tiene un atributo que indica si forma parte de un encabezado o no. Esta actualización se puede usar para identificar qué filas son el encabezado de tabla.
Abril de 2021
Paquete NuGet, versión 3.1.0-beta.4
Nuevos métodos para analizar datos de documentos de identidad:
StartRecognizeIdDocumentsFromUriAsync
StartRecognizeIdDocumentsAsync
Para obtener una lista de los valores de campos, veaCampos extraídos en la documentación de Documento de inteligencia.
Se ha ampliado el conjunto de idiomas de documento que se pueden proporcionar al método StartRecognizeContent .
Nueva propiedad
Pages
compatible con las clases siguientes:RecognizeBusinessCardsOptions
RecognizeCustomFormsOptions
RecognizeInvoicesOptions
RecognizeReceiptsOptionsLa propiedad
Pages
le permite seleccionar páginas individuales o un intervalo de ellas para los documentos PDF y TIFF de varias páginas. Si quiere elegir páginas individuales, escriba el número de página: por ejemplo,3
. Si quiere elegir un intervalo de páginas (como las páginas 2 y 5-7), escriba los números de página y los intervalos separados por comas:2, 5-7
.Nueva propiedad
ReadingOrder
compatible con las clases siguientes:La propiedad
ReadingOrder
es un parámetro opcional que permite especificar cuál algoritmo de orden de lectura,basic
onatural
, se debe aplicar para ordenar la extracción de los elementos de texto. Si no se especifica, el valor predeterminado esbasic
.
- Las actualizaciones de versión preliminar de SDK para la versión API
2.1-preview.3
presentan actualizaciones y mejoras de funciones.
Marzo de 2021
La versión preliminar pública v2.1 de Documento de inteligencia v2.1-preview.3 se ha publicado e incluye las siguientes características:
Nuevo modelo de identificación precompilado El nuevo modelo de identificación precompilado permite a los clientes tomar identificaciones y devolver datos estructurados para automatizar el procesamiento. Combina nuestras eficaces funcionalidades de reconocimiento óptico de caracteres (OCR) con modelos de reconocimiento de id. para extraer información clave de pasaportes y de permisos de conducir de EE. UU.
Más información sobre el modelo de identificación precompilado
Extracción de elemento de línea para modelo de factura: el modelo de factura precompilado ahora admite la extracción de elementos de línea; ahora se extraen los elementos completos y sus partes: descripción, importe, cantidad, id. de producto, fecha y mucho más. Con una sencilla llamada de API/SDK, puede extraer datos útiles de las facturas (texto, tabla, pares clave-valor y elementos de línea).
Etiquetado y entrenamiento de tablas supervisados, etiquetado de valores vacíos: además de las funciones de última generación de extracción automática de tablas de aprendizaje profundo de Documento de inteligencia, ahora permite que los clientes etiqueten y entrenen tablas. Esta nueva versión incluye la posibilidad de etiquetar y entrenar en elementos de línea y tablas (dinámicas y fijas) y entrenar un modelo personalizado para extraer pares clave-valor y elementos de línea. Una vez que se ha entrenado un modelo, este extrae los elementos de línea como parte de la salida JSON en la sección documentResults.
Además de etiquetar tablas, ahora puede etiquetar valores y regiones vacíos. Si algunos documentos del conjunto de entrenamiento no tienen valores para determinados campos, puede etiquetarlos para que el modelo sepa que se van a extraer los valores correctamente de los documentos analizados.
Compatibilidad con 66 nuevos idiomas: la API de diseño y los modelos personalizados de Documento de inteligencia ahora admiten 73 idiomas.
Más información sobre la compatibilidad con idiomas de Documento de inteligencia
Orden de lectura natural, clasificación de escritura a mano y selección de página: con esta actualización, puede optar por obtener los resultados de la línea de texto en el orden de lectura natural, en lugar de la ordenación predeterminada de izquierda a derecha y de arriba hacia abajo. Use el nuevo parámetro de consulta readingOrder y establézcalo en el valor "natural" para obtener una salida de orden de lectura más fácil de usar. Además, para los idiomas procedentes del latín, Documento de inteligencia clasifica las líneas de texto como de estilo manuscrito o no y da una puntuación de confianza.
Mejoras en la calidad del modelo de recepción precompilado: esta actualización incluye varias mejoras de calidad para el modelo de recepción precompilado, especialmente en lo que respecta a la extracción de elementos de línea.
Noviembre de 2020
La versión de Documento de inteligencia v2.1-preview.2 se ha publicado e incluye las siguientes características:
Nuevo modelo de factura precompilado: el nuevo modelo de factura precompilado permite a los clientes tomar facturas en muchos formatos y devolver datos estructurados para automatizar el procesamiento de facturas. Combina nuestras eficaces funcionalidades de reconocimiento óptico de caracteres (OCR) con modelos de aprendizaje profundo de reconocimiento de facturas para extraer información clave de facturas en inglés. Extrae el texto clave, las tablas y la información como el cliente, el proveedor, el identificador de la factura, la fecha de vencimiento de la factura, el total, el importe debido, el importe de los impuestos, la dirección de envío y la dirección de facturación.
Extracción de tablas mejorada: Documento de inteligencia ahora proporciona una extracción de tablas mejorada, que combina nuestras eficaces funcionalidades de reconocimiento óptico de caracteres (OCR) con un modelo de extracción de tablas de aprendizaje profundo. Documento de inteligencia puede extraer datos de tablas, lo que incluye tablas complejas con columnas combinadas, filas, sin bordes, etc.
Actualización de la biblioteca cliente: las versiones más recientes de las bibliotecas cliente para .NET, Python, Java y JavaScript admiten la API de Documento de inteligencia 2.1.
Nuevo idioma admitido: japonés: ahora se admiten los siguientes idiomas nuevos para
AnalyzeLayout
yAnalyzeCustomForm
: japonés (ja
). Compatibilidad con idiomasIndicación de estilo de línea de texto (manuscrito/otros) (solo idiomas procedentes del latín): Documento de inteligencia ahora genera un objeto
appearance
que clasifica si cada línea de texto tiene estilo manuscrito o no, junto con una puntuación de confianza. Esta característica solo es compatible con los idiomas derivados del latín.Mejoras en la calidad: mejoras en la extracción, lo que incluye mejoras en la extracción de dígitos individuales.
Nueva característica para realizar pruebas en las herramientas de etiquetado y de ejemplo de Documento de inteligencia: mediante la herramienta de etiquetado de ejemplo de Documento de inteligencia se pueden probar los modelos precompilados de factura, recibo y tarjeta de presentación y la API de diseño. Vea cómo se extraen los datos sin escribir código.
Pruebe la herramienta de etiquetado de ejemplo de Documento de inteligencia
- Bucle de comentarios: si se usa la herramienta de etiquetado de ejemplo para analizar archivos, ahora también se puede agregar al conjunto de entrenamiento, ajustar las tablas si fuera necesario y entrenar para mejorar el modelo.
- Etiquetado automático de documentos: etiqueta automáticamente los documentos agregados en función de documentos ya etiquetados existentes en el proyecto.
Agosto de 2020
**Documento de inteligencia
v2.1-preview.1
incluye las siguientes características:- La referencia de la API de REST está disponible: vea
v2.1-preview.1 reference
. - Se admiten nuevos idiomas además del inglés: ahora se admiten los siguientes idiomas para
Layout
yTrain Custom Model
: inglés (en
), chino (simplificado) (zh-Hans
), neerlandés (nl
), francés (fr
), alemán (de
), italiano (it
), portugués (pt
) y español (es
). - Detección de marcas de selección o casillas: Documento de inteligencia admite la detección y extracción de marcas de selección, como casillas y botones de radio. Las marcas de selección se extraen de
Layout
y ahora también es posible etiquetar y entrenar enTrain Custom Model
-Layout
para extraer pares clave-valor de marcas de selección. - Composición de modelos: permite que se compongan varios modelos y que se llamen con un único identificador de modelo. Cuando envía un documento para que se analice con un identificador de modelo compuesto, primero se realiza un paso de clasificación para enrutarlo al modelo personalizado correcto. La composición de modelos está disponible para
Train Custom Model
-Train Custom Model
. - Nombre de modelo: agregue un nombre descriptivo a los modelos personalizados para facilitar su administración y seguimiento.
- Nuevo modelo precompilado para tarjetas de presentación a fin de extraer campos comunes de tarjetas de presentación (en inglés).
- Nuevas configuraciones regionales para recibos precompilados, además de EN-US, ahora se admiten EN-AU, EN-CA, EN-GB y EN-IN.
- Mejoras de calidad para
Layout
,Train Custom Model
- Entrenamiento sin etiquetas y Entrenamiento con etiquetas.
- La referencia de la API de REST está disponible: vea
La versión 2.0 incluye la siguiente actualización:
- Las bibliotecas cliente para NET, Python, Java y JavaScript están disponibles con carácter general.
Hay nuevos ejemplos disponibles en GitHub.
- En el cuaderno de estrategias de Forms: recetas de extracción de conocimientos se recopilan procedimientos recomendados de interacciones de clientes reales de Documento de inteligencia y se proporcionan ejemplos de código útiles, listas de comprobación y canalizaciones de ejemplo que se usan en el desarrollo de estos proyectos.
- La herramienta de etiquetado de ejemplo se ha actualizado para admitir la nueva funcionalidad de v2.1. Vea este inicio rápido para empezar a trabajar con la herramienta.
- En el ejemplo de Documento de inteligencia Intelligent Kiosk se muestra cómo integrar
Analyze Receipt
yTrain Custom Model
- Entrenamiento sin etiquetas.
Julio de 2020
- Referencia de Documento de inteligencia v2.0 disponible: consulte la referencia de la API v2.0 y las bibliotecas de cliente actualizadas para .NET, Python, Java y JavaScript.
Mejoras en tablas y extracciones: incluye mejoras tanto en la precisión como en las extracciones de tablas, en concreto, la funcionalidad para aprender encabezados y estructuras de tablas en el entrenamiento personalizado sin etiquetas.
Compatibilidad de divisas: detección y extracción de símbolos de moneda globales.
Azure Gov: Documento de inteligencia ya está disponible también en Azure Gov.
Características de seguridad mejoradas:
- Bring Your Own Key: Documento de inteligencia cifra automáticamente los datos cuando se guardan en la nube para protegerlos y para ayudarle a satisfacer los compromisos de cumplimiento y de seguridad de la organización. De forma predeterminada, su suscripción usa claves de cifrado administradas por Microsoft. Ahora también puede administrar la suscripción con sus propias claves de cifrado. Las claves administradas por el cliente (CMK), que también se conocen como Bring Your Own Key, ofrecen más flexibilidad para crear, rotar, deshabilitar y revocar controles de acceso. También permite auditar las claves de cifrado que se usan para proteger los datos.
- Puntos de conexión privados: le permiten acceder de forma segura a los datos a través de Private Link en una red virtual.
Junio de 2020
- CopyModel API se agregó a las bibliotecas de cliente: ya se pueden usar las bibliotecas de cliente para copiar modelos de una suscripción a otra. Consulte Copia de seguridad y recuperación de modelos para obtener información general sobre esta característica.
- Integración de Azure Active Directory: ya puede usar las credenciales de Azure AD para autenticar los objetos cliente de Documento de inteligencia en las bibliotecas de cliente.
- Cambios específicos en los SDK: este cambio incluye tanto la adición de características secundarias como los cambios importantes. Para más información, vea los registros de cambios del SDK.
Abril de 2020
- Compatibilidad del SDK con la versión preliminar pública de la API de Documento de inteligencia v2.0: este mes hemos ampliado nuestro servicio de soporte técnico para incluir un SDK de versión preliminar para la versión 2.0 de Documento de inteligencia. Use estos vínculos para empezar a trabajar con el lenguaje que prefiera:
- SDK de .NET
- SDK de Java
- SDK de Python
- SDK de JavaScript
El nuevo SDK es compatible con todas las características de la API REST v2.0 de Documento de inteligencia. Puede compartir sus comentarios sobre las bibliotecas cliente a través del Formulario comentarios de SDK.
Copia del modelo personalizado Ahora puede copiar modelos entre regiones y suscripciones mediante la nueva característica Copiar modelo personalizado. Antes de invocar Copy Custom Model API, debe obtener la autorización para realizar copias en el recurso de destino. Esta autorización está protegida mediante una llamada a la operación de autorización de copia en el punto de conexión del recurso de destino.
Genere una autorización de copia: API de REST.
Copie un modelo personalizado: API de REST.
Mejoras de seguridad.
Las claves administradas por el cliente Customer-Managed Keys ya están disponibles para Form Recognizer. Para más información, vea Cifrado de datos en reposo para Documento de inteligencia.
Use Identidades administradas para acceder a los recursos de Azure con Azure Active Directory. Para obtener más información, consulte Autorización para obtener acceso a identidades administradas.
Marzo de 2020
- Tipos de valor para etiquetado: ahora puede especificar los tipos de valores que va a etiquetar con la herramienta de etiquetado de ejemplo de Documento de inteligencia. Actualmente se admiten los siguientes tipos de valor y variaciones:
string
- predeterminado,
no-whitespaces
,alphanumeric
- predeterminado,
number
- predeterminado,
currency
- predeterminado,
date
- predeterminado,
dmy
,mdy
,ymd
- predeterminado,
time
integer
Para aprender a usar esta característica, consulte la herramienta de etiquetado de ejemplo.
Visualización de tablas: la herramienta de etiquetado de ejemplo ahora muestra las tablas que se reconocieron en el documento. Esta característica le permite ver las tablas reconocidas y extraídas del documento antes de etiquetar y analizar. Esta característica se puede activar o desactivar mediante la opción de capas.
La siguiente imagen es un ejemplo de cómo se reconocen y extraen las tablas:
Las tablas extraídas están disponible en la salida JSON en
"pageResults"
.Importante
No se admite el etiquetado de tablas. Si las tablas no se reconocen ni se extraen automáticamente, solo se pueden etiquetar como pares clave-valor. Al etiquetar tablas como pares clave-valor, etiquete cada celda como un valor único.
Mejoras de extracción
Esta versión incluye mejoras de extracción y mejoras de precisión, en concreto, la capacidad de etiquetar y extraer varios pares clave-valor en la misma línea de texto.
La herramienta de etiquetado de ejemplo ahora es de código abierto.
La herramienta de etiquetado de ejemplo de Documento de inteligencia ya está disponible como proyecto de código abierto. Puede integrarla en sus soluciones y realizar cambios específicos del cliente para satisfacer sus necesidades.
Para más información sobre la herramienta de etiquetado de ejemplo de Documento de inteligencia, revise la documentación disponible en GitHub.
TLS
1.2 cumplimientoTLS
1.2 ahora se aplica para todas las solicitudes HTTP a este servicio. Para más información, consulte Seguridad de servicios de Azure AI.
Enero de 2020
En esta versión se presenta Documento de inteligencia 2.0. En las secciones siguientes encontrará más información sobre nuevas características, mejoras y cambios.
Nuevas características
Modelo personalizado
- Entrenar con etiquetas Ahora puede entrenar un modelo personalizado con datos etiquetados manualmente. Este método genera modelos con un mejor rendimiento y puede generar modelos que funcionen con formularios complejos o formularios que contengan valores sin claves.
- API asincrónica Puede usar llamadas API asincrónicas para entrenar y analizar grandes conjuntos de datos y archivos.
- Compatibilidad con archivos TIFF Ahora puede entrenar y extraer datos de documentos TIFF.
- Mejoras en la precisión de la extracción
Modelo de recibo pregenerado
- Importes de propinas Ahora puede extraer importes de propina y otros valores escritos a mano.
- Extracción de elementos de línea Puede extraer valores de elementos de línea de recibos.
- Valores de confianza Puede ver la confianza del modelo para cada valor extraído.
- Mejoras en la precisión de la extracción
- Extracción de diseño Ahora puede usar la API de diseño para extraer datos de texto y datos de tabla de los formularios.
Cambios en la API del modelo personalizado
Se ha cambiado el nombre de todas las API de entrenamiento y uso de modelos personalizados y algunos métodos sincrónicos son asincrónicos ahora. A continuación se indican los cambios principales:
- El proceso de entrenamiento de un modelo es ahora asincrónico. Inicie el entrenamiento mediante la llamada API /custom/models. Esta llamada devuelve un identificador de operación, que se puede pasar a custom/models/{modelID} para devolver los resultados del entrenamiento.
- La extracción de clave y valor se inicia ahora mediante la llamada API /custom/models/{modelID}/analyze. Esta llamada devuelve un identificador de operación, que se puede pasar a custom/models/{modelID}/analyzeResults/{resultID} para devolver los resultados de la extracción.
- Los identificadores de operación de la operación de entrenamiento se encuentran ahora en el encabezado Location de las respuestas HTTP, no en el encabezado Operation-Location.
Cambios en la API del recibo
Se ha cambiado el nombre de las API para leer recibos de venta.
La extracción de datos de recibo ahora se inicia mediante la llamada API /prebuilt/receipt/analyze. Esta llamada devuelve un identificador de operación, que se puede pasar a /prebuilt/receipt/analyzeResults/{resultID} para devolver los resultados de la extracción.
Cambios del formato de salida
- Las respuestas JSON para todas las llamadas API tienen nuevos formatos. Algunas claves y valores se han agregado, quitado o cambiado de nombre. Consulte las guías de inicio rápido para obtener ejemplos de los formatos JSON actuales.
Pasos siguientes
Pruebe a procesar sus propios formularios y documentos con Document Intelligence Studio.
Complete el inicio rápido de Documento de inteligencia y empiece a crear una aplicación de procesamiento de documentos en el lenguaje de desarrollo que prefiera.
Pruebe a procesar sus propios formularios y documentos con la Herramienta de etiquetado de muestras de Documento de inteligencia.
Complete el inicio rápido de Documento de inteligencia y empiece a crear una aplicación de procesamiento de documentos en el lenguaje de desarrollo que prefiera.