Editar

Compartir vía


Preguntas más frecuentes sobre Documento de inteligencia de Azure AI

Este contenido se aplica a:marca de verificaciónv4.0 (versión preliminar)marca de verificaciónv3.1 (GA)marca de verificaciónv3.0 (GA)marca de verificaciónv2.1 (GA)

Conceptos generales

¿Qué es Documento de inteligencia de Azure AI y qué ha sido de Form Recognizer?

El Documento de inteligencia de Azure AI es un servicio basado en la nube que usa modelos de aprendizaje automático para extraer pares clave-valor, texto y tablas de sus documentos. El resultado devuelto es una salida JSON estructurada. Los casos de uso de Documento de inteligencia incluyen la automatización del procesamiento de datos en aplicaciones, estrategias basadas en datos mejoradas y funcionalidades de búsqueda de documentos enriquecidas.

La inteligencia de documentos forma parte de los servicios de Azure AI. Los servicios de Azure AI abarcan todo lo que anteriormente se conocía como Azure Cognitive Services y Azure Applied AI Services.

El nombre anterior de Documento de inteligencia era Azure AI Form Recognizer. Form Recognizer se convirtió oficialmente en Documento de inteligencia en julio de 2023.

No hay ningún cambio en los precios. Los nombres Cognitive Services y Applied AI Services siguen usándose en la facturación de Azure, el análisis de costos, las listas de precios y las API de precios.

No hay cambios importantes en las API ni en las bibliotecas cliente (SDK). Las API REST y las versiones SDK 2024-02-29-preview, 2023-10-31-preview y posteriores cambian de nombre a document intelligence.

Algunas plataformas siguen esperando la actualización de cambio de nombre. En la documentación de Microsoft, todas las menciones de Form Recognizer e Inteligencia de documentos hacen referencia al mismo servicio de Azure.

¿Cómo se relaciona el Documento de inteligencia con la Inteligencia Artificial generativa de documentos?

Puede usar una solución de IA generativa de documentos para conversar con sus documentos, generar contenidos atractivos a partir de ellos y acceder a los modelos del servicio Azure OpenAI en sus datos. Con la combinación del Documento de inteligencia de Azure AI y Azure OpenAI, puede crear una aplicación empresarial para interactuar sin problemas con sus documentos mediante el uso de lenguajes naturales, encontrar fácilmente respuestas y obtener información valiosa, y generar contenido nuevo y atractivo a partir de sus documentos existentes. Obtenga más detalles en el blog de la comunidad técnica.

¿Cómo se relaciona el Documento de inteligencia con la generación aumentada por recuperación?

La fragmentación semántica es un paso clave en la generación aumentada de recuperación (RAG) para garantizar su almacenamiento y recuperación eficientes. El modelo de diseño de Documento de inteligencia ofrece una solución completa para las funcionalidades de extracción avanzada de contenido y análisis de estructura de documentos.

Con el modelo de diseño, puede extraer fácilmente texto y elementos estructurales para dividir grandes cuerpos de texto en fragmentos más pequeños y significativos basados en contenido semántico en lugar de divisiones arbitrarias. A continuación, puede pasar cómodamente la información extraída al formato Markdown, para poder definir su estrategia de fragmentación semántica a partir de los bloques de creación proporcionados. Obtenga más detalles en la información general de RAG en Documento de inteligencia.

¿Qué casos de uso de Documento de inteligencia requieren una consideración especial?

Considere detenidamente los proyectos de procesamiento de documentos que abarcan datos financieros, datos de salud protegidos, datos personales o datos altamente confidenciales.

Asegúrese de cumplir todos los requisitos nacionales o regionales y específicos del sector.

¿Qué idiomas admite Documento de inteligencia?

Los modelos universales basados en aprendizaje profundo de Documento de inteligencia admiten muchos idiomas que pueden extraer texto multilingüe de sus imágenes y documentos, incluidas líneas de texto con idiomas mixtos.

La compatibilidad con los idiomas varía según la funcionalidad del servicio de Documento de inteligencia. Para obtener una lista completa de los textos manuscritos e impresos que admite Documento de inteligencia, consulte Compatibilidad con idiomas.

¿Documento de inteligencia está disponible en mi región de Azure?

Documento de inteligencia está disponible con carácter general en muchas de las más de 60 regiones de infraestructura global de Azure.

Elija la región que mejor se adapte a usted y a sus clientes.

¿Documento de inteligencia se integra con otros servicios de Microsoft?

"Sí, Documento de inteligencia se integra con los siguientes servicios:"

¿Qué relación existe entre Documento de inteligencia y el reconocimiento óptico de caracteres?

Documento de inteligencia es un servicio basado en la nube que incorpora el reconocimiento óptico de caracteres (OCR), el análisis de texto y la clasificación de texto personalizada de los servicios de Azure AI.

La inteligencia de documentos usa OCR para detectar y extraer información de documentos de texto escrito a mano y tipo de letra compatibles con inteligencia artificial para proporcionar más estructura e información a la extracción de texto.

¿Por cuánto tiempo está disponible mi modelo personalizado para su uso?

Un modelo tiene el mismo ciclo de vida que la versión de API que se usa para entrenarlo. Los modelos personalizados entrenados con una versión de disponibilidad general (GA) de la API tienen el mismo ciclo de vida que la versión de la API. Cuando la versión de la API está en desuso, el modelo ya no está disponible para la inferencia. Los modelos entrenados con una versión preliminar de la API también tienen el mismo ciclo de vida que la API de versión preliminar.

Anticipe que las API de versión preliminar quedarán desfasadas en un plazo de tres meses a partir de la actualización de la versión preliminar de la API o de una versión de la API más reciente disponible con carácter general.

¿Cuál es la puntuación de precisión y cómo se calcula?

La salida de una operación de modelo personalizado build (v3.0 y versiones posteriores) o train (v2.1) incluye la puntuación de precisión estimada. Esta puntuación representa la capacidad del modelo para predecir con precisión el valor etiquetado en un documento visualmente similar.

La precisión se mide dentro de un intervalo de valores porcentuales que va del 0 % (bajo) al 100 % (alto).

Para obtener más información, consulte Puntuaciones de precisión y confianza.

¿Cómo puedo mejorar las puntuaciones de precisión?

La precisión de un modelo se ve afectada por las varianzas en la estructura visual de los documentos. Aquí encontrará algunas sugerencias:

  • Incluya todas las variaciones de un documento en el conjunto de datos de entrenamiento. Las variaciones incluyen formatos diferentes, por ejemplo, archivos PDF digitales frente a digitalizados.

  • Separe los tipos de documento visualmente distintos y entrena distintos modelos.

  • Asegúrese de que no tiene etiquetas extrañas.

  • Para el etiquetado de firma y región, no incluya el texto circundante.

Para obtener más información, consulte Puntuaciones de precisión y confianza.

¿Cuál es la puntuación de confianza y cómo se calcula?

Una puntuación de confianza indica la probabilidad midiendo el grado de certeza estadística de que el resultado extraído se detecta correctamente.

El intervalo de valores de confianza es un porcentaje del 0 % (bajo) al 100 % (alto). Es mejor tener como destino una puntuación del 80 % o superior. Para casos más confidenciales, como los registros financieros o médicos, se recomienda una puntuación de cercana al 100 %. También puede requerir una revisión humana.

Para obtener más información, consulte Puntuaciones de precisión y confianza.

¿Cómo se pueden mejorar las puntuaciones de confianza?

Después de una operación de análisis, revise la salida JSON. Examine los valores de confidence de cada resultado de clave-valor en el nodo pageResults. También debe examinar las puntuaciones de confianza del nodo readResults, que se corresponden a la operación de lectura de texto. La confianza de los resultados de la lectura no afecta a la confianza de los resultados de la extracción de los pares clave-valor, por lo que debe comprobar ambos. Aquí encontrará algunas sugerencias:

  • Si la puntuación de confianza del objeto readResults es baja, mejore la calidad de los documentos de entrada.

  • Si la puntuación de confianza del objeto pageResults es baja, asegúrese de que los documentos que está analizando sean del mismo tipo.

  • Considere la posibilidad de incorporar la revisión humana a los flujos de trabajo.

  • Use formularios que tengan valores diferentes en cada campo.

  • Para los modelos personalizados, use un conjunto mayor de documentos de entrenamiento. El etiquetado de más documentos enseña al modelo a reconocer campos con mayor precisión.

Para obtener más información, consulte Puntuaciones de precisión y confianza.

¿Qué es un rectángulo de selección?

Un rectángulo delimitador (polygon en v3.0 y versiones posteriores) es un rectángulo abstracto que rodea los elementos de texto de un documento o formulario. Se usa como punto de referencia para la detección de objetos.

El cuadro delimitador especifica la posición usando un plano de coordenadas x e y presentado en una matriz de cuatro pares numéricos. Cada par representa una esquina del cuadro en el orden siguiente: superior izquierda, superior derecha, inferior derecha, inferior izquierda.

Para una imagen, las coordenadas se indican en píxeles. Para un PDF, las coordenadas se indican en pulgadas.

¿Puede la inteligencia de documentos ayudarme a clasificar documentos?

Documento de inteligencia proporciona modelos de clasificación personalizados que pueden analizar documentos de uno o varios archivos para identificar si un archivo de entrada contiene alguno de los tipos de documentos entrenados. El servicio admite los siguientes escenarios:

  • Un único archivo que contiene un tipo de documento, como un formulario de solicitud de préstamo.

  • Un único archivo que contiene varios documentos. Un ejemplo es un paquete de solicitud de préstamo que contiene un formulario de solicitud de préstamo, un pago y un extracto bancario.

  • Un único archivo que contiene varias instancias del mismo documento. Un ejemplo es una colección de facturas escaneadas.

Para obtener más información, consulte la información general de los modelos de clasificación personalizados.

Estudio del documento de inteligencia

¿Qué permisos necesito para acceder a Documento de inteligencia Studio?

Necesita una cuenta de Azure activa y una suscripción con al menos un rol de lector para acceder a Documento de inteligencia Studio.

Para el análisis de documentos y los modelos precompilados, estos son los requisitos de rol para escenarios de usuario:

  • Basic

  • Avanzado

    • Colaborador: necesita este rol para crear un grupo de recursos o un recurso de Documento de inteligencia. El rol de Colaborador no le permite hacer listas de claves para Cognitive Services y no le da acceso a usar los recursos creados o el almacenamiento, solo permite a un usuario leer o escribir en el propio recurso. Para usar Documento de inteligencia Studio, todavía necesita el rol de usuario de Cognitive Services.

En el caso de los proyectos de modelo personalizados, estos son los requisitos de rol para escenarios de usuario:

  • Basic

    • Usuario de Cognitive Services: necesita este rol para un recurso de Documento de inteligencia o Cognitive Services multiservicio para leer o escribir datos y es necesario para llamar a la API. Este rol es también el mínimo necesario para entrenar un modelo personalizado o analizar con modelos entrenados.

    • Colaborador de datos de Storage Blob: necesita este rol en la cuenta de almacenamiento para crear y etiquetar datos de proyecto.

  • Avanzado

    • colaborador de la cuenta de almacenamiento: necesita este rol para que la cuenta de almacenamiento configure la configuración de uso compartido de recursos entre orígenes (CORS). Es un esfuerzo único si reutiliza la misma cuenta de almacenamiento.

      El rol Colaborador no permite acceder a los datos del blob. Para usar Documento de inteligencia Studio, todavía necesita el rol colaborador de datos de Storage Blob.

    • colaborador: Necesita este rol para crear un grupo de recursos y recursos. El rol Colaborador no le da acceso a usar los recursos creados o el almacenamiento, solo permite a un usuario leer o escribir en el propio recurso. Para usar Documento de inteligencia Studio, todavía necesita roles básicos.

Para más información, consulte Roles integrados de Microsoft Entra y las secciones sobre las asignaciones de roles de Azure en el inicio rápido de Documento de inteligencia Studio.

Tengo varias páginas en un documento. ¿Por qué solo se analizan dos páginas en Documento de inteligencia Studio?

En el caso de los recursos de nivel gratuito (F0), solo se analizan las dos primeras páginas si usa Documento de inteligencia Studio, la API REST o los SDK.

En Documento de inteligencia Studio, seleccione el botón Configuración (engranaje), seleccione la pestaña Recursos y compruebe el plan de tarifa que usa para analizar los documentos. Si desea analizar todas las páginas de un documento, cambie a un recurso de pago (S0).

¿Cómo puedo cambiar directorios o suscripciones en Documento de inteligencia Studio?

Para cambiar un directorio en Documento de inteligencia Studio, seleccione el botón de Configuración (engranaje). En Directorio, seleccione el directorio de la lista y, a continuación, seleccione Cambiar directorio. Se le pedirá que vuelva a iniciar sesión después de cambiar el directorio.

Para cambiar una suscripción o un recurso, vaya a la pestaña recurso en Configuración.

¿Por qué recibo un error de almacenamiento en una operación de uso compartido de proyectos, etiquetado automático o actualización de OCR cuando el recurso de mi cuenta de almacenamiento está configurado con un firewall o una red virtual?

Consulte identidades administradas de Document Intelligence para configurar los recursos de Azure.

¿Por qué recibo el error "Acceso denegado debido a reglas de red virtual o firewall" en una operación de actualización automática de etiquetado o OCR cuando el recurso de Documento de inteligencia está configurado con un firewall o una red virtual?

Debe agregar la dirección IP dedicada 20.3.165.95 a la lista de permitidos del firewall para el recurso de Documento de inteligencia.

¿Puedo reutilizar o personalizar la experiencia de etiquetado de Documento de inteligencia Studio y compilarla en mi propia aplicación?

Sí. La experiencia de etiquetado de Documento de inteligencia Studio es de código abierto en el repositorio del kit de herramientas.

¿Por qué recibo el error "No se encontró Form Recognizer" al abrir mi proyecto personalizado?

El recurso de Documento de inteligencia enlazado a este proyecto personalizado se eliminó o se movió a otro grupo de recursos. Hay dos maneras de resolver este problema:

  • Vuelva a crear el recurso de Documento de inteligencia en la misma suscripción y grupo de recursos con el mismo nombre.

  • Vuelva a crear un proyecto personalizado con el recurso Documento de inteligencia migrado y especifique la misma cuenta de almacenamiento.

¿Existen puntos de conexión de URL independientes para las regiones de las nubes soberanas de Documento de inteligencia?

"Sí. Estudio de Documento de inteligencia tiene URL independientes para las regiones de la nube soberana:"

Desarrollo de aplicaciones

¿Cuáles son las opciones de desarrollo de Documento de inteligencia?

Documento de inteligencia ofrece las opciones de desarrollo más recientes dentro de las siguientes plataformas:

¿Dónde puedo encontrar la versión de API compatible para los SDK más recientes del lenguaje de programación?

En esta tabla se proporcionan vínculos a las versiones más recientes del SDK y se muestra la relación entre las versiones admitidas del SDK de Document Intelligence y la API:

Referencia del SDK de Azure de lenguaje admitido Versiones de API admitidas
• C#/.NET: 4.0.0

• Java: 4.0.0

• JavaScript: 4.0.0

• Python 3.2.0
2023-10-31-preview
v3.0
v2.1
v2.0

Para obtener más información, consulte Clientes admitidos para v4.0 y Clientes admitidos para v3.1.

¿Cuál es la diferencia entre Documento de inteligencia v3.0 y v2.1 y cómo migrar a la versión más reciente?

Para mejorar la facilidad de uso, Documento de inteligencia v3.0 presenta una biblioteca cliente totalmente rediseñada. Para usar correctamente las características más recientes de Documento de inteligencia API, necesita el SDK más reciente y el código de la aplicación debe actualizarse para usar los nuevos clientes.

En esta tabla se proporcionan vínculos a instrucciones detalladas para migrar a la versión más reciente de Documento de inteligencia:

Idioma/API Guía de migración
API DE REST v3
C#/.NET 4.0.0
Java 4.0.0
JavaScript 4.0.0
Python 3.2.0

¿Qué formatos de archivo admite Documento de inteligencia? ¿Existen limitaciones de tamaño para los documentos de entrada?

Para obtener los mejores resultados, consulte los requisitos de entrada.

¿Cómo puedo especificar un intervalo de páginas que se van a analizar en un documento?

Use el pages parámetro (compatible con v2.1, v3.0 y versiones posteriores de la API REST) para especificar páginas para documentos PDF y TIFF de varias páginas. La entrada aceptada incluye los siguientes intervalos:

  • Páginas únicas. Por ejemplo, si especifica 1, 2, se procesan las páginas 1 y 2.
  • Intervalos finitos. Por ejemplo, si especifica 2-5, se procesan las páginas 2 a 5.
  • Intervalos abiertos. Por ejemplo, si especifica 5-, se procesan todas las páginas de la página 5. Si especifica -10, se procesan las páginas 1 a 10.

Puede combinar estos parámetros y los intervalos se pueden superponer. Por ejemplo, si especifica -5, 1, 3, 5-10, se procesan las páginas 1 a 10.

El servicio aceptará la solicitud si puede procesar al menos una página del documento. Por ejemplo, el uso de 5-100 en un documento de cinco páginas es una entrada válida que significa que se procesa la página 5.

Si no proporciona un intervalo de páginas, se procesa todo el documento.

Tanto Documento de inteligencia Studio como la herramienta de etiquetado de ejemplo FOTT están disponibles. ¿Cuál debo usar?

La mayoría de las veces, se recomienda Documento de inteligencia Studio, ya que puede reducir el tiempo de configuración de recursos y servicios de almacenamiento de Documento de inteligencia.

Considere la posibilidad de usar Form OCR Testing Tool (FOTT) para los escenarios siguientes:

Límites y precios del servicio

¿Está disponible en mi región la versión 2024-02-29-preview de la API de REST de Documento de inteligencia?

La versión 2024-02-29-preview de la API de REST está disponible en las siguientes regiones:

  • Este de EE. UU.
  • Oeste de EE. UU. 2
  • Oeste de Europa

¿Cómo calcula Azure el precio del uso de Documento de inteligencia?

La facturación de Documento de inteligencia se calcula mensualmente en función del tipo de modelo y del número de páginas analizadas. Estos son algunos detalles:

  • Al enviar un documento para su análisis, el servicio analiza todas las páginas a menos que especifique un intervalo de páginas mediante el parámetro pages en la solicitud. Cuando el servicio analiza los documentos de Microsoft Excel y PowerPoint a través del modelo de lectura, OCR o diseño, cuenta cada hoja de cálculo de Excel y la diapositiva de PowerPoint como una página.

  • Cuando el servicio analiza archivos PDF y TIFF, cuenta cada página del archivo PDF o cada imagen del archivo TIFF como una página sin límites máximos de caracteres.

  • Cuando el servicio analiza los archivos HTML y Microsoft Word que admiten los modelos de lectura y diseño, las páginas se cuentan en bloques de 3000 caracteres cada una. Por ejemplo, si el documento contiene 7 000 caracteres, las dos páginas con 3 000 caracteres cada una y una página con 1 000 caracteres sumarán un total de tres páginas.

  • Cuando se usa el modelo de lectura o diseño para analizar archivos de Microsoft Word, Excel, PowerPoint y HTML, no se admiten imágenes incrustadas o vinculadas. Por lo tanto, el servicio no los cuenta como imágenes agregadas.

  • El entrenamiento de un modelo personalizado siempre es gratuito con Documento de inteligencia. Solo se le cobra cuando el servicio usa un modelo para analizar un documento.

  • Los precios de los contenedores son los mismos que los de los servicios en la nube.

  • Documento de inteligencia ofrece un nivel gratuito (F0) donde puede probar todas las características de Documento de inteligencia.

  • Documento de inteligencia tiene un modelo de precios basado en compromisos para cargas de trabajo grandes.

Obtenga más información sobre las opciones de precios de Documento de inteligencia de Azure AI.

¿Cómo puedo comprobar mi uso de Documento de inteligencia y calcular el precio?

Puede encontrar métricas de uso en el panel de métricas en Azure Portal. El panel muestra el número de páginas que procesa el Documento de inteligencia Azure AI. Puede comprobar el costo estimado invertido en el recurso mediante la calculadora de precios de Azure. Para obtener instrucciones detalladas, consulte Comprobación del uso y estimación del costo.

¿Cuáles son los procedimientos recomendados para mitigar la limitación?

Documento de inteligencia usa el escalado automático para proporcionar los recursos computacionales necesarios a petición, a la vez que se mantienen bajos los costos de los clientes. Para mitigar la limitación durante el escalado automático, se recomienda el enfoque siguiente:

  • Implemente lógica de reintento en la aplicación.

  • Si encuentra que se está limitando en el número de POST solicitudes, considere la posibilidad de agregar un retraso entre las solicitudes.

  • Aumente la carga de trabajo gradualmente. Evite los cambios bruscos.

  • Cree una solicitud de soporte técnico para aumentar el límite de transacciones por segundo (TPS).

Más información sobre las cuotas y límites del servicio del Documento de inteligencia.

¿Cuánto tiempo tarda el análisis de un documento?

El tiempo para analizar un documento depende del tamaño (por ejemplo, el número de páginas) y del contenido asociado en cada página.

La inteligencia de documentos es un servicio multiinquilino en el que la latencia de documentos similares es comparable pero no siempre idéntica. La latencia se define como la cantidad de tiempo que tarda un servidor de API en controlar y procesar una solicitud entrante y entregar la respuesta saliente al cliente. La variabilidad ocasional en la latencia y el rendimiento es inherente a cualquier servicio asincrónico, sin estado y basado en microservicios que procese imágenes y documentos grandes a escala.

Aunque estamos escalando continuamente las funcionalidades de hardware y capacidad y escalado, es posible que todavía tenga problemas de latencia en tiempo de ejecución.

Modelos personalizados

¿Cómo se ensamblan los mejores datos de entrenamiento?

Cuando se usa el modelo personalizado de Documento de inteligencia, se proporcionan sus propios datos de entrenamiento. Estas son algunas sugerencias para ayudar a entrenar los modelos de forma eficaz:

  • Use archivos PDF basados en texto en lugar de archivos PDF basados en imágenes cuando sea posible. Una manera de identificar un PDF basado en imágenes es intentar seleccionar texto específico en el documento. Si solo puede seleccionar toda la imagen del texto, el documento se basa en imágenes, no en texto.

  • Organice los documentos de entrenamiento mediante una subcarpeta para cada formato (JPEG/JPG, PNG, BMP, PDF o TIFF).

  • Use formularios que tengan todos los campos disponibles completados.

  • Use formularios con valores distintos en cada campo.

  • Si las imágenes son de baja calidad, use un conjunto de datos mayor (más de cinco documentos de entrenamiento).

Obtenga más información sobre cómo crear un conjunto de datos de entrenamiento.

¿Cuáles son los procedimientos recomendados para entrenar un modelo personalizado de gran precisión?

El nivel de precisión del modelo depende de la calidad de los materiales de entrenamiento. Aquí encontrará algunas sugerencias:

  • Determine si necesita usar un único modelo o varios modelos compuestos en un único modelo.

  • La precisión del modelo puede disminuir si tiene diferentes formatos analizados con un único modelo. Planee la segmentación del conjunto de datos en carpetas, donde cada carpeta es una plantilla única. Entrene un modelo por carpeta y componga los modelos resultantes en un único punto de conexión.

  • Los formularios personalizados se basan en una plantilla visual coherente. Si el formulario tiene variaciones con formatos y saltos de página, considere la posibilidad de segmentar el conjunto de datos para entrenar varios modelos.

  • Asegúrese de que tiene un conjunto de datos equilibrado teniendo en cuenta los formatos, los tipos de documento y la estructura.

Obtenga más información sobre los modelos compuestos.

¿Puedo volver a entrenar un modelo personalizado?

Documento de inteligencia no tiene una operación explícita de reentrenamiento. Cada operación de entrenamiento genera un nuevo modelo.

Si descubre que el modelo necesita volver a entrenarse, agregue más ejemplos al conjunto de datos de entrenamiento y entrene un nuevo modelo.

¿Cuántos modelos personalizados puedo crear en un único modelo personalizado?

Con la operación de modelo compuesto, puede crear hasta 200 modelos personalizados entrenados con un único identificador de modelo. Al realizar la solicitudAnalyze Document con un identificador de modelo compuesto, Documento de inteligencia clasifica el formulario enviado, elige el mejor modelo y devuelve los resultados. El modelo compuesto solo está disponible para los modelos personalizados entrenados con etiquetas.

El análisis de un documento mediante modelos compuestos es idéntico al análisis de un documento mediante un único modelo. El Analyze Documentresultado devuelve una docType propiedad que indica cuál de los modelos de componentes ha seleccionado para analizar el documento. No hay cambios en los precios por analizar un documento usando un modelo personalizado individual o un modelo personalizado compuesto.

Obtenga más información sobre los modelos compuestos.

Si el número de modelos que quiero componer supera el límite superior de un modelo compuesto, ¿cuáles son las alternativas?

Puede usar una de estas alternativas:

¿Cómo se puede refinar un modelo más allá del entrenamiento inicial?

Cada operación de entrenamiento genera un nuevo modelo.

  1. Cree un conjunto de datos para la nueva plantilla.

  2. Etiquete y entrena un nuevo modelo.

  3. Compruebe que el nuevo modelo funciona bien para los tipos de documento específicos.

  4. Cree el nuevo modelo con el modelo existente en un único punto de conexión. Documento de inteligencia puede determinar el mejor modelo para cada documento que se va a analizar.

Obtenga más información sobre los modelos compuestos.

Estoy creando un modelo personalizado. ¿Qué devuelve la etiqueta de detección de firmas?

detección de firmas busca la presencia de una firma, no la identidad de la persona que firma el documento.

Si el modelo devuelve sin firmar para la detección de firmas, significa que el modelo no encontró una firma en el campo definido.

¿Qué debo tener en cuenta y cuáles son las prácticas recomendadas para extraer tablas de documentos?

Puede empezar con el modelo de diseño de Documento de inteligencia para extraer texto, tablas, marcas de selección e información de estructura de documentos e imágenes. Tenga en cuenta también los siguientes factores:

  • ¿Se presentan los datos que desea extraer en forma de tabla y tiene sentido la estructura de la tabla?

  • Si los datos no están en formato de tabla, ¿pueden caber los datos en una cuadrícula bidimensional?

  • ¿Las tablas se extienden por varias páginas? Si es así, para evitar tener que etiquetar todas las páginas, divida el PDF en páginas antes de enviarlo a Documento de inteligencia. Después del análisis, vuelva a procesar las páginas en una sola tabla.

  • Si va a crear modelos personalizados, consulte Etiquetado como tablas. Las tablas dinámicas tienen un número variable de filas para cada columna. Las tablas fijas tienen un número constante de filas para cada columna.

¿Cómo puedo mover mis modelos entrenados de un entorno (como beta) a otro (como producción)?

Puede usar la API de copia para copiar modelos personalizados de una cuenta de Documento de inteligencia a otras que existan en cualquier región geográfica admitida. Para obtener instrucciones detalladas, consulte recuperación ante desastres.

La operación de copia se limita a copiar modelos dentro del entorno de nube específico en el que ha entrenado el modelo. Por ejemplo, no se admite la copia de modelos desde la nube pública a la nube de Azure Government.

¿Por qué se me ha cobrado por diseño al ejecutar el entrenamiento personalizado?

El diseño es necesario para generar etiquetas para el conjunto de datos. Si el conjunto de datos que usa para el entrenamiento personalizado no tiene archivos de etiqueta disponibles, el servicio los genera automáticamente.

Cuenta de almacenamiento

He podido acceder a mi cuenta de almacenamiento hace unos días. ¿Por qué ahora tengo problemas para volver a conectarme?

Al crear una firma de acceso compartido, la duración predeterminada es de 48 horas. Después de 48 horas, debe crear un nuevo token.

Considere la posibilidad de establecer un período de duración más largo durante el tiempo que usa la cuenta de almacenamiento con Documento de inteligencia.

Si mi cuenta de almacenamiento está detrás de una red virtual o un firewall, ¿cómo se proporciona acceso a Documento de inteligencia a los datos?

Si tiene una cuenta de Almacenamiento de Azure protegida por una red virtual o un firewall, Documento de inteligencia no puede acceder directamente a la cuenta de almacenamiento. Las identidades administradas para recursos de Azure admiten identidades administradas para recursos de Azure. Cuando se usa una identidad administrada, el servicio Documento de inteligencia puede acceder a la cuenta de almacenamiento mediante una credencial asignada.

Si piensa analizar los datos de la cuenta de almacenamiento privada mediante FOTT, debe implementar la herramienta detrás de la red virtual o el firewall.

Más información sobre cómo crear y usar identidades administradas para el recurso de Documento de inteligencia.

Contenedores

¿Necesito una conexión a Internet para usar contenedores de Documento de inteligencia?

Sí. Los contenedores de Documento de inteligencia requieren conectividad a Internet para enviar información de facturación a Azure. Obtenga más información sobre la seguridad de los contenedores de Azure.

¿Cuál es la diferencia entre los contenedores desconectados y conectados?

Los contenedores conectados envían información de facturación a Azure mediante un recurso de Documento de inteligencia en su cuenta de Azure. Con los contenedores conectados, se requiere conectividad a Internet para enviar información de facturación a Azure.

Los contenedores desconectados permiten usar las API que están desconectadas de Internet. la información de facturación no se envía a través de Internet. En su lugar, se le cobrará en función de un nivel de compromiso adquirido. Actualmente, el uso de contenedores desconectados está disponible para modelos personalizados y de factura de Documento de inteligencia.

Las funcionalidades del modelo proporcionadas en contenedores conectados y desconectados son las mismas y son compatibles con Documento de inteligencia v2.1.

¿Qué datos envían los contenedores conectados a la nube?

Los contenedores conectados de Documento de inteligencia envían información de facturación a Azure mediante un recurso de Documento de inteligencia en su cuenta de Azure. Los contenedores conectados no envían datos de los clientes (por ejemplo, la imagen o el texto que se está analizando) a Microsoft.

Para obtener un ejemplo de la información que los contenedores conectados envían a Microsoft para la facturación, consulte preguntas más frecuentes sobre el contenedor de Azure AI.

¿Por qué recibo el error "El contenedor no está en un estado válido"?. No se pudo validar la suscripción con el estado "OutOfQuota" Clave de API insuficiente*.

Los contenedores conectados de Documento de inteligencia envían información de facturación a Azure mediante un recurso de Documento de inteligencia en su cuenta de Azure. Puede recibir este mensaje si los contenedores no se pueden comunicar con el punto de conexión de facturación.

¿Puedo usar el almacenamiento local para el contenedor de Herramienta de etiquetado de ejemplo de Documento de inteligencia (FOTT)?

FOTT tiene una versión que usa almacenamiento local. La versión debe instalarse en un equipo Windows. Se puede instalar desde aquí.

En la página del proyecto, especifique el URI de la carpeta de etiqueta como /shared o /shared/sub-dir si los archivos de etiquetado están en un subdirectorio. El resto del comportamiento de la herramienta de etiquetado de ejemplo de Documento de inteligencia es el mismo que el del servicio hospedado.

¿Cuál es el procedimiento recomendado para escalar verticalmente?

En el caso de las llamadas asincrónicas, puede ejecutar varios contenedores con almacenamientos compartidos. El contenedor que procesa la POST llamada de análisis almacena la salida en el almacenamiento. A continuación, cualquier otro contenedor puede obtener los resultados del almacenamiento y atender las llamadas GET. El identificador de solicitud no está vinculado a un contenedor.

En el caso de las llamadas sincrónicas, puede ejecutar varios contenedores, pero solo un contenedor atiende una solicitud. Dado que es una llamada de bloqueo, cualquier contenedor del grupo puede atender la solicitud y enviar la respuesta. En este caso, solo un contenedor está vinculado a una solicitud a la vez y no se requiere ningún sondeo.

¿Cómo puedo configurar contenedores con almacenamiento compartido?

Los contenedores usan la propiedad Mounts:Shared al iniciarse para especificar el almacenamiento compartido para almacenar los archivos de procesamiento. Para ver el uso de esta propiedad, consulte la documentación de contenedores .

Seguridad y privacidad

¿Cuáles son los métodos y requisitos para autenticar solicitudes en los servicios de Azure AI?

Cada solicitud a una instancia de Azure Cognitive Services debe incluir un encabezado de autenticación. Puede autenticar una solicitud mediante varios métodos:

¿Documento de inteligencia almacena mis datos?

Para todas las características, Documento de inteligencia almacena temporalmente los datos y da como resultado Azure Storage en la misma región que la solicitud. Los datos se eliminan en un plazo de 24 horas a partir del momento en que envía una solicitud de análisis.

Obtenga más información sobre los datos, la privacidad y la seguridad de Documento de inteligencia.

¿Cómo se almacenan y usan mis modelos personalizados entrenados en Documento de inteligencia?

Las salidas provisionales después del análisis y el etiquetado se almacenan en la misma ubicación de Azure Storage donde se almacenan los datos de entrenamiento. Los modelos personalizados entrenados se almacenan en Azure Storage en la misma región y están aislados lógicamente con las credenciales de API y su suscripción de Azure.

Más ayuda y soporte técnico

¿Dónde puedo encontrar más soluciones a mis preguntas sobre Documento de inteligencia de Azure AI?

Microsoft Q & A es el centro de preguntas y respuestas técnicas de Microsoft. Puede filtrar las consultas específicas de Documento de inteligencia.

¿Qué debo hacer si el servicio no reconoce texto específico o lo reconoce incorrectamente cuando estoy etiquetando documentos?

Actualizamos y mejoramos continuamente el modelo de OCR de Documento de inteligencia. Puede enviar un correo electrónico al equipo de Documento de inteligencia. Si es posible, comparta un documento de ejemplo con el problema resaltado.