Entrenamiento de un modelo de Form Recognizer con etiquetas mediante la herramienta de etiquetado de ejemploTrain a Form Recognizer model with labels using the sample labeling tool

En este inicio rápido, usará la API de REST de Form Recognizer con la herramienta de etiquetado de ejemplo para entrenar un modelo personalizado de procesamiento de documentos con datos etiquetados manualmente.In this quickstart, you'll use the Form Recognizer REST API with the sample labeling tool to train a custom document processing model with manually labeled data. Consulte la sección Entrenamiento con etiquetas de la introducción para más información sobre el entrenamiento con Form Recognizer.See the Train with labels section of the overview to learn more about supervised learning with Form Recognizer.

Requisitos previosPrerequisites

Para completar este inicio rápido, debe cumplir los siguientes requisitos:To complete this quickstart, you must have:

  • Una suscripción a Azure: cree una cuenta gratuitaAzure subscription - Create one for free
  • Una vez que tenga la suscripción de Azure, create a Form Recognizer resource en Azure Portal para obtener la clave y el punto de conexión.Once you have your Azure subscription, create a Form Recognizer resource in the Azure portal to get your key and endpoint. Una vez que se implemente, haga clic en Ir al recurso.After it deploys, click Go to resource.
    • Necesitará la clave y el punto de conexión del recurso que cree para conectar la aplicación a Form Recognizer API.You will need the key and endpoint from the resource you create to connect your application to the Form Recognizer API. En una sección posterior de este mismo inicio rápido pegará la clave y el punto de conexión en el código siguiente.You'll paste your key and endpoint into the code below later in the quickstart.
    • Puede usar el plan de tarifa gratis (F0) para probar el servicio y actualizarlo más adelante a un plan de pago para producción.You can use the free pricing tier (F0) to try the service, and upgrade later to a paid tier for production.
  • Un conjunto de al menos seis formularios del mismo tipo.A set of at least six forms of the same type. Usará estos datos para entrenar el modelo y probar un formulario.You'll use this data to train the model and test a form. En este inicio rápido, puede usar un conjunto de datos de ejemplo (descargue y extraiga sample_data.zip).You can use a sample data set (download and extract sample_data.zip) for this quickstart. Cargue los archivos de entrenamiento en la raíz de un contenedor de almacenamiento de blobs de una cuenta de Azure Storage de nivel de rendimiento estándar.Upload the training files to the root of a blob storage container in a standard-performance-tier Azure Storage account.

Creación de un recurso de Form RecognizerCreate a Form Recognizer resource

Vaya a Azure Portal y create a new Form Recognizer resource .Go to the Azure portal and create a new Form Recognizer resource . En el panel Crear, proporcione la siguiente información:In the Create pane, provide the following information:

NombreName Un nombre descriptivo para su recurso.A descriptive name for your resource. Se recomienda usar un nombre descriptivo, como MyNameFormRecognizer.We recommend using a descriptive name, for example MyNameFormRecognizer.
SuscripciónSubscription Seleccione la suscripción de Azure a la que se le ha concedido acceso.Select the Azure subscription which has been granted access.
UbicaciónLocation Ubicación de la instancia de Cognitive Services.The location of your cognitive service instance. Las diferentes ubicaciones pueden crear latencias, pero no tienen ningún impacto en la disponibilidad del tiempo de ejecución del recurso.Different locations may introduce latency, but have no impact on the runtime availability of your resource.
Plan de tarifaPricing tier El costo del recurso depende el plan de tarifa elegido y del uso.The cost of your resource depends on the pricing tier you choose and your usage. Para obtener más información, consulte los detalles de los precios.For more information, see the API pricing details.
Grupos de recursosResource group Grupo de recursos de Azure que contendrá su recurso.The Azure resource group that will contain your resource. Puede crear un nuevo grupo o agregarlo a uno ya existente.You can create a new group or add it to a pre-existing group.

Nota

Normalmente, al crear un recurso de Cognitive Services en Azure Portal, tiene la opción de crear una clave de suscripción para varios servicios (que se usa en varias instancias de Cognitive Services) o una clave de suscripción para un solo servicio (que se usa solo con una instancia específica de Cognitive Services).Normally when you create a Cognitive Service resource in the Azure portal, you have the option to create a multi-service subscription key (used across multiple cognitive services) or a single-service subscription key (used only with a specific cognitive service). Sin embargo, Form Recognizer actualmente no está incluido en la suscripción de varios servicios.However currently Form Recognizer is not included in the multi-service subscription.

Cuando el recurso de Form Recognizer termine la implementación, búsquelo y selecciónelo en la lista Todos los recursos del portal.When your Form Recognizer resource finishes deploying, find and select it from the All resources list in the portal. Encontrará su clave y punto de conexión en la página de clave y punto de conexión del recurso, en Administración de recursos.Your key and endpoint will be located on the resource's key and endpoint page, under resource management. Guarde ambos en una ubicación temporal antes de continuar.Save both of these to a temporary location before going forward.

PruebaTry it out

Para probar la herramienta de etiquetado de ejemplo de Form Recognizer en línea, vaya al sitio web de FOTT.To try out the Form Recognizer Sample Labeling Tool online, go to the FOTT website.

Necesitará una suscripción de Azure (cree una gratis) y un punto de conexión de recursos de Form Recognizer, así como la clave para probar el servicio Form Recognizer.You will need an Azure subscription (create one for free) and a Form Recognizer resource endpoint and key to try out the Form Recognizer service.

Configuración de la herramienta de etiquetado de ejemploSet up the sample labeling tool

Usará el motor de Docker para ejecutar la herramienta de etiquetado de ejemplo.You'll use the Docker engine to run the sample labeling tool. Siga estos pasos para configurar el contenedor de Docker.Follow these steps to set up the Docker container. Para conocer los principios básicos de Docker y de los contenedores, consulte Introducción a Docker.For a primer on Docker and container basics, see the Docker overview.

Sugerencia

OCR Form Labeling Tool también está disponible como proyecto de código abierto en GitHub.The OCR Form Labeling Tool is also available as an open source project on GitHub. La herramienta es una aplicación web en TypeScript compilada mediante React + Redux.The tool is a TypeScript web application built using React + Redux. Para más información o para realizar una contribución, consulte el repositorio OCR Form Labeling Tool.To learn more or contribute, see the OCR Form Labeling Tool repo. Para probar la herramienta en línea, vaya al sitio web de FOTT.To try out the tool online, go to the FOTT website.

  1. En primer lugar, instale Docker en un equipo host.First, install Docker on a host computer. En esta guía se muestra cómo usar el equipo local como un host.This guide will show you how to use local computer as a host. Si desea usar un servicio de hospedaje de Docker en Azure, consulte la guía paso a paso Implementación de la herramienta de etiquetado de ejemplo.If you want to use a Docker hosting service in Azure, see the Deploy the sample labeling tool how-to guide.

    El equipo host debe cumplir los siguientes requisitos de hardware:The host computer must meet the following hardware requirements:

    ContenedorContainer MínimaMinimum RecomendadoRecommended
    Herramienta de etiquetado de ejemploSample labeling tool 2 núcleos, 4 GB de memoria2 core, 4-GB memory 4 núcleos, 8 GB de memoria4 core, 8-GB memory

    Instale Docker en la máquina siguiendo las instrucciones adecuadas para su sistema operativo:Install Docker on your machine by following the appropriate instructions for your operating system:

  2. Obtenga el contenedor de la herramienta de etiquetado de ejemplo con el comando docker pull.Get the sample labeling tool container with the docker pull command.

    docker pull mcr.microsoft.com/azure-cognitive-services/custom-form/labeltool
    
  3. Ahora ya está listo para ejecutar el contenedor con docker run.Now you're ready to run the container with docker run.

    docker run -it -p 3000:80 mcr.microsoft.com/azure-cognitive-services/custom-form/labeltool eula=accept
    

    Este comando hará que la herramienta de etiquetado de ejemplo esté disponible mediante un explorador web.This command will make the sample labeling tool available through a web browser. Ir a http://localhost:3000.Go to http://localhost:3000.

Nota

También puede etiquetar documentos y entrenar modelos mediante la API REST de Form Recognizer.You can also label documents and train models using the Form Recognizer REST API. Para entrenar y analizar con la API REST, consulte Entrenamiento con etiquetas mediante la API REST y Python.To train and Analyze with the REST API, see Train with labels using the REST API and Python.

Configuración de datos de entradaSet up input data

En primer lugar, asegúrese de que todos los documentos de entrenamiento tienen el mismo formato.First, make sure all the training documents are of the same format. Si tiene formularios en varios formatos, organícelos en subcarpetas basadas en un formato común.If you have forms in multiple formats, organize them into subfolders based on common format. Al entrenar, deberá dirigir la API a una subcarpeta.When you train, you'll need to direct the API to a subfolder.

Configuración del uso compartido de recursos entre dominios (CORS)Configure cross-domain resource sharing (CORS)

Habilite CORS en la cuenta de almacenamiento.Enable CORS on your storage account. Seleccione la cuenta de almacenamiento en Azure Portal y haga clic en la pestaña CORS del panel izquierdo.Select your storage account in the Azure portal and click the CORS tab on the left pane. En la línea inferior, rellene los valores siguientes.On the bottom line, fill in the following values. Después, haga clic en Guardar en la parte superior.Then click Save at the top.

  • Orígenes permitidos = *Allowed origins = *
  • Métodos permitidos = [seleccionar todos]Allowed methods = [select all]
  • Encabezados permitidos = *Allowed headers = *
  • Encabezados expuestos = *Exposed headers = *
  • Antigüedad máxima = 200Max age = 200

Configuración de CORS en Azure PortalCORS setup in the Azure portal

Conexión a la herramienta de etiquetado de ejemploConnect to the sample labeling tool

La herramienta de etiquetado de ejemplo se conecta a un origen (en el que se encuentran los formularios originales) y a un destino (donde exporta las etiquetas creadas y los datos de salida).The sample labeling tool connects to a source (where your original forms are) and a target (where it exports the created labels and output data).

Las conexiones se pueden configurar y compartir entre proyectos.Connections can be set up and shared across projects. Usan un modelo extensible de proveedores, por lo que puede agregar fácilmente nuevos proveedores de origen y destino.They use an extensible provider model, so you can easily add new source/target providers.

Para crear una nueva conexión, haga clic en el icono Nuevas conexiones (un enchufe) en la barra de navegación izquierda.To create a new connection, click the New Connections (plug) icon, in the left navigation bar.

Rellene los campos con los siguientes valores:Fill in the fields with the following values:

  • Nombre para mostrar: el nombre para mostrar de la conexión.Display Name - The connection display name.

  • Descripción: la descripción del proyecto.Description - Your project description.

  • Dirección URL de SAS: la dirección URL de la firma de acceso compartido (SAS) del contenedor de Azure Blob Storage.SAS URL - The shared access signature (SAS) URL of your Azure Blob Storage container. Para recuperar la dirección URL de la firma de acceso compartido para los datos de entrenamiento del modelo personalizado, vaya al recurso de almacenamiento en Azure Portal y seleccione la pestaña Explorador de Storage. Vaya al contenedor, haga clic con el botón derecho y seleccione Obtener firma de acceso compartido.To retrieve the SAS URL for your custom model training data, go to your storage resource in the Azure portal and select the Storage Explorer tab. Navigate to your container, right-click, and select Get shared access signature. Es importante obtener la firma de acceso compartido para el contenedor, no para la propia cuenta de almacenamiento.It's important to get the SAS for your container, not for the storage account itself. Asegúrese de que los permisos de lectura y enumeración están marcados y haga clic en Create (Crear).Make sure the Read and List permissions are checked, and click Create. A continuación, copie el valor de la sección URL en una ubicación temporal.Then copy the value in the URL section to a temporary location. Debe tener el formato https://<storage account>.blob.core.windows.net/<container name>?<SAS value>.It should have the form: https://<storage account>.blob.core.windows.net/<container name>?<SAS value>.

    Recuperación de la dirección URL de SAS

Configuración de la conexión de la herramienta de etiquetado de ejemplo.

Creación de un nuevo proyectoCreate a new project

En la herramienta de etiquetado de ejemplo, los proyectos almacenan las configuraciones y los valores.In the sample labeling tool, projects store your configurations and settings. Cree un nuevo proyecto y rellene los campos con los siguientes valores:Create a new project and fill in the fields with the following values:

  • Nombre para mostrar: el nombre para mostrar del proyectoDisplay Name - the project display name
  • Token de seguridad: algunos valores de configuración del proyecto pueden incluir valores confidenciales, como claves de API u otros secretos compartidos.Security Token - Some project settings can include sensitive values, such as API keys or other shared secrets. Cada proyecto generará un token de seguridad que se puede usar para cifrar o descifrar los valores de configuración confidenciales del proyecto.Each project will generate a security token that can be used to encrypt/decrypt sensitive project settings. Puede buscar los tokens de seguridad en la configuración de la aplicación. Para ello, haga clic en el icono de engranaje situado en la esquina inferior de la barra de navegación izquierda.You can find security tokens in the Application Settings by clicking the gear icon at the bottom of the left navigation bar.
  • Conexión de origen: la conexión de Azure Blob Storage que creó en el paso anterior que le gustaría usar para este proyecto.Source Connection - The Azure Blob Storage connection you created in the previous step that you would like to use for this project.
  • Ruta de acceso a la carpeta (opcional): si los formularios de origen se encuentran en una carpeta en el contenedor de blobs, especifique aquí el nombre de la carpeta.Folder Path - Optional - If your source forms are located in a folder on the blob container, specify the folder name here
  • URI de servicio del servicio Form Recognizer: la dirección URL del punto de conexión de Form Recognizer.Form Recognizer Service Uri - Your Form Recognizer endpoint URL.
  • Clave de API: la clave de suscripción de Form Recognizer.API Key - Your Form Recognizer subscription key.
  • Descripción (opcional): descripción del proyecto.Description - Optional - Project description

Página Nuevo proyecto en la herramienta de etiquetado de ejemplo.

Etiquetado de formulariosLabel your forms

Al crear o abrir un proyecto, se abrirá la ventana principal del editor de etiquetas.When you create or open a project, the main tag editor window opens. El editor de etiquetas consta de tres partes:The tag editor consists of three parts:

  • Un panel de vista previa de tamaño variable que contiene una lista desplazable de formularios de la conexión de origen.A resizable preview pane that contains a scrollable list of forms from the source connection.
  • El panel principal del editor que permite aplicar etiquetas.The main editor pane that allows you to apply tags.
  • El panel del editor de etiquetas que permite a los usuarios modificar, bloquear, reordenar y eliminar etiquetas.The tags editor pane that allows users to modify, lock, reorder, and delete tags.

Identificación de elementos de textoIdentify text elements

Haga clic en Run OCR on all files (Ejecutar OCR en todos los archivos) en el panel izquierdo para obtener la información de diseño del texto de cada documento.Click Run OCR on all files on the left pane to get the text layout information for each document. La herramienta de etiquetado dibujará los cuadros de límite alrededor de cada elemento de texto.The labeling tool will draw bounding boxes around each text element.

También se mostrarán las tablas que se hayan extraído automáticamente.It will also show which tables have been automatically extracted. Haga clic en el icono de tabla o cuadrícula en la parte izquierda del documento para ver la tabla extraída.Click on the table/grid icon on the left hand of the document to see the extracted table. En esta guía de inicio rápido, dado que el contenido de la tabla se extrae automáticamente, este no se etiquetará, sino que se basará en la extracción automatizada.In this quickstart, because the table content is automatically extracted, we will not be labeling the table content, but rather rely on the automated extraction.

Visualización de tablas mediante la herramienta de etiquetado de ejemplo.

Aplicación de etiquetas a textoApply labels to text

A continuación, creará etiquetas y las aplicará a los elementos de texto que desea que reconozca el modelo.Next, you'll create tags (labels) and apply them to the text elements that you want the model to recognize.

  1. Primero, use el panel del editor de etiquetas para crear las etiquetas que le gustaría identificar.First, use the tags editor pane to create the tags you'd like to identify.
    1. Haga clic en + para crear una nueva etiqueta.Click + to create a new tag.
    2. Escriba el nombre de la etiqueta.Enter the tag name.
    3. Presione Entrar para guardar la etiqueta.Press Enter to save the tag.
  2. En el editor principal, haga clic para seleccionar las palabras en los elementos de texto resaltados.In the main editor, click to select words from the highlighted text elements.
  3. Haga clic en la etiqueta que desea aplicar o presione la tecla correspondiente del teclado.Click on the tag you want to apply, or press the corresponding keyboard key. Las teclas numéricas se asignan como teclas de acceso rápido para las diez primeras etiquetas.The number keys are assigned as hotkeys for the first 10 tags. Puede volver a ordenar las etiquetas con los iconos de flecha arriba y abajo del panel del editor de etiquetas.You can reorder your tags using the up and down arrow icons in the tag editor pane.

    Sugerencia

    Tenga en cuenta las siguientes sugerencias cuando vaya a etiquetar los formularios.Keep the following tips in mind when you're labeling your forms.

    • Solo se puede aplicar una etiqueta a cada elemento de texto seleccionado.You can only apply one tag to each selected text element.
    • Cada etiqueta solo se puede aplicar una vez por página.Each tag can only be applied once per page. Si un valor aparece varias veces en el mismo formulario, cree etiquetas diferentes para cada instancia.If a value appears multiple times on the same form, create different tags for each instance. Por ejemplo, "factura n.º 1", "factura n.º 2", etc.For example: "invoice# 1", "invoice# 2" and so on.
    • Las etiquetas no pueden abarcar varias páginas.Tags cannot span across pages.
    • Etiquete los valores tal como aparecen en el formulario; no intente dividir un valor en dos partes con dos etiquetas diferentes.Label values as they appear on the form; don't try to split a value into two parts with two different tags. Por ejemplo, un campo de dirección debe etiquetarse con una sola etiqueta incluso si abarca varias líneas.For example, an address field should be labeled with a single tag even if it spans multiple lines.
    • No incluya claves en los campos etiquetados, solo los valores.Don't include keys in your tagged fields—only the values.
    • Los datos de la tabla se deben detectar automáticamente y estarán disponibles en el archivo JSON de salida final.Table data should be detected automatically and will be available in the final output JSON file. Sin embargo, si el modelo no detecta todos los datos de la tabla, también puede etiquetar manualmente estos campos.However, if the model fails to detect all of your table data, you can manually tag these fields as well. Etiquete cada celda de la tabla con una etiqueta diferente.Tag each cell in the table with a different label. Si los formularios tienen tablas con un número variable de filas, asegúrese de etiquetar al menos un formulario con la tabla más grande posible.If your forms have tables with varying numbers of rows, make sure you tag at least one form with the largest possible table.
    • Use los botones situados a la derecha de + para buscar, reordenar y eliminar las etiquetas, así como cambiarles el nombre.Use the buttons to the right of the + to search, rename, reorder, and delete your tags.
    • Para quitar una etiqueta aplicada sin eliminar la etiqueta en sí, seleccione el rectángulo etiquetado en la vista de documento y presione la tecla Supr.To remove an applied tag without deleting the tag itself, select the tagged rectangle on the document view and press the delete key.

Ventana principal del editor de la herramienta de etiquetado de ejemplo.

Siga los pasos anteriores para etiquetar al menos cinco de sus formularios.Follow the steps above to label at least five of your forms.

Especificación de los tipos de valores de etiquetaSpecify tag value types

Opcionalmente, puede establecer el tipo de datos esperado para cada etiqueta.Optionally, you can set the expected data type for each tag. Abra el menú contextual a la derecha de una etiqueta y seleccione un tipo del menú.Open the context menu to the right of a tag and select a type from the menu. Esta característica permite que el algoritmo de detección realice determinadas suposiciones que mejorarán la precisión de la detección de texto.This feature allows the detection algorithm to make certain assumptions that will improve the text-detection accuracy. También garantiza que los valores detectados se devuelvan en un formato estandarizado en la salida JSON final.It also ensures that the detected values will be returned in a standardized format in the final JSON output. La información del tipo de valor se guarda en el archivo fields.json en la misma ruta de acceso que los archivos de etiqueta.Value type information is saved in the fields.json file in the same path as your label files.

Selección del tipo de valor con la herramienta de etiquetado de ejemploValue type selection with sample labeling tool

Actualmente se admiten los siguientes tipos de valor y variaciones:The following value types and variations are currently supported:

  • string
    • predeterminado, no-whitespaces, alphanumericdefault, no-whitespaces, alphanumeric
  • number
    • predeterminado, currencydefault, currency
  • date
    • predeterminado, dmy, mdy, ymddefault, dmy, mdy, ymd
  • time
  • integer
  • selectionMark: nuevo en v2.1-preview.1!selectionMarkNew in v2.1-preview.1!

Nota

Consulte estas reglas para el formato de fecha:See these rules for date formatting:

Para que el formato de fecha funcione, debe especificar un formato (dmy, mdy, ymd).You must specify a format (dmy, mdy, ymd) for date formatting to work.

Los siguientes caracteres se pueden usar como delimitadores de fecha: , - / . \.The following characters can be used as date delimiters: , - / . \. No se puede usar un espacio en blanco como delimitador.Whitespace cannot be used as a delimiter. Por ejemplo:For example:

  • 01,01,202001,01,2020
  • 01-01-202001-01-2020
  • 01/01/202001/01/2020

El día y el mes se pueden escribir con uno o dos dígitos y el año puede tener dos o cuatro dígitos:The day and month can each be written as one or two digits, and the year can be two or four digits:

  • 1-1-20201-1-2020
  • 1-01-201-01-20

Si una cadena de fecha tiene ocho dígitos, el delimitador es opcional:If a date string has eight digits, the delimiter is optional:

  • 0101202001012020
  • 01 01 202001 01 2020

El mes también se puede escribir con su nombre completo o abreviado.The month can also be written as its full or short name. Si se usa el nombre, los caracteres delimitadores son opcionales.If the name is used, delimiter characters are optional. Sin embargo, es posible que este formato se reconozca con menos precisión que otros.However, this format may be recognized less accurately than others.

  • 01/Ene/202001/Jan/2020
  • 01Ene202001Jan2020
  • 01 de enero de 202001 Jan 2020

Entrenamiento de un modelo personalizadoTrain a custom model

Haga clic en el icono Train (Entrenar) en el panel izquierdo para abrir la página de entrenamiento.Click the Train icon on the left pane to open the Training page. A continuación, haga clic en el botón Entrenar para empezar a entrenar el modelo.Then click the Train button to begin training the model. Una vez completado el proceso de entrenamiento, verá la siguiente información:Once the training process completes, you'll see the following information:

  • Id. del modelo: el identificador del modelo que se ha creado y entrenado.Model ID - The ID of the model that was created and trained. Cada llamada de entrenamiento crea un nuevo modelo con su propio identificador.Each training call creates a new model with its own ID. Copie esta cadena en una ubicación segura; la necesitará si desea realizar llamadas de predicción mediante la API REST o la biblioteca cliente.Copy this string to a secure location; you'll need it if you want to do prediction calls through the REST API or client library.
  • Precisión media: el promedio de precisión del modelo.Average Accuracy - The model's average accuracy. Puede mejorar la precisión del modelo mediante el etiquetado de formularios adicionales y el entrenamiento de nuevo para crear un nuevo modelo.You can improve model accuracy by labeling additional forms and training again to create a new model. Se recomienda empezar por etiquetar cinco formularios y agregar más formularios según sea necesario.We recommend starting by labeling five forms and adding more forms as needed.
  • La lista de etiquetas y la precisión estimada por etiqueta.The list of tags, and the estimated accuracy per tag.

Vista de entrenamiento.

Una vez finalizado el entrenamiento, examine el valor de Precisión media.After training finishes, examine the Average Accuracy value. Si es bajo, debe agregar más documentos de entrada y repetir los pasos anteriores.If it's low, you should add more input documents and repeat the steps above. Los documentos que ya ha etiquetado permanecerán en el índice del proyecto.The documents you've already labeled will remain in the project index.

Sugerencia

También puede ejecutar el proceso de entrenamiento con una llamada a la API REST.You can also run the training process with a REST API call. Para aprender a hacerlo, consulte Entrenamiento con etiquetas mediante Python.To learn how to do this, see Train with labels using Python.

Creación de modelos entrenadosCompose trained models

Esta característica está disponible actualmente en la versión preliminarThis feature is currently available in v2.1. v2.1.preview.

Análisis de un formularioAnalyze a form

Haga clic en el icono Predict (Predecir) (bombilla) de la izquierda para probar el modelo.Click on the Predict (light bulb) icon on the left to test your model. Cargue un documento de formulario que no haya utilizado en el proceso de entrenamiento.Upload a form document that you haven't used in the training process. A continuación, haga clic en el botón Predecir de la derecha para obtener las predicciones de clave y valor del formulario.Then click the Predict button on the right to get key/value predictions for the form. La herramienta aplicará etiquetas en los cuadros de límite e informará de la confianza de cada etiqueta.The tool will apply tags in bounding boxes and will report the confidence of each tag.

Sugerencia

También puede ejecutar la API de análisis con una llamada a REST.You can also run the Analyze API with a REST call. Para aprender a hacerlo, consulte Entrenamiento con etiquetas mediante Python.To learn how to do this, see Train with labels using Python.

Mejora de los resultadosImprove results

Según la precisión notificada, puede que desee realizar un entrenamiento adicional para mejorar el modelo.Depending on the reported accuracy, you may want to do further training to improve the model. Después de haber realizado una predicción, examine los valores de confianza de cada una de las etiquetas aplicadas.After you've done a prediction, examine the confidence values for each of the applied tags. Si el valor de precisión media del entrenamiento es alto, pero las puntuaciones de confianza son bajas (o los resultados son inexactos), debe agregar el archivo que se utilizó para la predicción al conjunto de entrenamiento, etiquetarlo y realizar el entrenamiento de nuevo.If the average accuracy training value was high, but the confidence scores are low (or the results are inaccurate), you should add the file used for prediction into the training set, label it, and train again.

La precisión media notificada, las puntuaciones de confianza y la precisión real pueden ser incoherentes cuando los documentos que se analizan son diferentes de los usados en el entrenamiento.The reported average accuracy, confidence scores, and actual accuracy can be inconsistent when the analyzed documents differ from those used in training. Tenga en cuenta que algunos documentos tienen un aspecto similar cuando los ven los usuarios, pero pueden parecer distintos para el modelo de IA.Keep in mind that some documents look similar when viewed by people but can look distinct to the AI model. Por ejemplo, puede realizar el entrenamiento con un tipo de formulario que tiene dos variantes, en el que el conjunto de entrenamiento consta de un 20 % perteneciente a la variante A y un 80 % a la variante B. Durante la predicción, es probable que las puntuaciones de confianza de los documentos de la variante A sean menores.For example, you might train with a form type that has two variations, where the training set consists of 20% variation A and 80% variation B. During prediction, the confidence scores for documents of variation A are likely to be lower.

Guardar un proyecto y reanudarlo más tardeSave a project and resume later

Para reanudar el proyecto en otro momento o en otro explorador, debe guardar el token de seguridad del proyecto y volver a escribirlo más tarde.To resume your project at another time or in another browser, you need to save your project's security token and reenter it later.

Obtención de las credenciales del proyectoGet project credentials

Vaya a la página de configuración del proyecto (icono de control deslizante) y anote el nombre del token de seguridad.Go to your project settings page (slider icon) and take note of the security token name. A continuación, vaya a la configuración de la aplicación (icono de engranaje), que muestra todos los tokens de seguridad de la instancia actual del explorador.Then go to your application settings (gear icon), which shows all of the security tokens in your current browser instance. Busque el token de seguridad del proyecto y copie su nombre y valor de clave en una ubicación segura.Find your project's security token and copy its name and key value to a secure location.

Restauración de las credenciales del proyectoRestore project credentials

Si desea reanudar el proyecto, primero debe crear una conexión al mismo contenedor de almacenamiento de blobs.When you want to resume your project, you first need to create a connection to the same blob storage container. Para ello, repita los pasos anteriores.Repeat the steps above to do this. A continuación, vaya a la página de configuración de la aplicación (icono de engranaje) y compruebe si el token de seguridad del proyecto está allí.Then, go to the application settings page (gear icon) and see if your project's security token is there. Si no es así, agregue un nuevo token de seguridad y copie el nombre y la clave del token del paso anterior.If it isn't, add a new security token and copy over your token name and key from the previous step. Después, haga clic en Guardar configuración.Then click Save Settings.

Reanudación de un proyectoResume a project

Por último, vaya a la página principal (icono de casa) y haga clic en Open Cloud Project (Abrir proyecto en la nube).Finally, go to the main page (house icon) and click Open Cloud Project. Después, seleccione la conexión al almacenamiento de blobs y seleccione el archivo .fott del proyecto.Then select the blob storage connection, and select your project's .fott file. La aplicación cargará todos los valores del proyecto ya que tiene el token de seguridad.The application will load all of the project's settings because it has the security token.

Pasos siguientesNext steps

En este inicio rápido, ha aprendido a utilizar la herramienta de etiquetado de ejemplo de Form Recognizer para entrenar un modelo con datos etiquetados manualmente.In this quickstart, you've learned how to use the Form Recognizer sample labeling tool to train a model with manually labeled data. Si quiere crear su propia utilidad para etiquetar los datos de entrenamiento, use las API de REST que se ocupan del entrenamiento con datos etiquetados.If you'd like to build your own utility to label training data, use the REST APIs that deal with labeled data training.