Crear un modelo de codificación predictiva (versión preliminar)Create a predictive coding model (preview)

El primer paso para usar las capacidades de aprendizaje automático de la codificación predictiva en Advanced eDiscovery es crear un modelo de codificación predictiva.The first step in using the machine learning capabilities of predictive coding in Advanced eDiscovery is to create a predictive coding model. Después de crear un modelo, puede entrenarlo para identificar el contenido relevante y no relevante de un conjunto de revisión.After you create a model, you can train it identify the relevant and non-relevant content in a review set.

Para revisar el flujo de trabajo de codificación predictiva, vea Learn about predictive coding in Advanced eDiscoveryTo review the predictive coding workflow, see Learn about predictive coding in Advanced eDiscovery

Antes de crear un modeloBefore you create a model

  • Debe haber un mínimo de 2.000 elementos en un conjunto de revisión para crear un modelo de codificación predictiva.There must be a minimum of 2,000 items in a review set to create a predictive coding model.

  • Asegúrese de confirmar todas las colecciones en el conjunto de revisión antes de crear un modelo.Be sure to commit all collections to the review set before you create a model. Los elementos agregados a un conjunto de revisión después de crear el modelo no se procesarán y se les asignará una puntuación de predicción generada por el modelo.Items added to a review set after the model is created will not be processed and assigned a prediction score that generated by the model.

  • El modelo no procesará ningún elemento del conjunto de revisión que no contenga texto ni se le asignará una puntuación de predicción.Any item in the review set that doesn't contain text would will not be processed by the model or assigned a prediction score. Los elementos con texto se incluirán en el conjunto de controles o en un conjunto de aprendizaje.Items with text will be included in the control set or a training set.

Crear un modeloCreate a model

  1. En el centro Microsoft 365 cumplimiento, abra un Advanced eDiscovery caso y, a continuación, seleccione la pestaña Conjuntos de revisión.In the Microsoft 365 compliance center, open an Advanced eDiscovery case and then select the Review sets tab.

  2. Abra un conjunto de opiniones y, a continuación, haga clic en Analytics Administrar > codificación predictiva (versión preliminar).Open a review set and then click Analytics > Manage predictive coding (preview).

    Haga clic en el menú desplegable Analizar en el conjunto de revisión para ir a la página Codificación predictiva

  3. En la página Modelos de codificación predictiva (versión preliminar), haga clic en Nuevo modelo.On the Predictive coding models (preview) page, click New model.

  4. En la página desplegable, escriba un nombre para el modelo y una descripción opcional.On the flyout page, type a name for the model and an optional description.

  5. Opcionalmente, puede configurar opciones avanzadas (haciendo clic en Opciones avanzadas en la página desplegable) relacionadas con el nivel de confianza y el margen de error.Optionally, you can configure advanced settings (by clicking Advanced options on the flyout page) related to the confidence level and margin of error. Esta configuración afecta al número de elementos incluidos en el conjunto de controles.These settings affect the number of items included in the control set. El conjunto de controles se usa durante el proceso de aprendizaje para evaluar las puntuaciones de predicción que el modelo asigna a los elementos con el etiquetado que se realiza durante las rondas de aprendizaje.The control set is used during the training process to evaluate the prediction scores that the model assigns to items with the labeling that you perform during the training rounds. Si su organización tiene directrices sobre el nivel de confianza y el margen de error para la revisión de documentos, es necesario especificarlas en los cuadros correspondientes.If your organization has guidelines about confidence level and margin of error for document review, specify them in the appropriate boxes. De lo contrario, use la configuración predeterminada.Otherwise, use the default settings.

  6. Haga clic en Guardar para crear el modelo.Click Save to create the model.

    El sistema tardaría un par de minutos en preparar el modelo.It will take a couple minutes for the system to prepare your model. Después de que esté listo, puedes realizar la primera ronda de aprendizaje.After it's ready, you can perform the first round of training.

Qué sucede después de crear un modeloWhat happens after you create a model

Después de crear un modelo, se producen lo siguiente en segundo plano durante la creación y preparación del modelo:After you create a model, the following things occur in the background during the creation and preparation of the model:

  • El sistema calcula el número de elementos para el conjunto de controles.The system calculates the number of items for the control set. Este tamaño se basa en el número de elementos del conjunto de revisión y la configuración del nivel de confianza y el margen de error.This size is based on the number of items in the review set and the settings for the confidence level and the margin of error. Los elementos del conjunto de controles se seleccionan aleatoriamente y se designan como elementos del conjunto de controles.Items for the control set are randomly selected and designated as control set items. El sistema incluye 10 elementos del conjunto de controles de la primera ronda de aprendizaje.The system includes 10 items from the control set in the first round of training.

  • El sistema selecciona aleatoriamente 40 elementos del conjunto de opiniones que se incluirán en el conjunto de aprendizaje de la primera ronda de aprendizaje.The system randomly selects 40 items from the review set to be included in the training set for the first round of training. Por lo tanto, la primera ronda de aprendizaje incluye 50 elementos para el etiquetado: 40 elementos del conjunto de aprendizaje y 10 elementos del conjunto de control.Therefore, the first round of training includes 50 items for labeling: 40 items from the training set and 10 items from the control set.

Pasos siguientesNext steps

Después de crear un modelo para un conjunto de revisión, el siguiente paso es realizar rondas de aprendizaje para "enseñar" el modelo para identificar el contenido que es relevante para la investigación.After you create a model for a review set, the next step is performing training rounds to "teach" the model to identify content that is relevant to your investigation. Para obtener más información, vea Train a predictive coding model.For more information, see Train a predictive coding model.