Een voorspellend coderingsmodel maken (voorbeeld)Create a predictive coding model (preview)

De eerste stap bij het gebruik van de mogelijkheden voor machine learning van voorspellende codering in Advanced eDiscovery is het maken van een voorspellend coderingsmodel.The first step in using the machine learning capabilities of predictive coding in Advanced eDiscovery is to create a predictive coding model. Nadat u een model hebt gemaakt, kunt u het model trainen om de relevante en niet-relevante inhoud in een revisieset te identificeren.After you create a model, you can train it identify the relevant and non-relevant content in a review set.

Zie Meer informatie over voorspellende codering in Advanced eDiscoveryTo review the predictive coding workflow, see Learn about predictive coding in Advanced eDiscovery

Voordat u een model maaktBefore you create a model

  • Er moeten minimaal 2000 items in een revisieset staan om een voorspellend coderingsmodel te maken.There must be a minimum of 2,000 items in a review set to create a predictive coding model.

  • Zorg ervoor dat u alle verzamelingen aan de revisieset verbindt voordat u een model maakt.Be sure to commit all collections to the review set before you create a model. Items die zijn toegevoegd aan een revisieset nadat het model is gemaakt, worden niet verwerkt en krijgen een voorspellingsscore die door het model wordt gegenereerd.Items added to a review set after the model is created will not be processed and assigned a prediction score that generated by the model.

  • Elk item in de revisieset dat geen tekst bevat, wordt niet verwerkt door het model of een voorspellingsscore toegewezen.Any item in the review set that doesn't contain text would will not be processed by the model or assigned a prediction score. Items met tekst worden opgenomen in de besturingselementset of een trainingsset.Items with text will be included in the control set or a training set.

Een model kiezenCreate a model

  1. Open in Microsoft 365-compliancecentrum een Advanced eDiscovery en selecteer vervolgens het tabblad Revisiesets.In the Microsoft 365 compliance center, open an Advanced eDiscovery case and then select the Review sets tab.

  2. Open een revisieset en klik vervolgens op Voorspellende codering beheren > (voorbeeld).Open a review set and then click Analytics > Manage predictive coding (preview).

    Klik in de vervolgkeuzelijst Analyseren in de revisieset om naar de pagina Voorspellende codering te gaan

  3. Klik op de pagina Voorspellende coderingsmodellen (voorbeeld) op Nieuw model.On the Predictive coding models (preview) page, click New model.

  4. Typ op de flyoutpagina een naam voor het model en een optionele beschrijving.On the flyout page, type a name for the model and an optional description.

  5. Desgewenst kunt u geavanceerde instellingen configureren (door te klikken op Geavanceerde opties op de flyoutpagina) die betrekking hebben op het betrouwbaarheidsniveau en de foutmarge.Optionally, you can configure advanced settings (by clicking Advanced options on the flyout page) related to the confidence level and margin of error. Deze instellingen zijn van invloed op het aantal items in de besturingselementset.These settings affect the number of items included in the control set. De besturingselementset wordt gebruikt tijdens het trainingsproces om de voorspellingsscores te evalueren die het model aan items toewijst met de labeling die u tijdens de trainingsronden uit te voeren.The control set is used during the training process to evaluate the prediction scores that the model assigns to items with the labeling that you perform during the training rounds. Als uw organisatie richtlijnen heeft voor betrouwbaarheidsniveau en foutmarge voor documentbeoordeling, geeft u deze op in de juiste vakken.If your organization has guidelines about confidence level and margin of error for document review, specify them in the appropriate boxes. Gebruik anders de standaardinstellingen.Otherwise, use the default settings.

  6. Klik op Opslaan om het model te maken.Click Save to create the model.

    Het duurt een paar minuten voordat het systeem uw model heeft voorbereid.It will take a couple minutes for the system to prepare your model. Nadat het klaar is, kunt u de eerste trainingsronde uitvoeren.After it's ready, you can perform the first round of training.

Wat gebeurt er nadat u een model hebt gemaaktWhat happens after you create a model

Nadat u een model hebt gemaakt, treden de volgende dingen op de achtergrond op tijdens het maken en voorbereiden van het model:After you create a model, the following things occur in the background during the creation and preparation of the model:

  • Het systeem berekent het aantal items voor de besturingselementset.The system calculates the number of items for the control set. Deze grootte is gebaseerd op het aantal items in de revisieset en de instellingen voor het betrouwbaarheidsniveau en de foutmarge.This size is based on the number of items in the review set and the settings for the confidence level and the margin of error. Items voor de besturingselementset worden willekeurig geselecteerd en aangewezen als items in de besturingselementset.Items for the control set are randomly selected and designated as control set items. Het systeem bevat 10 items uit de besturingselementset in de eerste trainingsronde.The system includes 10 items from the control set in the first round of training.

  • Het systeem selecteert willekeurig 40 items uit de revisieset die moeten worden opgenomen in de trainingsset voor de eerste trainingsronde.The system randomly selects 40 items from the review set to be included in the training set for the first round of training. Daarom bevat de eerste trainingsronde 50 items voor labeling: 40 items uit de trainingsset en 10 items uit de besturingselementset.Therefore, the first round of training includes 50 items for labeling: 40 items from the training set and 10 items from the control set.

Volgende stappenNext steps

Nadat u een model voor een revisieset hebt gemaakt, is de volgende stap het uitvoeren van trainingsronden om het model te 'onderwijzen' om inhoud te identificeren die relevant is voor uw onderzoek.After you create a model for a review set, the next step is performing training rounds to "teach" the model to identify content that is relevant to your investigation. Zie Een voorspellend coderingsmodel trainen voor meer informatie.For more information, see Train a predictive coding model.