Lär dig mer om prediktiv kodning i Advanced eDiscovery (förhandsversion)Learn about predictive coding in Advanced eDiscovery (preview)

I prediktiv kodningsmodulen i Advanced eDiscovery intelligenta maskininlärningsfunktioner som hjälper dig att minska mängden innehåll som ska granskas.The predictive coding module in Advanced eDiscovery uses the intelligent, machine learning capabilities to help you reduce the amount of content to review. Med förutsägande kodning kan du minska och anpassa stora mängder ärendeinnehåll till en relevant uppsättning objekt som du kan prioritera för granskning.Predictive coding helps you reduce and cull large volumes of case content to a relevant set of items that you can prioritize for review. Detta sker genom att skapa och träna egna prediktiv kodningsmodeller som hjälper dig att prioritera granskningen av de mest relevanta objekten i en granskningsuppsättning.This is accomplished by creating and training your own predictive coding models that help you prioritize the review of the most relevant items in a review set.

Prediktiv kodningsmodulen är utformad för att effektivisera komplexiteten hos hantering av en modell inom en granskningsuppsättning och ge en iterativ metod för att lära ut din modell så att du kan komma igång snabbare med funktionerna för maskininlärning i Advanced eDiscovery.The predictive coding module is designed to streamline the complexity of managing a model within a review set and provide an iterative approach to training your model so you can get started faster with the machine learning capabilities in Advanced eDiscovery. För att komma igång kan du skapa en modell, etikettera så få som 50 objekt som relevanta eller inte relevanta.To get started, you can create a model, label as few as 50 items as relevant or not relevant. Den här utbildningen används för att använda förutsägelseresultat för alla objekt i granskningsuppsättningen.The system uses this training to apply prediction scores to every item in the review set. På så sätt kan du filtrera objekt baserat på förutsägelseresultatet, så att du först kan granska de mest relevanta (eller icke-relevanta) elementen.This lets you filter items based on the prediction score, which allows you to review the most relevant (or non-relevant) items first. Om du vill utbilda modeller med högre precision och återkallelsefrekvenser kan du fortsätta märka objekt i efterföljande utbildning avrundar tills modellen har en högre precision.If you want to train models with higher accuracies and recall rates, you can continue labeling items in subsequent training rounds until the model stabilizes.

Arbetsflödet för förutsägelsekodningThe predictive coding workflow

Här är en översikt och beskrivning av varje steg i ett prediktivt kodningsarbetsflöde.Here's an overview and description of each step predictive coding workflow. En mer detaljerad beskrivning av begrepp och terminologi för prediktiv kodningsprocess finns i Referens för prediktiv kodning.For a more detailed description of the concepts and terminology of the predictive coding process, see Predictive coding reference.

Arbetsflöde för förutsägelsekodning

  1. Skapa en ny prediktiv kodningsmodell i granskningsuppsättningen.Create a new predictive coding model in the review set. Det första steget är att skapa en ny prediktiv kodningsmodell i granskningsuppsättningen.The first step is to create a new predictive coding model in the review set. Du måste ha minst 2 000 objekt i granskningsuppsättningen för att skapa en modell.You must have at least 2,000 items in the review set to create a model. När du har skapat en modell bestämmer systemet hur många objekt som ska användas som kontrolluppsättning.After you create a model, the system will determine the number of items to use as a control set. Kontrolluppsättningen används under utbildningsprocessen för att utvärdera de förutsägelseresultat som modellen tilldelar till objekt med den etikett som du utför under utbildning avrundas.The control set is used during the training process to evaluate the prediction scores that the model assigns to items with the labeling that you perform during training rounds. Storleken på kontrolluppsättningen baseras på antalet objekt i granskningsuppsättningen och konfidensnivån och marginalen för felvärden som anges när modellen skapas.The size of the control set is based on the number of items in the review set and the confidence level and margin of error values that are set when creating the model. Objekten i kontrollen ändras aldrig och kan inte identifieras av användarna.Items in the control set never change and aren't identifiable to users.

    Mer information finns i Skapa en prediktiv kodningsmodell.For more information, see Create a predictive coding model.

  2. Slutför den första utbildningsomgången genom att ange att objekten är relevanta eller inte relevanta.Complete the first training round by labeling items as relevant or not relevant. Nästa steg är att utbilda modellen genom att starta den första utbildningsomgången.The next step is to train the model by starting the first round of training. När du startar en utbildningsrunda väljer modellen slumpmässigt ytterligare objekt från granskningsuppsättningen, som kallas för utbildningsuppsättningen.When you start a training round, the model randomly selects additional items from the review set, which is called the training set. De här objekten (både från kontrolluppsättningen och utbildningsuppsättningen) visas för dig så att du kan märka dem som antingen "relevanta" eller "inte relevanta".These items (both from the control set and the training set) are presented to you so that you can label each one as either "relevant" or "not relevant". Relevansen baseras på innehållet i objektet och inte på någon metadata för dokumentet.Relevancy is based on the content in the item and not any of the document metadata. När du har slutfört etikettprocessen i utbildningsprocessen lär sig modellen baserat på hur du har etiketterat objekten i utbildningsuppsättningen.After you complete the labeling process in the training round, the model will "learn" based on how you labeled the items in the training set. Baserat på den här utbildningen bearbetar modellen objekten i granskningsuppsättningen och tillämpar ett förutsägelseresultat på var och en.Based on this training, the model will process the items in the review set and apply a prediction score to each one.

    Mer information finns i Utbilda en prediktiv kodningsmodell.For more information, see Train a predictive coding model.

  3. Använda filtret för förutsägelseresultat för objekt i granskningsuppsättningen.Apply the prediction score filter to items in review set. När det föregående steget i utbildningen är avslutat är nästa steg att använda filtret för förutsägelseresultat för objekten i granskningen för att visa att de objekt som modellen har fastställt är "mest relevanta" (du kan också använda ett prognosfilter för att visa objekt som är "inte relevanta").After the previous training step is completed, the next step is to apply the prediction score filter to the items in the review to display the items that the model has determined are "most relevant" (alternatively, you could also use a prediction filter to display items that are "not relevant"). När du använder filtret för förutsägelse anger du ett område med förutsägelseresultat som ska filtreras.When you apply the prediction filter, you specify a range of prediction scores to filter. Området med förutsägelseresultat ligger mellan 0 och 1, där 0 är "inte relevant" och 1 är relevanta.The range of prediction scores fall between 0 and 1, with 0 being "not-relevant" and 1 being relevant. I allmänhet anses element med förutsägelseresultat mellan 0 och 0,5 vara "inte relevanta" och objekt med förutsägelseresultat mellan 0,5 och 1 anses vara relevanta.In general, items with prediction scores between 0 and 0.5 are considered "not-relevant" and items with prediction scores between 0.5 and 1 are considered relevant.

    Mer information finns i Använda ett prognosfilter för en granskningsuppsättning.For more information, see Apply a prediction filter to a review set.

  4. Utför fler utbildning avrundar tills modellens uppgångar har avrundats.Perform more training rounds until the model stabilizes. Du kan utföra ytterligare avrundar av utbildning om du vill skapa en modell med högre noggrannhet i förutsägelse och högre återkallelsefrekvenser.You can perform additional rounds of training if you want to create a model with a higher accuracy of prediction and increased recall rates. Med återkallelsehastigheten mäter du andelen av objekt som modellen förutsäger var relevanta bland objekt som faktiskt är relevanta (de objekt som du markerade som relevanta under utbildningen).Recall rate measures the proportion of items the model predicted were relevant among items that are actually relevant (the ones you marked as relevant during training). Resultatintervallet för återkallelsefrekvens från 0 till 1.The recall rate score ranges from 0 to 1. En poäng som ligger närmare 1 anger att modellen identifierar mer relevanta objekt.A score closer to 1 indicates the model will identify more relevant items. I en ny utbildningsrunda kan du märka ytterligare objekt i en ny utbildningsuppsättning.In a new training round, you label additional items in a new training set. När du har slutfört den utbildningsomgången uppdateras modellen baserat på ny utbildning från din senaste omgång med etiketter för objekt i utbildningsuppsättningen.After you complete that training round, the model is updated based on new learning from your most recent round of labeling items in the training set. Modellen bearbetar objekten i granskningsuppsättningen igen och tillämpar nya förutsägelseresultat.The model will process the items in the review set again, and apply new prediction scores. Du kan fortsätta att utföra utbildning avrundar tills modellen är kvar.You can continue performing training rounds until your model stabilizes. En modell anses inte vara tänkt när fallskärmen efter den senaste utbildningsomgången är mindre än 5 %.A model is considered stabilized when the churn rate after the latest round of training is less than 5%. Churn-hastigheten definieras som procentandel av objekt i en granskningsuppsättning där förutsägelseresultatet ändras mellan utbildning avrundar.Churn rate is defined as percentage of items in a review set where the prediction score changed between training rounds. Instrumentpanelen för förutsägelsekodning visar information och statistik som hjälper dig att bedöma stabiliteten i en modell.The predictive coding dashboard displays information and statistics that help you assess the stability of a model.

  5. Använd filtret för "slutliga" förutsägelseresultat för att granska vilka objekt som ska prioriteras.Apply the "final" prediction score filter to review set items to prioritize review. När du har slutfört alla utbildningsrundar och slutfört modellen är det sista steget att tillämpa det slutliga prognosresultatet på granskningsuppsättningen för att prioritera granskningen av relevanta och icke-relevanta objekt.After you complete all the training rounds and stabilize the model, the last step is to apply the final prediction score to the review set to prioritize the review of relevant and non-relevant items. Det här är samma aktivitet som du utförde i steg 3, men i det här läget är modellen stabil och du planerar inte att köra fler utbildningsrundar.This is the same task that you performed in step 3, but at this point the model is stable and you don't plan on running any more training rounds.