建立預測性編碼模型 (預覽)

在 eDiscovery (Premium) 中使用預測性程式碼的機器學習功能的第一個步驟是建立預測性編碼模型。 建立模型之後,您可以將模型定型,以識別檢閱集中相關且不相關的內容。

若要檢閱預測性編碼工作流程,請參閱 瞭解 eDiscovery (Premium) 中的預測性編碼

提示

如果您不是 E5 客戶,請使用 90 天的 Microsoft Purview 解決方案試用版來探索其他 Purview 功能如何協助貴組織管理數據安全性與合規性需求。 立即從 Microsoft Purview 合規性入口網站 試用中樞開始。 瞭解 有關註冊和試用版條款的詳細數據

建立模型之前

  • 檢閱集內至少必須有 2,000 個專案,才能建立預測性編碼模型。
  • 建立模型之前,請務必將所有集合認可至檢閱集。 建立模型之後新增至檢閱集的專案將不會進行處理,並指派模型所產生的預測分數。
  • 檢閱集中任何不包含文字的專案都不會由模型處理或指派預測分數。 包含文字的專案會包含在控件集或定型集合中。

建立模型

  1. 在 Microsoft Purview 合規性入口網站 中,開啟 eDiscovery (Premium) 案例,然後選取 [檢閱集] 索引卷標。

  2. 開啟檢閱集,然後選 取 [分析]>[管理預測性編碼 (預覽)

    選取檢閱集中的 [分析] 下拉功能表,以移至 [預測性編碼] 頁面。

  3. 在 [ 預測性編碼模型 (預覽) 頁面上,選取 [ 新增模型]

  4. 在飛出視窗頁面上,輸入模型的名稱和選擇性描述。

  5. 您可以選擇性地在飛出視窗頁面上選取 [進階 選項 ], (設定進階設定) 與信賴等級和錯誤邊界相關。 這些設定會影響控件集中包含的項目數目。 在定型程式期間,會使用 控制集 來評估模型指派給具有您在訓練回合期間執行之卷標之專案的預測分數。 如果您的組織對於檔檢閱有信賴等級和錯誤邊界的指導方針,請在適當的方塊中加以指定。 否則,請使用預設設定。

  6. 取 [儲存 ] 以建立模型。

    系統需要幾分鐘的時間來準備您的模型。 準備就緒之後,您可以執行第一輪的訓練。

建立模型之後會發生什麼事

建立模型之後,在建立和準備模型期間,背景中會發生下列情況:

  • 系統會計算控件集的項目數。 此大小是根據檢閱集中的項目數目,以及信賴等級和錯誤邊界的設定。 控件集的專案會隨機選取並指定為控件集專案。 系統在第一輪定型中包含來自控件集的10個專案。
  • 系統會從檢閱集中隨機選取 40 個專案,以包含在第一輪定型的訓練集中。 因此,第一輪訓練包含50個專案來標記:40個專案來自訓練集,10個專案來自控件集。

後續步驟

建立檢閱集的模型之後,下一個步驟是執行訓練回合來「教導」模型,以識別與調查相關的內容。 如需詳細資訊,請 參閱定型預測性編碼模型