eDiscovery (Premium) 中近乎重複的偵測

考量要檢閱的一組文件,其中子集是基於相同範本,且大部分都是相同的重複使用語言,但或多或少有一些差異。 如果檢閱者可以識別此子集、徹底檢閱其中一個子集,並檢閱其餘部分的差異,他們就不會遺漏任何唯一的資訊,而只需要花一些時間來讀取涵蓋的所有檔。 近似重複項偵測會將文字類似的文件分組在一起,以協助您提升檢閱程序的效率。

提示

如果您不是 E5 客戶,請使用 90 天的 Microsoft Purview 解決方案試用版來探索其他 Purview 功能如何協助貴組織管理數據安全性與合規性需求。 立即從 Microsoft Purview 合規性入口網站 試用中樞開始。 瞭解 有關註冊和試用版條款的詳細數據

它的運作方式為何?

在執行近似重複項偵測時,系統會剖析每份有文字的文件。 然後將每份文件兩兩比較,以判斷其相似性是否大於所設定的閾值。 如果是,便會將這些文件分組在一起。 比較完所有文件並加以分組後,每個群組的文件會標示為「樞紐」;在檢閱您的文件時,您可以先檢閱樞紐,並檢閱相同近似重複項集合中的其他文件,重點則放在樞紐與受檢閱文件的差異。