設定電子檔探索 (進階) 案例的搜尋和分析設定

您可以設定每個 Microsoft Purview 電子文件探索 (Premium) 案例的設定,以控制下列功能:

  • 近似重複項和電子郵件對話
  • 主題
  • 自動產生檢閱集查詢
  • 忽略文字
  • 光學字元辨識

提示

如果您不是 E5 客戶,請使用 90 天的 Microsoft Purview 解決方案試用版來探索其他 Purview 功能如何協助貴組織管理數據安全性與合規性需求。 立即從 Microsoft Purview 合規性入口網站 試用中樞開始。 瞭解 有關註冊和試用版條款的詳細數據

設定案例的分析設定

若要設定案例的搜尋和分析設定:

  1. 在 [電子文件探索 (進階版)]頁面上選取案例。
  2. 在 [ 設定] 索引標籤的 [ 搜尋 & 分析] 底下,選擇 [ 選取]。 案例設定頁面隨即顯示。 這些設定會套用至案例中的所有檢閱集。

本文中的下列各節說明您可以針對案例設定的分析設定。

近似重複項和電子郵件對話

在本節中,您可以設定重複偵測、近乎重複偵測和電子郵件線程的參數。 如需詳細資訊,請參閱近乎重複偵測和 Email 線程

  • 接近重複/電子郵件線程處理: 開啟時,當您對檢閱集中的數據執行分析時,重複偵測、近乎重複偵測和電子郵件線程會包含在工作流程中。
  • 文件和電子郵件相似度閾值: 如果兩份檔的相似度層級高於臨界值,這兩份檔會放在相同的接近重複集合中。
  • 字數下限/最大值: 這些設定指定,只有至少具有最小字數和最大字數的檔上,才會執行接近重複專案和電子郵件線程分析。

佈景主題

在本節中,您可以設定主題的參數。 如需詳細資訊,請參閱 主題

  • 主題: 開啟時,當您對檢閱集中的數據執行分析時,主題叢集會當做工作流程的一部分來執行。
  • 主題數目上限: 指定當您對檢閱集中的數據執行分析時,可以產生的主題數目上限。
  • 在主題中包含數位: 開啟時,會在產生主題時包含識別主題) 的數位 (。
  • 動態調整主題數目上限: 在某些情況下,檢閱集中的檔可能不足,無法產生所需的主題數目。 若啟用此設定,電子文件探索 (進階版) 會動態調整主題數目上限,而不是嘗試強制執行主題數目上限。

檢閱集查詢

如果您選取 [在分析后自動建立 For Review 儲存的搜尋] 複選框,eDiscovery (Premium) 自動產生名為 For Review 的檢閱集查詢。

For Review 自動產生的查詢。

此查詢基本上會從檢閱集篩選出重複的專案。 這可讓您檢閱檢閱集中的唯一專案。 只有在對案例中的檢閱集執行分析時,才會建立此查詢。 如需檢閱集查詢的詳細資訊,請 參閱查詢檢閱集中的數據

忽略文字

在某些情況下,某些文字會降低分析品質,例如不論電子郵件內容為何,都會新增到電子郵件訊息的冗長免責聲明。 如果您知道應忽略的文字,則可以指定應排除文字的文字字串和分析功能 (近似重複項、電子郵件對話、主題和相關性),將其從分析中排除。 也支援使用正則表達式 (RegEx) 為忽略的文字。

光學字元辨識 (OCR)

開啟此設定時,會在圖像檔上執行 OCR 處理。 OCR 處理會在下列情況下執行:

  • 將監管人和 非監管數據源 新增至案例時。 將 OCR 套用至影像檔案時,這些檔案中的文字在集合期間便可供搜尋。 OCR 處理會在 進階索引 處理期間執行。 OCR 只會在進階索引編製期間處理的項目上執行。 例如,如果在進階編製索引期間處理部分編製索引或有其他索引錯誤的大型 PDF 檔案,檔案也會套用 OCR。 換句話說,OCR 處理只會發生在進階編製索引程式期間重新編製索引的檔案上。 這表示在某些情況下,監管人可能會新增至案例,但某些電子郵件附件不會針對 OCR 進行處理,因為這些檔案不會在進階索引期間處理。
  • 當來自其他數據源的內容 (未與監管人相關聯,且新增至非監管數據源中案例的內容時,) 會新增至檢閱集。

將數據新增至檢閱集之後,即可檢閱、搜尋、標記及分析影像文字。 您可以在檢視集中所選影像檔案的文字查看器中檢視擷取的文字。 如需詳細資訊,請參閱: