在 Microsoft Purview 電子文件探索 (Premium) 中收集統計數據和報表

建立集合估計值之後,您可以檢視所擷取專案的統計數據,例如包含最多符合搜尋準則之專案的內容位置,以及搜尋查詢傳回的項目數。 您也可以預覽結果的子集。

當您識別出想要進一步檢查的檔集時,可以將搜尋結果新增至檢閱集以收集和處理。

提示

如果您不是 E5 客戶,請使用 90 天的 Microsoft Purview 解決方案試用版來探索其他 Purview 功能如何協助貴組織管理數據安全性與合規性需求。 立即從 Microsoft Purview 合規性入口網站 試用中樞開始。 瞭解 有關註冊和試用版條款的詳細數據

搜尋集合估計值的統計數據

本節說明集合估計可用的統計數據。 這些統計數據位於集合估計值之飛出視窗頁面上的 [ 搜尋統計數據 ] 索引標籤上。

集合估計值

本節會顯示集合所傳回之估計項目的圖形化摘要。 這表示符合集合搜尋準則的項目數。 此資訊可讓您瞭解集合所傳回的估計項目數。

  • 依位置的估計專案:集合傳回的估計項目總數。 也會顯示位於信箱和網站中的特定項目數目。
  • 具有點擊的估計位置:包含集合所傳回專案的內容位置總數。 也會顯示信箱和網站位置的特定數目。
  • 依位置 (MB 的數據量) :集合所傳回之所有估計專案的大小總計。 也會顯示信箱項目和網站項目的特定大小。

集合估計值的集合估計區段。

條件報告

本節顯示集合搜尋查詢的相關統計數據,以及符合搜尋查詢不同部分的估計項目數目。 您可以使用這些統計數據來分析符合搜尋查詢中每個元件的項目數目。 這可協助您精簡集合的搜尋準則,並在必要時縮小集合的範圍。

  • 位置類型:查詢統計數據適用的內容位置類型。 Exchange 的值表示信箱位置;SharePoint 的值表示網站位置。
  • 部分:統計數據適用的搜尋查詢部分。 主要表示整個搜尋查詢。 關鍵字表示資料列中的統計資料適用於特定關鍵字。 如果您在集合中搜尋查詢時使用關鍵詞清單,則此數據表會包含查詢每個元件的統計數據。
  • 條件:針對傳回對應數據列中所顯示統計數據的集合估計執行之搜尋查詢的實際元件 (關鍵詞或條件) 。
  • 叫用的位置:[ 位置類型 ] 資料行所指定的內容位置 () ,其中包含符合 [ 條件 ] 資料行中所列之主要或關鍵詞查詢的專案。
  • 專案:從符合 [ 條件 ] 資料行中所列查詢的指定內容位置) (的項目數。 如先前所述,如果專案包含要搜尋之關鍵詞的多個實例,則只會在此數據行中計算一次。
  • 大小 (MB) :在指定的內容位置 (找到的所有專案大小) 符合 [ 條件 ] 資料行中的搜尋查詢。

集合估計的條件報表區段。

熱門位置

本節會顯示集合傳回最多專案之特定內容位置的統計數據。

  • 位置: (信箱電子郵件位址的位置名稱,以及網站) 的 URL。
  • 位置類型:信箱將具有 Exchange 類型,而 SharePoint 網站將具有 SharePoint 類型。
  • 專案:集合傳回的內容位置中的預估項目數。
  • 大小:每個內容位置中估計專案的總大小。

集合估計的前幾個位置區段。

認可集合的統計數據和報表

本節描述將集合認可至檢閱集之後可用的統計數據,包括新增至檢閱集的實際項目數。 除了載入集資訊之外,這些統計數據 () 提供新增至案例之內容的歷程記錄資訊。

將集合認可至檢閱集之後,下列索引標籤會顯示在已認可連線的飛出視窗頁面上。 每個索引標籤都包含不同類型的集合相關信息。

認可集合飛出視窗頁面上的索引標籤。

集合的 [摘要] 索引標籤

認可集合的 [摘要 ] 索引標籤包含數個區段,其中提供集合專案、項目估計值和位置、索引編製、檔類型等的相關信息。

集合概觀 (預覽)

認可檢閱集之 [摘要] 索引卷標上的 [集合概觀] 區段包含如何在集合中找到、擷取和處理專案的相關信息。 本節中的資訊是初始集合估計期間所收集和顯示之資訊的摘要,其中包含在集合認可至檢閱集期間收集和處理的資訊。 您可以使用本節中的資訊,協助您了解最終集合數據在集合認可和處理期間如何從估計數據演進。

此資訊會分割並顯示在下列子區段中:

  • 具有點擊的位置:本節會根據集合估計中定義的條件,摘要說明搜尋的位置數目,以及具有點擊的位置數目。 它也會顯示搜尋的位置數目和類型。

    具有點擊的位置。

  • 集合前估計值:本節摘要說明在認可集合之前,針對集合估計 (計算的項目數和總專案大小) 。 也會顯示 已部分 編製索引的任何項目計數。

    預先收集估計值。

  • 集合專案:本節會顯示集合認可至檢閱集期間,從位置擷取的所有項目類型、計數和描述。 在此程式期間,可能會在處理期間新增和匯總專案。 新增與合併可能包含下表中包含的類型:

    項目類型 項目類型描述
    具有點擊數的專案 搜尋所找到的估計項目數。
    檢閱集合重複專案 不會收集已在相同檢閱集中的專案。
    搜尋重複專案 不會收集相同項目的重複實例。
    所有版本 收集 SharePoint 中的所有專案版本。
    歷程記錄版本 收集 SharePoint 所維護的歷程記錄版本。
    雲端附件 雲端附件是從 SharePoint 鏈接識別和收集。
    版本為共用 除了最新版本之外,還會收集項目的共用版本。
    關係型Teams交談 系統會收集其他可能相關的聊天訊息。
    合併聊天文字記錄 收集的聊天訊息會合併成較少的 HTML 文字記錄。
    擷取例外狀況 存取逾時、空白檔案和其他例外狀況。
    收集的項目總數 從不同位置收集的項目總數。
  • 處理以檢閱集:本節會顯示從集合估計值新增至檢閱集的項目類型、計數和描述。 專案會解壓縮、掃描文字、重新編製索引,並進行處理以準備檢閱。

    要檢閱集合的處理。

集合內容

認可檢閱集之 [摘要] 索引卷標上的 [集合內容] 區段包含統計數據,以及從集合中的數據源收集並新增至檢閱集之專案的相關信息。

  • 已擷取的項目總數。 新增至檢閱集的項目總數。 此數位表示新增至檢閱集的父專案和子專案的總和。

    提示

    將游標停留在父專案或子專案列上方,以顯示父項或子項目的總數。

  • 父專案。 集合傳回的項目數,用來收集已新增至檢閱集的專案。 此數字對應至 (,等於) 集合參數 區段中顯示的預估項目數目。 他收集用來收集已新增至檢閱集之專案的父項資訊數目。

    父專案可能包含多個子專案。 例如,如果電子郵件訊息包含附加的檔案或具有雲端附件,則為父專案。 在此情況下,附加檔案或雲端附件的目標檔案會被視為子專案。 當您認可集合時,父專案和任何對應的子專案 (如附加檔案和雲端附件) 會新增到檢閱集作為個別專案或檔案。

  • 子專案。 新增至檢閱集的子項目數目。 只有檔案附件和雲端附件的子專案會新增到檢閱集做為個別檔案。 其他類型的子專案,例如電子郵件簽章和影像,會從父專案擷取,然後由光學字元識別 (OCR) 處理,以從子專案擷取任何文字。 然後,從這些子項目類型擷取的文字會新增至其父專案,讓您可以在檢閱集中檢視它。 eDiscovery (Premium) 不會將子專案新增至檢閱集,藉此限制檢閱集中可能的 immaterial 項目數目,以協助簡化檢閱程式。

  • 唯一專案。 新增至檢閱集的唯一項目數目。 唯一專案對檢閱集而言是唯一的專案。 當第一個集合新增至新的檢閱集時,所有專案都是唯一的,因為檢閱集中沒有先前的專案。

  • 識別出重複的專案。 因為檢閱集中已經存在相同的專案,所以集合中未新增至檢閱集的項目數目。 關於重複專案的統計數據可協助說明集合估計的估計項目數目與新增至檢閱集的實際項目數之間的差異。

索引

認可 閱集之 [ 摘要 ] 索引卷標上的 [編製索引] 區段包含新增至檢閱集之專案的索引資訊。

  • 新的索引專案。 新增至檢閱集之前新編製索引的項目數目。 新編製索引專案的範例是從父專案擷取的子專案,然後在將它們新增至檢閱集之前先編製索引。 此外,不在監管數據源中的專案,以及案例中 [ 數據源 ] 索引卷標上所列的非監管內容位置,會先編製索引,再將其新增至檢閱。 例如,新編製索引的專案會包含從其他位置收集的專案。

  • 已更新已編製索引的專案。 已成功編製索引並新增至檢閱集的部分索引項目數目。 此統計數據表示從監管和非監管內容位置部分編製索引的項目數據 索引標籤,這些專案在集合認可至檢閱集時已成功編製索引。

  • 編製索引錯誤。 在將部分編製索引的專案新增至檢閱集之前,無法編製索引的項目數目。 這些專案可能需要錯誤補救。

集合文件類型

認可檢閱集之 [摘要] 索引標籤上的 [集合文件類型] 區段會顯示集合中所包含之每個文件類型的項目計數。 檔案類型包括電子郵件、影像、檔、音訊、視訊檔類型等等。 如需支援檔類型的完整清單,請參閱 電子檔探索中支援的檔類型 (進階)

錯誤

認可檢閱集 [摘要] 索引標籤上的 [錯誤] 區段會顯示集合認可期間所發生的錯誤類型和數目。 錯誤可能包括大小為零的檔案、受保護的檔案、格式不正確的檔案、內部錯誤等等。 選取本節中的 [下載錯誤報告],即可下載 .csv 格式 的錯誤報告

集合參數

認可檢閱集之 [摘要] 索引卷標上的 [集合參數] 區段會顯示用來收集已新增至檢閱集之專案的集合資訊。 此索引標籤會顯示類似 [ 搜尋統計數據 ] 索引標籤上的資訊。本節提供集合所使用之搜尋查詢的快速快照集、已搜尋的內容位置,以及估計的集合結果。 如先前所述,本節中的估計專案數目會等於 [集合內容 ] 區段中顯示的父項目數目。

集合的數據源索引標籤

[ 數據源] 索引 標籤包含有關監管和非監管數據源的資訊。 [監管 數據源 ] 區段會顯示集合中包含之每個監管人的所有監管數據源。 [ 非監管數據源 ] 區段會顯示集合的所有非監管數據源。 顯示的數據源資訊也可在每個案例的主要 [數據源] 索引標籤上取得。

集合的 [搜尋統計數據] 索引標籤

[ 搜尋統計數據] 索 引標籤上顯示的統計數據與上次執行集合估計值時的統計數據相同。 這包括集合估計值、條件報告和最上層位置。 此資訊會從集合估計中保留以供歷程記錄參考,並可與認可至檢閱集的實際集合進行比較。

集合估計值與實際認可集合之間的差異

當您執行集合估計值時,[搜尋統計數據] 索引卷標的 [摘要] 索引卷標和 [集合估計] 區段中會顯示 (項目數目及其符合集合準則的總大小) 。將集合估計認可至檢閱集之後, (的實際項目數目及其新增檢閱集) 大小總計通常與估計值不同。 在大部分情況下,加入檢閱集的項目數目會比從集合估計值預估的專案還多。 下列清單描述這些差異的最常見原因,以及識別它們的秘訣:

  • 子專案。 子專案 (例如從其父專案擷取並新增為個別檔案的檔案附件和雲端附件) 。 子項目的數目可能會增加新增至檢閱集的項目數。 一般而言,在認可集合的 [摘要] 索引標籤的 [集合內容] 區段中識別的父項目數應該等於集合估計值中的預估項目數目。

  • 重複的專案。 已新增至先前集合中檢閱集合的集合估計專案將不會新增。 如先前所述,集合中的重複項目數目會顯示在 [摘要] 索引標籤的 [集合內容] 區段中。

  • 集合組態選項。 當您將集合估計認可至檢閱集時,您必須選擇包含交談線程、雲端附件和檔版本。 任何新增至檢閱集的專案不會包含在集合估計值的估計值中。 只有當您認可集合時,才會識別並收集它們。 選取這些選項很可能會增加新增至檢閱集的項目數。

    例如,集合估計值的估計中不包含多個版本的 SharePoint 檔。 但是,如果您在認可集合估計值時選取包含所有檔版本的選項,則新增至檢閱集之專案的實際數目 (和大小總計) 將會增加。

    如需這些選項的詳細資訊,請參閱將 集合估計認可至檢閱集

以下是來自集合估計的預估結果可能與實際認可結果不同的其他原因。

  • 估計集合估計結果的方式。 集合估計值所傳回的搜尋結果估計只是估計值 (,而不是符合集合查詢準則之專案的實際計數) 。 若要編譯電子郵件項目的估計,Exchange 資料庫會要求符合搜尋準則的郵件標識碼清單。 但是,當您將集合認可至檢閱集時,會重新執行集合,並從 Exchange 資料庫擷取實際的訊息。 因此,可能會因為如何判斷估計的項目數和實際項目數而導致差異。

  • 在估計和認可集合估計值期間發生的變更。 當您將集合估計認可至檢閱集時,會重新執行搜尋,以收集搜尋索引中符合搜尋準則的最新專案。 可能會建立、傳送或刪除其他專案,以符合上次執行集合估計值與將集合估計認可至檢閱集之間的搜尋準則。 此外,當估計集合估計結果時,搜尋索引中的專案可能已不存在,因為它們在認可集合之前已從數據源清除。 解決此問題的其中一個方法是指定集合的日期範圍。 另一種方式是保留內容位置,以便保留且無法清除專案。

  • 未編製索引的專案。 如果集合估計包含搜尋所有 Exchange 信箱或所有 SharePoint 網站,則只會將包含符合集合準則之專案之內容位置的未編製索引專案新增至檢閱集。 換句話說,如果在信箱或網站中找不到任何結果,則該信箱或網站中的任何未編製索引專案都不會新增至檢閱集。 不過,來自所有內容位置的未編製索引專案 (即使是未包含符合集合查詢) 的專案,也會包含在估計的集合結果中。

  • 部分編製索引的專案:選取此選項會將部分編製索引的專案從其他數據源新增至檢閱集。 如果集合在集合精靈) 的 [ 其他位置 ] 頁面上 (搜尋其他數據源,則您可能會從這些位置將部分編製索引的專案新增至檢閱集。 監管和非監管數據源通常沒有部分編製索引的專案。 這是因為進階索引處理程式會在將監管和非監管數據源新增至案例時重新編製專案索引。 此外,新增部分編製索引的專案會增加新增至檢閱集的項目數。

    將部分編製索引的專案新增至檢閱集之後,您可以套用篩選來特別檢視這些專案。 如需詳細資訊,請參閱 案例範例:篩選部分編製索引的專案

    或者,如果集合預估包含特定的內容位置 (這表示在集合估計精靈的 [ 其他位置 ] 頁面上指定的特定信箱或網站) ,則會匯出集合準則未排除的未編製索引專案 (,) 搜尋中指定的內容位置。 在此情況下,未編製索引的預估項目數和新增至檢閱集的未編製索引項目數應該相同。