調查電子檔探索中部分編製索引的專案

當您執行搜尋時,從 Microsoft Purview 合規性入口網站 執行的電子檔探索搜尋會在估計的搜尋結果中自動包含部分編製索引的專案。 部分編製索引的專案是 SharePoint 上的 Exchange 信箱專案和檔,商務用 OneDrive 因故未完全編製索引以供搜尋的網站。 大部分的電子郵件訊息和網站文件都會成功編製索引,因為它們落在 電子郵件訊息的索引限制內。 不過,有些專案可能會超過這些索引限制,而且會部分編製索引。 以下是當您執行電子檔探索搜尋時,專案無法編製索引以進行搜尋,並以部分索引專案傳回的其他原因:

  • Email 訊息具有無法開啟的附加檔案;這是部分編製索引電子郵件專案的最常見原因。
  • 附加至電子郵件訊息的檔案太多。
  • 附加至電子郵件訊息的檔案太大。
  • 檔案類型支援索引編製,但在編製特定檔案的索引時發生錯誤。

雖然不同,但大部分的組織客戶依數量而有不到 1% 的內容,而根據部分編製索引的大小,其內容小於 12%。 磁碟區與大小之間差異的原因是較大的檔案具有較高的機率,以包含無法完全編製索引的內容。

如需內容搜尋中部分索引專案的詳細資訊,請 參閱調查內容搜尋中部分編製索引的專案

提示

如果您不是 E5 客戶,請使用 90 天的 Microsoft Purview 解決方案試用版來探索其他 Purview 功能如何協助貴組織管理數據安全性與合規性需求。 立即從 Microsoft Purview 合規性入口網站 試用中樞開始。 瞭解 有關註冊和試用版條款的詳細數據

執行電子檔探索搜尋之後,搜尋位置中部分編製索引的專案總數和大小會列在搜尋結果統計數據中,這些統計數據會顯示在搜尋的詳細統計數據中。 請注意,這些在搜尋統計數據中稱為 未編製索引的專案 。 以下是一些會影響搜尋結果中傳回之部分索引項目數目的專案:

  • 如果專案已部分編製索引並符合搜尋查詢,則會同時包含在搜尋結果專案和部分索引專案的計數 (和大小) 中。 不過,導出相同搜尋的結果時,該專案只會包含在一組搜尋結果中;它未包含為部分索引專案。
  • 部分編製索引的項目位於 SharePoint 和 OneDrive 網站中 ,不會 包含在搜尋詳細統計數據中顯示的部分索引項目估計中。 不過,當您匯出電子檔探索搜尋的結果時,可以匯出部分編製索引的專案。 例如,如果您只搜尋網站,則部分編製索引項目的估計數目會是零。

計算組織中部分編製索引專案的比例

若要瞭解貴組織暴露於部分編製索引的專案,您可以使用空白關鍵詞查詢) ,在所有信箱 (中執行所有內容的搜尋。 在下列範例中,有 1,629,904 (146.46 GB) 完整編製索引的專案,以及 10,025 (10.27 GB) 部分編製索引的專案。

顯示部分索引專案的搜尋統計數據範例。

您可以使用下列計算來判斷部分編製索引專案的百分比。

若要計算組織中部分編製索引專案的比例:

(Total number of partially indexed items/Total number of items) x 100

(10025/1629904) x 100 = 0.62%

藉由使用上一個範例的搜尋結果,0.62% 的所有信箱項目都會部分編製索引。

若要計算組織中部分編製索引專案的大小百分比:

(Size of all partially indexed items/Size of all items) x 100

(10.27 GB/146.46 GB) x 100 = 7.0%

因此在上一個範例中,信箱專案總大小的 7% 來自部分編製索引的專案。 如先前所述,大部分的組織客戶依數量少於 1% 的內容,並以部分編製索引的大小小於 12% 的內容。

使用部分編製索引的專案

如果您需要檢查部分編製索引的專案,以驗證它們未包含相關信息,您可以匯出包含部分索引專案相關信息 的內容搜尋報 表。 當您匯出內容搜尋報表時,請務必選擇其中一個匯出選項,其中包含部分編製索引的專案。

選擇第二個或第三個選項來導出部分編製索引的專案。

當您使用其中一個選項匯出電子檔探索搜尋結果或搜尋報表時,匯出會包含名為 Unindexed Items.csv 的報表。 此報表包含與 ResultsLog.csv 檔案相同的大部分資訊;不過,Unindexed Items.csv 檔案也包含與部分編製索引的專案相關的兩個字段: 錯誤標籤錯誤屬性。 這些欄位包含每個部分編製索引專案之編製索引錯誤的相關信息。 使用這兩個字段中的資訊可協助您判斷特定的編製索引錯誤是否會影響您的調查。

注意事項

Unindexed Items.csv 檔案也包含名為 錯誤類型錯誤訊息的字段。 這些是舊版欄位,其中包含的資訊類似於 [錯誤卷標 ] 和 [ 錯誤屬性 ] 欄位中的資訊,但資訊較不詳細。 您可以放心地忽略這些舊版欄位。

錯誤標籤是由兩項資訊所組成:錯誤和檔案類型。 例如,在此錯誤/檔案類型配對中:

 parseroutputsize_xls

parseroutputsize 是錯誤,而 xls 是發生錯誤之檔案的檔類型。 如果無法辨識檔類型或檔案類型未套用至錯誤,您會看到值 noformat 取代檔類型。

以下是編製索引錯誤的清單,以及錯誤可能原因的描述。

錯誤標籤 描述
attachmentcount
電子郵件訊息有太多附件,而且其中有些附件未處理。
attachmentdepth
內容擷取器和檔剖析器發現在其他附件內巢狀的附件層級太多。 其中有些附件未處理。
attachmentrms
附件譯碼失敗,因為它受到 RMS 保護。
attachmentsize
附加至電子郵件訊息的檔案太大,無法處理。
indexingtruncated
將已處理的電子郵件訊息寫入索引時,其中一個可編製索引的屬性太大且已截斷。 截斷的屬性會列在 [錯誤屬性] 欄位中。
invalidunicode
電子郵件訊息包含無法處理為有效 Unicode 的文字。 此專案的索引編製可能不完整。
parserencrypted
附件或電子郵件訊息的內容已加密,且 Microsoft 365 無法譯碼內容。
parsererror
剖析期間發生未知的錯誤。 這通常是因為軟體錯誤或服務損毀所造成。
parserinputsize
附件太大,無法處理剖析器,而且剖析該附件未發生或未完成。
parsermalformed
附件格式不正確,無法由剖析器處理。 這個結果可能是因為舊的檔格式、不相容軟體所建立的檔案,或是偽裝成宣告以外的病毒。
parseroutputsize
剖析附件的輸出太大,必須截斷。
parserunknowntype
附件有 Microsoft 365 無法偵測到的文件類型。
parserunsupportedtype
附件的檔類型 Office 365 可以偵測,但不支援剖析該文件類型。
propertytoobig
Exchange 市集中的電子郵件屬性值太大而無法擷取,且無法處理訊息。 這通常只會發生在電子郵件訊息的body屬性。
retrieverrms
內容擷取器無法譯碼受 RMS 保護的訊息。
wordbreakertruncated
在編製索引期間,文件中識別了太多字組。 當達到限制時,屬性的處理已停止,而且屬性會被截斷。

錯誤欄位描述哪些欄位會受到 [錯誤卷標] 欄位中所列的處理錯誤影響。 如果您要搜尋 或 之類的subjectparticipants屬性,訊息本文中的錯誤將不會影響搜尋的結果。 當您確切判斷您可能需要進一步調查哪些部分編製索引的專案時,這會很有用。