電子情報開示で部分的にインデックス付けされた項目を調査する

Microsoft Purview コンプライアンス ポータルから実行した電子情報開示検索では、検索を実行すると、推定検索結果に部分的にインデックスが付いた項目が自動的に含まれます。 部分的にインデックス付けされたアイテムは、何らかの理由で検索用に完全にインデックスが作成されなかった、SharePoint および OneDrive for Business サイト上の Exchange メールボックスアイテムとドキュメントです。 ほとんどの電子メール メッセージとサイト ドキュメントは、 電子メール メッセージのインデックス作成の制限内にあるため、正常にインデックスが作成されます。 ただし、一部の項目は、これらのインデックス作成制限を超える可能性があり、部分的にインデックスが作成されます。 電子情報開示検索を実行するときに、アイテムに検索用のインデックスを作成できない理由と、部分的にインデックス付けされたアイテムとして返されるその他の理由を次に示します。

  • メッセージEmail開くことができない添付ファイルがあります。これは、部分的にインデックス付けされた電子メールアイテムの最も一般的な原因です。
  • メール メッセージに添付されているファイルが多すぎます。
  • メール メッセージに添付されたファイルが大きすぎます。
  • この種のファイルのインデックス付けはサポートされているが、特定のファイルでインデックス付けエラーが発生した。

組織によって異なりますが、ほとんどの組織のお客様は、コンテンツのボリューム別の割合が 1% 未満で、部分的にインデックスが作成されたサイズ別のコンテンツの 12% 未満です。 ボリュームとサイズの違いは、ファイルが大きいほど、完全にインデックスを作成できないコンテンツが含まれる可能性が高いためです。

コンテンツ検索の部分的なインデックス項目の詳細については、「コンテンツ検索での 部分的にインデックス付けされた項目の調査」を参照してください。

ヒント

E5 のお客様でない場合は、90 日間の Microsoft Purview ソリューション試用版を使用して、Purview の追加機能が組織のデータ セキュリティとコンプライアンスのニーズの管理にどのように役立つかを確認してください。 Microsoft Purview コンプライアンス ポータルのトライアル ハブで今すぐ開始してください。 サインアップと試用期間の詳細については、こちらをご覧ください。

電子情報開示検索を実行すると、検索された場所の部分的にインデックス付けされたアイテムの合計数とサイズが、検索の詳細な統計情報に表示される検索結果の統計情報に一覧表示されます。 これらは、検索統計で インデックスのない項目 と呼ばれることに注意してください。 検索結果に返される部分的にインデックス付けされた項目の数に影響を与えるいくつかの点を次に示します。

  • 項目が部分的にインデックス付けされ、検索クエリと一致する場合、検索結果項目の数 (およびサイズ) と部分的にインデックス付けされた項目の両方に含まれます。 ただし、同じ検索の結果がエクスポートされると、アイテムは検索結果のセットにのみ含まれます。部分的にインデックスが付いた項目として含まれていません。
  • SharePoint サイトと OneDrive サイトにある部分的なインデックス付きアイテムは、検索の詳細な統計情報に表示される部分的にインデックス付けされたアイテムの見積もりには含 まれません 。 ただし、部分的にインデックスが付いた項目は、電子情報開示検索の結果をエクスポートするときにエクスポートできます。 たとえば、サイトのみを検索する場合、部分的にインデックスが作成されたアイテムの推定数は 0 になります。

organization内の部分的にインデックス付けされた項目の比率を計算する

部分的にインデックス付けされたアイテムに対するorganizationの露出を理解するために、(空白のキーワード (keyword) クエリを使用して) すべてのメールボックス内のすべてのコンテンツを検索できます。 次の例では、1,629,904 (146.46 GB) の完全インデックス付きアイテムと 10,025 (10.27 GB) の部分的なインデックス付き項目があります。

部分的にインデックスが付いた項目を示す検索統計の例。

次の計算を使用して、部分的にインデックス付けされた項目の割合を決定できます。

organization内の部分的にインデックス付けされた項目の比率を計算するには:

(Total number of partially indexed items/Total number of items) x 100

(10025/1629904) x 100 = 0.62%

前の例の検索結果を使用すると、すべてのメールボックス アイテムの 0.62% が部分的にインデックス付けされます。

organization内の部分的にインデックス付けされた項目のサイズの割合を計算するには:

(Size of all partially indexed items/Size of all items) x 100

(10.27 GB/146.46 GB) x 100 = 7.0%

そのため、前の例では、メールボックス アイテムの合計サイズの 7% は、部分的にインデックスが作成されたアイテムからのものになります。 前述のように、ほとんどの組織のお客様は、コンテンツのボリューム別の 1% 未満と、部分的にインデックスが作成されたサイズ別のコンテンツの 12% 未満です。

部分的にインデックスが付いた項目の操作

部分的にインデックスが付いた項目を調べて、関連情報が含まれていないことを検証する必要がある場合は、部分的にインデックス付けされたアイテムに関する情報を含む コンテンツ検索レポートをエクスポート できます。 コンテンツ検索レポートをエクスポートするときは、部分的にインデックスが付いた項目を含むエクスポート オプションのいずれかを選択してください。

部分的にインデックスが付いた項目をエクスポートするには、2 番目または 3 番目のオプションを選択します。

これらのオプションのいずれかを使用して電子情報開示検索結果または検索レポートをエクスポートする場合、エクスポートにはインデックスなし Items.csv という名前のレポートが含まれます。 このレポートには、ResultsLog.csv ファイルと同じ情報のほとんどが含まれています。ただし、インデックスが付いていない Items.csv ファイルには、部分的にインデックス付けされた項目に関連する 2 つのフィールド ( エラー タグエラー プロパティ) も含まれています。 これらのフィールドには、部分的にインデックスが作成された各アイテムのインデックス作成エラーに関する情報が含まれています。 これら 2 つのフィールドの情報を使用すると、特定のインデックス作成エラーが調査に影響するかどうかを判断するのに役立ちます。

注:

インデックスのない Items.csv ファイルには、 エラーの種類エラー メッセージという名前のフィールドも含まれています。 これらは、[ エラー タグ ] フィールドと [ エラー プロパティ ] フィールドの情報に似た情報を含むレガシ フィールドですが、詳細情報は少なくなります。 これらのレガシ フィールドは無視しても問題ありません。

エラー タグは、エラーとファイルの種類という 2 つの情報で構成されます。 たとえば、このエラーとファイルの種類のペアでは、次のようになります。

 parseroutputsize_xls

parseroutputsize はエラーであり、 xls エラーが発生したファイルのファイルの種類です。 ファイルの種類が認識されなかった場合、またはファイルの種類がエラーに適用されなかった場合は、ファイルの種類の代わりに値 noformat が表示されます。

インデックス作成エラーの一覧と、エラーの考えられる原因の説明を次に示します。

エラー タグ 説明
attachmentcount
電子メール メッセージに添付ファイルが多すぎて、これらの添付ファイルの一部が処理されませんでした。
attachmentdepth
コンテンツリトリーバーとドキュメント パーサーで、他の添付ファイル内に入れ子になっている添付ファイルのレベルが多すぎます。 これらの添付ファイルの一部が処理されませんでした。
attachmentrms
添付ファイルは RMS で保護されているため、デコードに失敗しました。
attachmentsize
メール メッセージに添付されたファイルが大きすぎて処理できませんでした。
indexingtruncated
処理された電子メール メッセージをインデックスに書き込むと、インデックス可能なプロパティの 1 つが大きすぎて切り捨てられました。 切り捨てられたプロパティは、[エラー プロパティ] フィールドに一覧表示されます。
invalidunicode
電子メール メッセージには、有効な Unicode として処理できなかったテキストが含まれていました。 この項目のインデックス作成が不完全な場合があります。
parserencrypted
添付ファイルまたは電子メール メッセージの内容は暗号化され、Microsoft 365 はコンテンツをデコードできませんでした。
parsererror
解析中に不明なエラーが発生しました。 これは通常、ソフトウェアのバグまたはサービスのクラッシュの結果です。
parserinputsize
パーサーが処理するには添付ファイルが大きすぎて、その添付ファイルの解析が行われなかったか、完了しませんでした。
parsermalformed
添付ファイルの形式が正しくないため、パーサーによって処理できませんでした。 この結果は、古いファイル形式、互換性のないソフトウェアによって作成されたファイル、または要求された以外の何かを装ったウイルスが原因である可能性があります。
parseroutputsize
添付ファイルの解析からの出力が大きすぎて、切り捨てる必要がありました。
parserunknowntype
添付ファイルには、Microsoft 365 で検出できなかったファイルの種類がありました。
parserunsupportedtype
添付ファイルには、検出Office 365ファイルの種類がありましたが、そのファイルの種類の解析はサポートされていません。
propertytoobig
Exchange ストアの電子メール プロパティの値が大きすぎて取得できず、メッセージを処理できませんでした。 これは通常、電子メール メッセージの body プロパティにのみ発生します。
retrieverrms
コンテンツレトリバーが RMS で保護されたメッセージをデコードできませんでした。
wordbreakertruncated
インデックス作成中にドキュメントで識別された単語が多すぎます。 制限に達するとプロパティの処理が停止し、プロパティが切り捨てられます。

エラー フィールドは、[エラー タグ] フィールドに一覧表示されている処理エラーの影響を受けるフィールドを示します。 や participantsなどのsubjectプロパティを検索する場合、メッセージ本文のエラーは検索結果に影響しません。 これは、さらに調査する必要がある部分的にインデックス付けされた項目を正確に判断する場合に役立ちます。