推定された電子情報開示検索結果と実際の電子情報開示検索結果の違い

この記事は、次のいずれかのMicrosoft Purview eDiscovery ツールを使用して実行できる検索に適用されます。

  • コンテンツ検索
  • 電子情報開示 (標準)

電子情報開示検索を実行すると、使用しているツールは、検索条件に一致するアイテムの数 (およびその合計サイズ) の見積もりを返します。 たとえば、Microsoft Purview コンプライアンス ポータルで検索を実行すると、選択した検索のポップアップ ページに推定検索結果が表示されます。

検索ポップアップ ページに表示される結果の見積もり。

これは、結果をローカル コンピューターにエクスポートするときに電子情報開示エクスポート ツールに表示されるアイテムの合計サイズと数の見積もりと同じであり、検索結果と共にダウンロードされたエクスポートの概要レポートに表示されます。

電子情報開示エクスポート ツールの推定結果

電子情報開示エクスポート ツールの推定結果。

エクスポートの概要レポートの推定結果

推定検索結果は、[エクスポートの概要] レポートに含まれます。

ただし、エクスポートの概要レポートの前のスクリーンショットでわかるように、ダウンロードされる実際の検索結果のサイズと数は、推定検索結果のサイズと数とは異なります。

推定検索結果とダウンロードされた検索結果の違い。

これらの違いの理由を次に示します。

  • 結果の推定方法。 検索結果の見積もりは、検索クエリの条件を満たす項目の見積もり (実際のカウントではなく) だけです。 Exchange アイテムの見積もりをコンパイルするために、検索条件を満たすメッセージ ID の一覧が、使用している電子情報開示ツールによって Exchange データベースから要求されます。 ただし、検索結果をエクスポートすると、検索が再実行され、実際のメッセージが Exchange データベースから取得されます。 そのため、これらの違いは、推定項目数と実際の項目数の決定方法が原因で発生する可能性があります。

  • 検索結果を見積もってエクスポートする時間の間に発生する変更。 検索結果をエクスポートすると、検索が再開され、検索条件を満たす検索インデックス内の最新の項目が収集されます。 推定検索結果が収集されてから検索結果がエクスポートされた時点までの間に、検索条件を満たす追加のアイテムが作成、送信、または受信された可能性があります。 また、検索結果がエクスポートされる前にコンテンツの場所から削除されたため、検索結果の推定時に検索インデックスに含まれたアイテムが存在しなくなった可能性もあります。 この問題を軽減する方法の 1 つは、電子情報開示検索の日付範囲を指定することです。 もう 1 つの方法は、アイテムが保持され、消去できないようにコンテンツの場所を保留にすることです。

    その他の問題として、推定検索結果とエクスポートされた検索結果の違いがあります。

    • 日付クエリを使用する場合の項目の増加。 これは通常、次の 2 つのことが原因です。
      • SharePoint でバージョン管理を保持します。 保持され、かつドキュメントのバージョン管理が有効にされたサイトからドキュメントが削除された場合、その削除されたドキュメントのすべてのバージョンが保持されます。
      • 予定表アイテム。 メッセージの受け入れと拒否、定期的な会議は、古い日付でバックグラウンドで自動的に新しいアイテムを作成し続けます。
    • 保留を使用すると、同じアイテムがユーザーのプライマリ メールボックスとアーカイブ メールボックスに保持される場合があります。 これは、ユーザーがアイテムをアーカイブに手動で移動したときに発生する可能性があります。
    • まれですが、保留が適用されている場合でも、組み込みの予定表アイテム (ユーザーは編集できませんが、多くの検索結果に含まれる) のメンテナンスは、随時削除される可能性があります。 予定表アイテムを定期的に削除すると、エクスポートされるアイテムが少なくなります。
  • インデックスのない項目。 検索のインデックスが付いていない項目は、推定検索結果と実際の検索結果の違いを引き起こす可能性があります。 検索結果をエクスポートするときに、インデックスのない項目を含めることができます。 検索結果をエクスポートするときにインデックスのない項目を含めると、エクスポートされる項目が増える可能性があります。 これにより、推定検索結果とエクスポートされた検索結果が異なります。

    コンテンツ検索ツールを使用する場合は、検索結果をエクスポートするときにインデックスのない項目を含めることができます。 検索によって返されるインデックスのないアイテムの数は、ポップアップ ページに他の推定検索結果と共に一覧表示されます。 インデックスのない項目は、推定検索結果の合計サイズにも含まれます。 検索結果をエクスポートする場合は、インデックスのない項目を含めるか含めないようにするかを選択できます。 これらのオプションを構成する方法により、推定結果とダウンロードされた実際の検索結果が異なる場合があります。

  • すべてのコンテンツの場所を含むコンテンツ検索の結果をエクスポートします。 結果をエクスポートする検索が、organization内のすべてのコンテンツの場所の検索であった場合、検索条件に一致するアイテムを含むコンテンツの場所のインデックスのないアイテムのみがエクスポートされます。 In other words, if no search results are found in a mailbox or site, then any unindexed items in that mailbox or site won't be exported. ただし、すべてのコンテンツの場所 (検索クエリに一致する項目が含まれていないもの) のインデックスのないアイテムは、推定検索結果に含まれます。

    または、特定のコンテンツの場所から結果をエクスポートする検索の場合は、検索で指定されたすべてのコンテンツの場所からインデックスのない項目 (検索条件によって除外されません) がエクスポートされます。 この場合、インデックスのないアイテムの推定数と、エクスポートされるインデックスのないアイテムの数は同じである必要があります。

    organization内のすべての場所からインデックスのないアイテムをエクスポートしない理由は、エクスポート エラーの可能性が高くなり、検索結果のエクスポートとダウンロードにかかる時間が長くなる可能性があるためです。

  • SharePoint と OneDrive のインデックスのないアイテムは、検索の見積もりに含まれません。 SharePoint サイトとOneDrive for Business アカウントのインデックスのないアイテムは、推定検索結果には含まれません。 これは、SharePoint インデックスにインデックスのないアイテムのデータが含まれていないためです。 検索の見積もりには、メールボックスのインデックスのないアイテムのみが含まれます。 ただし、検索結果をエクスポートするときにインデックスのないアイテムを含めると、SharePoint と OneDrive にインデックスのないアイテムが含まれ、実際にエクスポートされるアイテムの数が増えます。 これにより、推定結果 (SharePoint サイトと OneDrive サイトにインデックスのないアイテムが含まれていない) と、ダウンロードされる実際のアイテムが異なります。 インデックスのないアイテムを、検索条件に一致するアイテムを含むコンテンツの場所からのみエクスポートするルールは、この状況でも適用されます。

  • SharePoint と OneDrive のドキュメント バージョン。 SharePoint サイトと OneDrive アカウントを検索する場合、複数のバージョンのドキュメントは推定検索結果の数に含まれません。 ただし、検索結果をエクスポートするときに、すべてのドキュメント バージョンを含めることができます。 検索結果をエクスポートするときにドキュメント バージョンを含めると、エクスポートされたアイテムの実際の数 (および合計サイズ) が増加します。

  • SharePoint フォルダー。 SharePoint 内のフォルダーが検索クエリと一致する場合 (たとえば、日付による検索)、検索見積もりには、最後に変更された日付範囲を持つフォルダーの数が含まれます (ただし、それらのフォルダー内のアイテムは含まれません)。 検索結果をエクスポートすると、フォルダー内の項目はエクスポートされますが、実際のフォルダーはエクスポートされません。 その結果、エクスポートされたアイテムの数が、推定検索結果の数を超えることになります。 フォルダーが空の場合、実際のフォルダーはエクスポートされないため、エクスポートされた実際の検索結果の数は 1 項目だけ減少します。

    注:

    クエリベースの検索を実行する場合は、クエリに次の条件を追加することで SharePoint フォルダーを除外できます。 NOT(ContentType:folder)

  • SharePoint リスト。 SharePoint リストの名前が検索クエリと一致する場合、検索見積もりには、リスト内のすべての項目の数が含まれます。 検索結果をエクスポートすると、リスト (およびリスト アイテム) が 1 つの CSV ファイルとしてエクスポートされます。 これにより、実際にエクスポートされた項目の実際の数が減ります。 一覧に添付ファイルが含まれている場合、添付ファイルは別のドキュメントとしてエクスポートされ、エクスポートされるアイテムの数も増えます。

    注:

    クエリベースの検索を実行する場合は、クエリに 次の条件を追加することで SharePoint リストを除外できます。 NOT(ContentType:list)

  • 未加工のファイル形式とエクスポートされたファイル形式。 Exchange アイテムの場合、検索結果の推定サイズは、未加工の Exchange メッセージ サイズを使用して計算されます。 ただし、電子メール メッセージは PST ファイルまたは個々のメッセージ (EML ファイルとして書式設定) としてエクスポートされます。 どちらのエクスポート オプションでも、未加工の Exchange メッセージとは異なるファイル形式が使用されるため、エクスポートされたファイルの合計サイズが推定ファイル サイズとは異なります。

  • エクスポート中の Exchange アイテムの重複を解除します。 Exchange アイテムの場合、重複を解除すると、エクスポートされるアイテムの数が減ります。 検索結果をエクスポートするときに、検索結果の複製を解除することもできます。 Exchange メッセージの場合は、メッセージが複数のメールボックスに存在する可能性がある場合でも、メッセージの 1 つのインスタンスのみがエクスポートされることを意味します。 推定検索結果には、メッセージのすべてのインスタンスが含まれます。 そのため、検索結果をエクスポートするときに重複除去オプションを選択した場合、エクスポートされるアイテムの実際の数は、推定項目数よりもかなり少なくなる可能性があります。

検索結果レポート (Results.csv ファイル) には、重複するメッセージごとにエントリが含まれており、重複するメッセージがあるソース メールボックスを識別します。 これは、重複するメッセージを含むすべてのメールボックスを識別するのに役立ちます。

注:

検索結果をエクスポートするとき、またはレポートをダウンロードするときに [ 暗号化されたアイテムを含める] または [認識できない形式のアイテムを含める ] オプションを選択しない場合、インデックス エラー レポートはダウンロードされますが、エントリはありません。 これは、インデックス作成エラーがないことを意味するものではありません。 これは、インデックスのない項目がエクスポートに含まれていないことを意味します。