電子情報開示の部分的にインデックス付きアイテム

コンプライアンス センターから実行する電子情報開示検索Microsoft 365、検索を実行すると、推定検索結果に部分的にインデックス付きアイテムが自動的に含まれます。 部分的にインデックス付けされたExchangeは、SharePoint サイトおよび OneDrive for Business サイト上のメールボックス アイテムとドキュメントに基OneDrive for Business で、何らかの理由で検索用に完全にインデックスが作成されたのではなかっています。 このExchange、部分的にインデックスが作成されたアイテムには、通常、電子メール メッセージに添付されたファイル (インデックスを作成できないファイルの種類) が含まれる場合があります。 電子情報開示検索を実行すると、アイテムを検索用にインデックス化できない理由と、部分的にインデックス付きアイテムとして返されるその他の理由を次に示します。

  • ファイルの種類が認識できないか、インデックス作成でサポートされていない。

  • メッセージには、イメージ ファイルなどの有効なハンドラーのない添付ファイルがあります。これは、部分的にインデックスが作成された電子メール アイテムの最も一般的な原因です。

  • この種のファイルのインデックス付けはサポートされているが、特定のファイルでインデックス付けエラーが発生した。

  • 電子メール メッセージに添付されているファイルが多すぎます。

  • 電子メール メッセージに添付されているファイルが大きすぎます。

  • ファイルが Microsoft 以外のテクノロジで暗号化されている。

  • ファイルがパスワードで保護されている。

注意

ほとんどの組織では、コンテンツのボリュームが 1% 未満、部分的にインデックスが作成されるサイズが 12% 未満です。 ボリュームとサイズの違いは、ファイルが大きいほど、完全にインデックスを作成できないコンテンツを含む確率が高いからです。

法的調査のために、組織は部分的にインデックス付きアイテムを確認する必要があります。 また、検索結果をローカル コンピューターにエクスポートする場合や、検索結果をローカル コンピューターで分析用に準備するときに、部分的にインデックス付きアイテムを含めるAdvanced eDiscovery。 詳細については、「電子情報開示 で部分的にインデックス付きアイテムを調査する」を参照してください

ビットマップ ファイルや MP3 ファイルなど特定の種類のファイルには、インデックス付けが可能なコンテンツが含まれていません。 その結果、これらの種類のファイルに対してExchangeおよびSharePoint検索インデックス サーバーはフルテキスト インデックス作成を実行しません。 これらの種類のファイルは、サポートされていないファイルの種類と見なされます。 既定でまたは管理者によって、フルテキスト インデックス付けが無効になっている種類のファイルもあります。 サポートされていないファイルの種類と無効になっているファイルの種類は、コンテンツ検索でインデックスのないアイテムとしてラベル付けされます。 前に述べたように、部分的にインデックスが作成されたアイテムは、検索を実行したり、検索結果をローカル コンピューターにエクスポートしたり、Advanced eDiscovery の検索結果を準備したりするときに、一連の検索結果に含めることができます。

サポートされているファイル形式と無効になっているファイル形式の一覧については、次のトピックを参照してください。

部分的にインデックス付きファイルの種類を持つメッセージとドキュメントを検索結果に返す

部分的にインデックスが作成されたファイル添付ファイルを含むすべての電子メール メッセージ、または部分的にインデックスが付SharePointドキュメントが、部分的にインデックス付きアイテムとして自動的に返されるとは限ります。 これは、電子メール メッセージの Subject プロパティや、ドキュメントの Title プロパティや Author プロパティなど、他のメッセージまたはドキュメントのプロパティがインデックス付けされ、検索可能になるためです。 たとえば、"financial" のキーワード検索では、電子メール メッセージの件名またはドキュメントのファイル名またはタイトルにキーワードが表示された場合、部分的にインデックス付きファイル添付ファイルを含むアイテムが返されます。 ただし、キーワードがファイルの本文にのみ表示される場合、メッセージまたはドキュメントは部分的にインデックス付きアイテムとして返されます。

同様に、部分的にインデックス付けされたファイル添付ファイルを含むメッセージと、部分的にインデックス付けされたファイルの種類のドキュメントは、インデックス付けおよび検索可能な他のメッセージまたはドキュメントのプロパティが検索条件と一致する場合に検索結果に含まれます。 検索用のインデックスが付けられたメッセージ プロパティには、送信日と受信日、送信者と受信者、添付ファイルの名前、およびメッセージ本文のテキストが含まれます。 検索用にインデックスが作成されたドキュメント プロパティには、作成日と変更日が含まれます。 したがって、メッセージ添付ファイルが部分的にインデックス付きアイテムである場合でも、他のメッセージまたはドキュメント のプロパティの値が検索条件と一致する場合、メッセージは通常の検索結果に含まれます。

セキュリティ & コンプライアンス センターの検索機能を使用して検索できる電子メールおよびドキュメントのプロパティの一覧については、「電子情報開示のキーワード クエリと検索条件」を 参照してください

検索結果に含まれる部分的にインデックス付きアイテム

組織では、部分的にインデックスが作成されたアイテムの特定と追加の分析を実行して、そのアイテムの種類、含まれるアイテム、および特定の調査に関連するかどうかを判断する必要があります。 前に説明したように、検索されるコンテンツの場所の部分的にインデックス付けされたアイテムは、推定検索結果に自動的に含まれます。 検索結果をエクスポートしたり、検索結果を作成したりするときに、これらの部分的にインデックス付きアイテムを含Advanced eDiscovery。

部分的にインデックスが作成されたアイテムについては、次の点に注意してください。

  • 電子情報開示検索を実行すると、部分的にインデックスが作成された Exchange アイテム (検索クエリによって返される) の総数とサイズが、フライアウト ページの検索統計に表示され、インデックスのないアイテムとしてラベル付けされます。 フライアウト ページに表示される部分的にインデックス付きアイテムに関する統計情報には、サイトまたはアカウントに部分的にインデックスSharePointはOneDriveされません。

  • 結果をエクスポートする検索が、特定のコンテンツの場所または組織内のすべてのコンテンツの場所を検索した場合、検索条件に一致するアイテムを含むコンテンツの場所からインデックスが作成されていないアイテムだけがエクスポートされます。 In other words, if no search results are found in a mailbox or site, then any unindexed items in that mailbox or site won't be exported. その理由は、組織内の多数の場所から部分的にインデックス付きアイテムをエクスポートすると、エクスポート エラーの可能性が高く、検索結果のエクスポートとダウンロードにかかる時間が長くなる可能性があるからです。

    部分的にインデックス付きアイテムをすべてのコンテンツの場所から検索用にエクスポートするには、すべてのアイテムを返す (検索クエリからキーワードを削除して) 検索を構成し、検索結果をエクスポートするときに部分的にインデックス付きアイテムのみをエクスポートします ([出力オプション] の下の [認識できない形式のアイテムのみ] をクリックするか、他の理由でインデックスが作成されていないアイテムのみをクリックします)。

  • すべてのメールボックス アイテムを検索結果に含める場合、または検索クエリでキーワードを指定しない場合、または日付範囲のみを指定した場合は、部分的にインデックス付けされたアイテムが部分的にインデックス付けされたアイテムを含む PST ファイルにコピーされない可能性があります。 これは、部分的にインデックスが作成されたアイテムを含むすべてのアイテムが、自動的に通常の検索結果に含まれるためです。

  • 部分的にインデックスが作成されたアイテムはプレビューできません。 検索結果をエクスポートして、検索によって返される部分的にインデックス付きアイテムを表示する必要があります。

    さらに、検索結果をエクスポートし、部分的にインデックス付きアイテムをエクスポートに含める場合、SharePoint アイテムから部分的にインデックス付きアイテムが Uncrawlable という名前のフォルダーにエクスポートされます。 部分的にインデックスが作成された Exchange アイテムをエクスポートする場合、部分的にインデックスが作成されたアイテムが検索クエリと一致するかどうか、およびエクスポート設定の構成に応じて、エクスポート方法が異なります。

  • 次の表は、インデックス付きアイテムと部分的にインデックス付きアイテムのエクスポート動作と、それぞれが異なるエクスポート構成設定に含まれているかどうかを示しています。

    構成のエクスポート 検索クエリに一致するインデックス付きアイテム 検索クエリに一致する部分的にインデックス付きアイテム 検索クエリと一致しない部分的にインデックス付きアイテム
    インデックス付きのアイテムのみをエクスポートする
    Exported
    エクスポート (エクスポートされるインデックス付きアイテムに含まれる)
    エクスポートされない
    部分的にインデックス付きアイテムのみをエクスポートする
    エクスポートされない
    エクスポート (部分的にインデックス付きアイテムとして)
    エクスポート (部分的にインデックス付きアイテムとして)
    インデックス付きアイテムと部分的にインデックス付きアイテムをエクスポートする
    Exported
    エクスポート (エクスポートされるインデックス付きアイテムに含まれる)
    エクスポート (部分的にインデックス付きアイテムとして)

メッセージのインデックスの制限

次の表では、電子情報開示検索で電子情報開示検索で電子メール メッセージが部分的にインデックス付きアイテムとして返される可能性があるインデックスの制限をMicrosoft 365。

ドキュメントのインデックス作成制限の一覧については、「SharePointの検索制限」をSharePointしてください

インデックス作成の制限 メモ 説明
添付ファイルの最大サイズ (Excelを除く)
150 MB
インデックス作成用に解析する電子メール添付ファイルの最大サイズ。 この制限を超える添付ファイルはインデックス作成用に解析されません。添付ファイルを含むメッセージは部分的にインデックス付きとしてマークされます。

注: 解析とは、インデックス サービスが添付ファイルからテキストを抽出し、句読点やスペースなどの不要な文字を削除し、テキストを単語 (トークン化と呼ばれるプロセスで) に分割してインデックスに格納するプロセスです。
ファイルの最大Excelサイズ
4 MB
サイト上にExcelまたはインデックス作成用に解析される電子メール メッセージに添付されたファイルの最大サイズ。 このExcelを超えるファイルは解析されません。ファイルまたは添付ファイルを含むメッセージの電子メールはインデックスなしとしてマークされます。
添付ファイルの最大数
250
インデックス作成のために解析される電子メール メッセージに添付されるファイルの最大数。 メッセージに 250 を超える添付ファイルがある場合、最初の 250 の添付ファイルは解析およびインデックス付けされ、そのメッセージは、解析されなかった追加の添付ファイルがあったため、部分的にインデックスが付いているとマークされます。
添付ファイルの最大深度
30
解析される入れ子になった添付ファイルの最大数。 たとえば、電子メール メッセージに別のメッセージが添付され、添付されたメッセージに Word ドキュメントが添付されている場合、Word ドキュメントと添付されたメッセージにインデックスが作成されます。 この動作は、最大 30 の入れ子になった添付ファイルに対して続行されます。
添付画像の最大数
0
電子メール メッセージに添付されているイメージはパーサーによってスキップされ、インデックスが作成されません。
アイテムの解析に費やされた最大時間
30 秒
インデックス作成のためにアイテムの解析に最大 30 秒の時間が費やされます。 解析時間が 30 秒を超えると、アイテムは部分的にインデックス付きとしてマークされます。
パーサーの最大出力
200 万文字
インデックスが作成されたパーサーからのテキスト出力の最大量。 たとえば、パーサーがドキュメントから 800 万文字を抽出した場合、最初の 200 万文字だけがインデックス付けされます。
最大注釈トークン
200 万
電子メール メッセージのインデックスが作成される場合、各単語には、その単語のインデックスを作成する方法を指定する異なる処理命令が注釈付けされます。 処理命令の各セットは、注釈トークンと呼ばれる。 サービスの品質を維持するために、Office 365メッセージの注釈トークンは 200 万個に制限されています。
インデックス内の最大本文サイズ
6,700 万文字
電子メール メッセージの本文内の文字の総数とそのすべての添付ファイル。 電子メール メッセージがインデックス付けされている場合、メッセージの本文とすべての添付ファイル内のすべてのテキストが 1 つの文字列に連結されます。 インデックス付けされたこの文字列の最大サイズは 6,700 万文字です。
本文の最大一意のトークン
100 万
前に説明したように、トークンはコンテンツからテキストを抽出し、句読点とスペースを削除し、インデックスに格納されている単語 (トークンと呼ばれる) に分割した結果です。 たとえば、この語句には "cat, mouse, bird, dog, dog" 5 つのトークンが含まれます。 ただし、これらの 4 つだけが一意のトークンです。 電子メール メッセージごとに 100 万個の一意のトークンの制限があります。ランダム トークンでインデックスが大きすぎるのを防ぐのに役立ちます。

部分的にインデックスが作成されたアイテムの詳細

  • 前に述べたように、メッセージとドキュメントのプロパティとそのメタデータはインデックス付けされますので、キーワードがインデックス付きメタデータに表示された場合、キーワード検索によって結果が返される場合があります。 ただし、サポートされていないファイルの種類を持つアイテムのコンテンツにのみキーワードが表示される場合、同じキーワード検索で同じアイテムが返されない場合があります。 この場合、アイテムは部分的にインデックス付きアイテムとして返されます。

  • 部分的にインデックス付きアイテムが検索結果に含まれている場合、検索クエリの条件と一致したため、推定検索統計には部分的にインデックス付きアイテムとして含まれません。 また、検索結果をエクスポートしても、部分的にインデックス付きアイテムには含まれません。

  • ファイルの種類はインデックス作成でサポートされ、インデックスが作成されます。インデックス付けまたは検索エラーが発生して、部分的にインデックス付きアイテムとしてファイルが返される可能性があります。 たとえば、非常に大きな Excel ファイルの検索は部分的に成功する可能性があります (最初の 4 MB はインデックスが作成されたため)、ファイル サイズの制限を超えたため失敗します。 この場合、検索結果と部分的にインデックス付きアイテムとして同じファイルが返される可能性があります。

  • Microsoft暗号化テクノロジで暗号化され、検索の条件に一致する電子メール メッセージに添付されているファイルはプレビューされ、エクスポート時に復号化されます。 この時点で、Microsoft 暗号化テクノロジで暗号化されたファイル (および SharePoint または OneDrive for Business) は部分的にインデックス付けされます。

  • S/MIME で暗号化された電子メール メッセージは、部分的にインデックスが作成されます。 これには、添付ファイルの有無に関係なく、暗号化されたメッセージが含まれます。

  • Azure Rights Management を使用して保護された電子メール メッセージはインデックス付けされ、検索クエリと一致する場合は検索結果に含まれます。 権限で保護された電子メール メッセージは復号化され、プレビューおよびエクスポートできます。 この機能では、既定で eDiscover Manager 役割グループに割り当てられている RMS Decrypt 役割が割り当てられている必要があります。

  • 電子情報開示ケースに関連付けられたクエリ ベースの保留リストを作成すると、部分的にインデックスが作成されたアイテムはすべて保留にされます。 これには、保留リストの検索クエリ条件と一致しない部分的にインデックス付きアイテムが含まれます。 クエリ ベースの電子情報開示ホールドの作成の詳細については、「電子情報開示ホールドの作成 」を参照してください

関連項目

電子情報開示で部分的にインデックス付きアイテムを調査する