クロール ルールを管理する (FAST Search Lotus Notes Connector)
適用先: FAST Search Server 2010
トピックの最終更新日: 2015-03-09
FAST Search Lotus Notes コネクタには、クロールする Domino コンテンツを指定する方法がいくつか用意されています。
使用可能なフィルター メカニズム
クロールするデータベースを指定するためのフィルターを追加するには、次の方法を実行できます。
クロールする 1 つ以上のデータベースを明示的に指定する
検索の対象とするデータベースを 1 つ以上の正規表現で指定する
検索から除外するデータベースを 1 つ以上の正規表現で指定する
クロールする Lotus Notes ドキュメントを選択するためのフィルターを追加するには、次の方法を実行できます。
データベース内でクロールの対象とする Lotus Notes ドキュメントを選択するための検索式を提供するデータベース ビューを指定する
データベース内でクロールの対象とする Lotus Notes ドキュメントを選択するための検索式を指定する
クロールする添付ファイルを選択するためのフィルターを追加するには、次の方法を実行できます。
クロールする添付ファイル名拡張子の一覧を指定する (ppt、doc、xls、pdf など)
クロールしない添付ファイル名拡張子の一覧を指定する (exe、jpg、zip など)
クロールする添付ファイルの最大サイズを指定する
FAST Search Lotus Notes コンテンツ コネクタ 構成ファイルの Filters パラメーター グループは、フィルターを指定するために使用します。次の表に、構成ファイルで使用できるパラメーターの一覧と各パラメーターの使用方法を示します。詳細な説明とサンプル値については、テクニカル リファレンスを参照してください。
フィルターのカテゴリ | パラメーター | 簡単な説明 |
---|---|---|
データベース |
DataBase |
クロールの対象とするデータベースのセミコロンで区切られた一覧。これらのパスは、Domino サーバーでのデータベースのパス (およびファイル名) に正確に一致する必要があります。 このパラメーターにはビューを含めることができます。ビューを含める場合は、データベース パスの最後に # 記号を付け、その後にビューを追加します。 ビューを指定すると、そのビューの検索式のみが使用されます。ビューを指定しないと、既定のデータベース ビューが使用されます。既定のビューがない場合は、すべての Lotus Notes ドキュメントがクロールされます。 |
データベース |
IncludeDatabases |
データベース名/パスを示す 1 つ以上の包含フィルターまたは正規表現のセミコロンで区切られた一覧。 DataBase パラメーターが空の場合に、ExcludeDatabases フィルターと組み合わせて使用します。 |
データベース |
ExcludeDatabases |
データベース名/パスを示す 1 つ以上の除外フィルターまたは正規表現のセミコロンで区切られた一覧。 DataBase パラメーターが空の場合に、IncludeDatabases フィルターと組み合わせて使用します。 このパラメーターは、包含フィルターに優先します。対象とするコンテンツを絞り込むために使用してください。 |
Lotus Notes ドキュメント |
ViewName |
クロールするすべてのデータベースに使用するビューの名前。ビューがデータベース内に見つからない場合は、すべてのドキュメントがクロールされます。 データベースによって異なるビューを使用するには、DataBase パラメーターを使用し、インデックスを作成するすべてのデータベースと各データベースのビュー名の一覧を指定します。 |
Lotus Notes ドキュメント |
SearchQuery |
ViewName パラメーターに指定したビューおよび既定のビューを持たないすべてのデータベースに使用する、Notes クエリ言語で記述した検索式。 |
添付ファイル |
IncludeAttachmentExtensions |
クロールする添付ファイルのファイル名拡張子のセミコロンで区切られた一覧。 |
添付ファイル |
ExcludeAttachmentExtensions |
クロールしない添付ファイルのファイル名拡張子のセミコロンで区切られた一覧。IncludeAttachmentExtensions パラメーターを設定した場合、このパラメーターは無視されます。 |
添付ファイル |
MaxAttachmentSize |
添付ファイルの最大サイズ (KB)。このサイズを超える添付ファイルはクロールされません。このパラメーターは、パフォーマンスを向上したり、大きすぎるドキュメントがコネクタから検索エンジンに送信されるのを回避したりするために使用します。 |
フィルターを変更するときの注意事項
最初のクロールが実行された後でフィルターを変更するときは注意が必要です。コネクタが増分クロールを実行すると、前回のクロール実行の後で変更されたデータベースと Lotus Notes ドキュメントしか取得されないからです。
警告
コンテンツ コネクタがクロールするアイテムの数を増やすことはできますが、クロールするアイテムの数を減らすことはできません。
シナリオ 1 は、最初のクロール実行後にフィルターを変更してクロール対象のアイテムの数を減らそうとすると、正しく動作しないことを示します。シナリオ 2 は、フィルターを変更してクロール対象のアイテムの数を増やした場合に正しく動作しないことことを示します。
シナリオ 1
DataBase パラメーターに Database1.nsf、Database2.nsf、および Database3.nsf の 3 つのクロール対象データベースを指定してコネクタを実行します。各データベースには 1000 個の Lotus Notes ドキュメントがあるため、合計で 3000 個のアイテムがクロールされます。
ここで、コネクタが増分クロールを実行する前に、DataBase パラメーターから Database3.nsf を削除します。コネクタはパラメーターの変更を検出しません。また、変更前のパラメーターの値も検出しません。コネクタは、Database1.nsf および Database2.nsf を増分クロールし、これらのデータベース内での変更を検出します。Database3.nsf から抽出された 1000 個のアイテムは、更新されないまま検索エンジンに残されます。Database3.nsf を構成に再度追加しない限り、このデータベース内の Lotus Notes ドキュメントは抽出時の状態で検索エンジンに永久に留まります。この状態はデータベース全体を Domino サーバーから削除した後も是正されないため、誤った検索結果をもたらします。
この動作は、構成ファイルのすべての Filter グループ パラメーターに当てはまります。
以前にクロールしたコンテンツをコネクタが今後クロールしないように再設定するには、次の手順を実行します。
必要な変更を FAST Search Lotus Notes コンテンツ コネクタ 構成ファイルに加えた後で、構成パラメーター StateTracker/PurgeAtStart を true に設定します。
構成パラメーター FASTSearchSubmit/Collection に指定されているフィード先のコンテンツ コレクションの内容を消去します。
警告
これで、コンテンツ コレクション内のすべてのアイテムが削除されます。共有 SharePoint インデキシング コネクタ、FAST Search Web クローラー、FAST Search データベース コネクタなどの他のソースから抽出されたアイテムがあった場合は、それらも削除されます。
[スタート] メニューの [すべてのプログラム] をクリックします。
[Microsoft FAST Search Server 2010 for SharePoint] をクリックします。
[Microsoft FAST Search Server 2010 for SharePoint shell] をクリックします。
Microsoft FAST Search Server 2010 for SharePoint shell コマンド プロンプトで、次のコマンドを入力します。
Clear-FASTSearchContentCollection -Name <コレクション名>
ここで、
<コレクション名> は、消去しようとしているコンテンツ コレクションです。
処理が完了するまで待ってください。しばらくかかることがあります。
FAST Search Lotus Notes コンテンツ コネクタ を実行して、新しい構成に一致するすべてのドキュメントを再フィードします。StateTracker/PurgeAtStart を true に設定したので、コネクタは増分クロールを実行しないで、クロールの状態を破棄し、完全クロールを実行します。クロール対象のコンテンツの量によっては、クロール完了までに時間がかかります。
完全クロールが完了したら、増分クロールを有効にするためにパラメーター StateTracker/PurgeAtStart を false に設定します。
重要
コンテンツ コレクションを消去した後で、すべての関連コンテンツが検索エンジンから削除されます。このコンテンツは、FAST Search Lotus Notes コンテンツ コネクタ が再実行されるまで検索可能になりません。
すべてのコンテンツを検索エンジンから削除する操作による影響を軽減するには、コネクタ構成を複数に分割して、各コネクタ構成で別のコンテンツ コレクションを使用するようにします。これにより、検索エンジンから (一時的に) 削除されるコンテンツの量が減ります。構成を分割するときは、次のガイドラインに従います。
削除する予定がない Lotus Notes データベースがあれば、そのデータベースをクロールするために別の構成を使用します (この構成には、この記事で説明した手順を実行する必要はありません)。
他の Lotus Notes データベースよりも重要性が高く、常に検索可能にしておく必要があるデータベースがあれば、このデータベースのクロールに別の構成を使用し、コンテンツの量を少なくすることでコンテンツが検索できなくなる時間を最小限にします。たとえば、メールボックスが 1000 個含まれるデータベースがあり、このコンテンツを検索可能にすることが重要である場合は、10 個の異なる構成を作成して、各構成で 100 個のメールボックスをクロールすることを検討してください。このような方法を使用すると、1 人が退職したときでも、構成の変更に影響されるのは 100 人のユーザーに限定され、これらのユーザーが検索できなくなる時間も短くなります。
FAST Search Lotus Notes コネクタのクロール実行には 1 つの構成で十分であると結論した場合でも、Lotus Notes コンテンツ用に独立したコンテンツ コレクションを作成し、その他のコンテンツ (たとえば SharePoint サイト、データベース、Web など) 用に別のコンテンツ コレクションを作成して、上記の手順でこれらのソースからコンテンツが削除されないようにすることを検討してください。
シナリオ 2
DataBase パラメーターに Database1.nsf、Database2.nsf、および Database3.nsf の 3 つのクロール対象データベースを指定してコネクタを実行します。各データベースには 1000 個の Lotus Notes ドキュメントがあるため、合計 3000 個のアイテムがクロールされます。
ここで、コネクタが増分クロールを実行する前に、Database4.nsf を DataBase パラメーターに追加します。コネクタは、パラメーター値の変更を検出しませんが、4 つのデータベースに対してクロールを行い、Database1.nsf、Database2.nsf、および Database3.nsf のコンテンツの変更を検出します。また、Database4.nsf をクロールし、すべてのコンテンツにインデックスを作成します。この操作が行われるのは、コネクタがこのデータベースに関する状態を前回のクロールで得ていないからです。次にコネクタが実行された時点で、すべてのデータベースに増分クロールが行われます。