Filtres IFilter et gestionnaires de protocole (Search Server 2008)

Mise à jour : 2009-04-16

NoteRemarque :

Sauf indication contraire, les informations de cet article s'appliquent à Microsoft Search Server 2008 et à Microsoft Search Server 2008 Express.

Dans Search Server 2008, le robot utilise des gestionnaires de protocole pour accéder au contenu, puis des filtres IFilter pour extraire le contenu des fichiers analysés. Les filtres IFilter suppriment la mise en forme spécifique de l’application avant que le moteur indexe le contenu d’un document. Seuls les types de fichiers pour lesquels un gestionnaire de protocole et un IFilter sont installés sont analysés par Serveur de recherche.

Cette section décrit les filtres IFilter et les gestionnaires de protocole inclus par défaut dans une installation Serveur de recherche et explique comment installer et inscrire d’autres filtres IFilter et gestionnaires de protocole.

Le robot utilise les gestionnaires de protocole et les filtres IFilter de la manière suivante :

  1. Le robot récupère les adresses de départ des sources de contenu et il appelle le gestionnaire de protocole en fonction du préfixe de l’URL.

  2. Le gestionnaire de protocole se connecte à la source de contenu et extrait les métadonnées au niveau du système et les informations des listes de contrôle d’accès.

  3. Le gestionnaire de protocole identifie le type de fichier de chaque élément de contenu, en fonction de l’extension du nom de fichier, puis il appelle le filtre IFilter qui est associé à ce type de fichier.

  4. Le filtre IFilter extrait le contenu, en supprimant toute mise en forme incorporée, puis il récupère les métadonnées de l’élément de contenu.

  5. Le contenu est analysé par un ou plusieurs analyseurs lexicaux propres à la langue, puis il est ajouté dans l’index de recherche en texte intégral, également appelé index de contenu. Les métadonnées et les listes de contrôle d’accès sont ajoutées à la base de données de recherche.

Dans cette section :

Voir aussi

Ajouter des sources de contenu (Search Server 2008)