Principes de base de la recherche de texte intégral

Article
12/15/2008

Cette rubrique décrit brièvement les composants, les processus et la terminologie spécifiques à la recherche de texte intégral. De nombreux termes sont communs à la recherche de texte intégral et à Microsoft SQL Server mais un certain nombre de ces termes, par exemple « analyse » et « jeton » sont spécifiques à la recherche de texte intégral.

Terminologie spécifique à la recherche de texte intégral

Voici une liste de termes et de composants avec lesquels vous devez vous familiariser lors de l'utilisation de la recherche de texte intégral.

Index de texte intégral

Il stocke des informations sur les mots significatifs et leur emplacement dans une colonne donnée. Ces informations sont utilisées pour permettre une exécution rapide des requêtes de texte intégral qui recherchent les lignes contenant ces mots ou ces combinaisons de mots. Pour plus d'informations, consultez Index de texte intégral.

Catalogue de texte intégral

Il contient plusieurs index de texte intégral ou n'en contient aucun. Les catalogues de texte intégral doivent résider sur un disque dur local associé à l'instance de SQL Server. Chaque catalogue peut satisfaire les besoins d'indexation associés à une ou plusieurs tables d'une base de données. Les catalogues de texte intégral ne peuvent pas être stockés sur des lecteurs amovibles, des disquettes ou des lecteurs réseau, sauf lorsque vous avez attaché une base de données en lecture seule contenant un catalogue de texte intégral.

Séparateur de mots

Pour une langue donnée, un séparateur de mots crée des jetons de texte en fonction des règles lexicales de cette langue. Pour plus d'informations, consultez Séparateurs de mots et identificateurs de racines.

Jeton

Il s'agit d'un mot ou d'une chaîne de caractères identifiée par un séparateur de mots.

Identificateur de racine

Pour une langue donnée, un identificateur de racine génère les formes flexionnelles d'un mot particulier en fonction des règles de cette langue. Les identificateurs de racines sont spécifiques à la langue. Pour plus d'informations, consultez Séparateurs de mots et identificateurs de racines.

Filtre

En fonction d'un type de fichier spécifique, par exemple .doc, les filtres extraient le texte d'un fichier stocké dans une colonne varbinary(max) ou image. Pour plus d'informations, consultez Filtres de recherche en texte intégral.

Remplissage ou analyse

Il s'agit du processus de création et de conservation d'un index de texte intégral. Pour plus d'informations, consultez Structure de l'index de texte intégral.

Mots non significatifs

Il s'agit de mots qui ne contribuent pas à la recherche en raison du nombre élevé de leurs occurrences. Par exemple, en français, les mots tels que « un », « et », « est » ou « le » sont considérés comme des mots non significatifs. Ces mots sont ignorés afin d'éviter un encombrement de l'index de texte intégral. Pour plus d'informations, consultez Mots non significatifs.

Remarque :
L'indexation de texte intégral est complètement prise en charge dans un environnement Microsoft Windows de clustering avec basculement.

Voir aussi

Principes de base de la recherche de texte intégral

Terminologie spécifique à la recherche de texte intégral

Voir aussi

Concepts

Autres ressources

Aide et Informations

Ressources supplémentaires