Mots non significatifs

Pour éviter l'encombrement de l'index de texte intégral, Microsoft SQL Server dispose d'un mécanisme qui ignore la répétition des mots courants inutiles pour la recherche. Ces mots sont appelés mots non significatifs ou mots exclus. Les mots non significatifs sont répertoriés dans des fichiers de mots non significatifs selon les paramètres régionaux. Par exemple, en français, les mots tels que « un », « et », « est » ou « le » sont répertoriés dans le fichier des mots non significatifs français ; ils sont écartés de l'index de texte intégral, car ils sont à l'évidence inutiles dans le cadre d'une recherche. En revanche, l'index de texte intégral prend en compte la position des mots non significatifs. Prenons l'exemple de l'expression suivante : « Instructions are applicable to these Adventure Works Cycles models ». Le tableau suivant décrit la position des mots dans l'expression :

Mot ou jeton Position

Instructions

1

are

2

applicable

3

to

4

these

5

Adventure

6

Works

7

Cycles

8

models

9

Les mots non significatifs « are », « to » et « these » situés aux positions 2, 4 et 5 sont écartés de l'index de texte intégral. Cependant, les informations relatives à leur position sont conservées, sans affecter la position des autres mots de l'expression.

Les fichiers de mots non significatifs sont situés dans le répertoire $Chemin_Installation_SQL_Server\Microsoft SQL Server\MSSQL.1\MSSQL\FTDATA\. Une fois le répertoire créé, les fichiers de mots non significatifs sont installés lorsque vous configurez SQL Server pour la prise en charge de la recherche de texte intégral. Il est possible de modifier les fichiers de mots non significatifs ; par conséquent, les administrateurs système de sociétés informatiques peuvent par exemple ajouter le mot « ordinateur » à leur liste de mots non significatifs.

ms142551.note(fr-fr,SQL.90).gifImportant :
Si vous modifiez un fichier de mots non significatifs, vous devez remplir de nouveau les catalogues de texte intégral afin que les modifications soient prises en compte.

Le tableau suivant répertorie les fichiers de mots vides et leurs langues respectives.

Fichier de mots vides Langue

Noisechs

Chinois simplifié

Noisecht

Chinois traditionnel

Noisedan

Danois

Noisedeu

Allemand

Noiseeng

Anglais UK

Noiseenu

Anglais US

Noiseesn

Espagnol

Noisefra

Français

Noiseita

Italien

Noisejpn

Japonais

Noisekor

Coréen

Noiseneu

Langue neutre

Noisenld

Néerlandais

Noiseplk

Polonais

Noiseptb

Portugais (Brésil)

Noisepts

Portugais (Portugal)

Noiserus

Russe

Noisesve

Suédois

Noisetha

Thaï

Noisetrk

Turc

Voir aussi

Concepts

Principes de base de la recherche de texte intégral

Aide et Informations

Assistance sur SQL Server 2005