Mots non significatifs

Article
12/15/2008

Pour éviter l'encombrement de l'index de texte intégral, Microsoft SQL Server dispose d'un mécanisme qui ignore la répétition des mots courants inutiles pour la recherche. Ces mots sont appelés mots non significatifs ou mots exclus. Les mots non significatifs sont répertoriés dans des fichiers de mots non significatifs selon les paramètres régionaux. Par exemple, en français, les mots tels que « un », « et », « est » ou « le » sont répertoriés dans le fichier des mots non significatifs français ; ils sont écartés de l'index de texte intégral, car ils sont à l'évidence inutiles dans le cadre d'une recherche. En revanche, l'index de texte intégral prend en compte la position des mots non significatifs. Prenons l'exemple de l'expression suivante : « Instructions are applicable to these Adventure Works Cycles models ». Le tableau suivant décrit la position des mots dans l'expression :

Mot ou jeton	Position
Instructions	1
are	2
applicable	3
to	4
these	5
Adventure	6
Works	7
Cycles	8
models	9

Les mots non significatifs « are », « to » et « these » situés aux positions 2, 4 et 5 sont écartés de l'index de texte intégral. Cependant, les informations relatives à leur position sont conservées, sans affecter la position des autres mots de l'expression.

Les fichiers de mots non significatifs sont situés dans le répertoire $Chemin_Installation_SQL_Server\Microsoft SQL Server\MSSQL.1\MSSQL\FTDATA\. Une fois le répertoire créé, les fichiers de mots non significatifs sont installés lorsque vous configurez SQL Server pour la prise en charge de la recherche de texte intégral. Il est possible de modifier les fichiers de mots non significatifs ; par conséquent, les administrateurs système de sociétés informatiques peuvent par exemple ajouter le mot « ordinateur » à leur liste de mots non significatifs.

Important :
Si vous modifiez un fichier de mots non significatifs, vous devez remplir de nouveau les catalogues de texte intégral afin que les modifications soient prises en compte.

Le tableau suivant répertorie les fichiers de mots vides et leurs langues respectives.

Fichier de mots vides	Langue
Noisechs	Chinois simplifié
Noisecht	Chinois traditionnel
Noisedan	Danois
Noisedeu	Allemand
Noiseeng	Anglais UK
Noiseenu	Anglais US
Noiseesn	Espagnol
Noisefra	Français
Noiseita	Italien
Noisejpn	Japonais
Noisekor	Coréen
Noiseneu	Langue neutre
Noisenld	Néerlandais
Noiseplk	Polonais
Noiseptb	Portugais (Brésil)
Noisepts	Portugais (Portugal)
Noiserus	Russe
Noisesve	Suédois
Noisetha	Thaï
Noisetrk	Turc

Mots non significatifs

Voir aussi

Concepts

Aide et Informations

Ressources supplémentaires