Procédure : modifier un fichier de dictionnaire des synonymes (recherche en texte intégral)

Le dictionnaire des synonymes d'une langue donnée peut être configuré en modifiant son fichier XML. Pendant l'installation, des fichiers de dictionnaire des synonymes vides, comportant uniquement le conteneur <xml> et un exemple commenté d'élément <thesaurus> sont installés. Pour que les requêtes de recherche en texte intégral qui recherchent des synonymes fonctionnent correctement, vous devez créer un élément <thesaurus> réel qui définit un jeu de synonymes. Vous pouvez définir deux formes de synonymes : les jeux d'expansion et les jeux de remplacement. Pour plus d'informations sur l'emplacement et la structure d'un fichier de dictionnaire de synonymes, consultez Configuration du dictionnaire des synonymes.

Restrictions applicables aux fichiers des dictionnaires des synonymes

Les restrictions suivantes s'appliquent à la modification d'un fichier de dictionnaire des synonymes :

  • Seuls des administrateurs système peuvent mettre à jour, modifier ou supprimer des fichiers de dictionnaire des synonymes.

  • Lorsque vous modifiez des fichiers de dictionnaire des synonymes à l'aide des outils d'édition de texte, les fichiers doivent être enregistrés au format Unicode et des marques d'ordre d'octets doivent être spécifiées.

  • Les entrées du dictionnaire des synonymes ne doivent pas être vides et la césure des mots ne doit pas résulter en une chaîne vide.

  • Les expressions du fichier de dictionnaire des synonymes ne doivent pas dépasser 512 caractères.

  • Un dictionnaire des synonymes ne doit pas contenir d'entrées en double parmi les entrées <sub> des jeux d'expansion et les éléments <pat> des jeux de remplacement.

Recommandations pour les fichiers des dictionnaires des synonymes

Nous vous recommandons de ne pas utiliser de caractères spéciaux dans les entrées d'un fichier de dictionnaire des synonymes. En effet, le comportement des analyseurs lexicaux en ce qui concerne les caractères spéciaux est particulier. Si une entrée de dictionnaire des synonymes contient des caractères spéciaux, les analyseurs lexicaux utilisés en association avec cette entrée peuvent avoir des conséquences comportementales subtiles pour une requête de texte intégral.

Nous vous recommandons de ne pas utiliser de mots vides dans les entrées <sub>, car les mots vides sont omis de l'index de recherche en texte intégral. En effet, les requêtes sont élargies de façon à inclure les entrées <sub> d'un fichier de dictionnaire des synonymes, et si une entrée <sub> contient des mots vides, la taille de la requête augmente inutilement.

Pour modifier un fichier de dictionnaire des synonymes

  1. Ouvrez le fichier de dictionnaire des synonymes dans le Bloc-notes.

  2. Si vous modifiez le fichier de dictionnaire des synonymes pour la première fois, supprimez les lignes de commentaires suivantes au début et à la fin du fichier :

    <!--Commented out
    -->
    
  3. Ajoutez, modifiez ou supprimez un jeu de remplacement ou un jeu d'expansion. Pour plus d'informations, consultez Configuration du dictionnaire des synonymes.

  4. Enregistrez le fichier et fermez le Bloc-notes.

  5. Utilisez sp_fulltext_load_thesaurus_file pour charger le contenu du fichier du dictionnaire des synonymes dans tempdb, en spécifiant l'identificateur de paramètres régionaux (LCID) qui correspond à la langue du fichier. Par exemple, pour le fichier du dictionnaire des synonymes anglais, tsenu.xml, le LCID correspondant est 1033.

    USE AdventureWorks2008R2 ;
    EXEC sys.sp_fulltext_load_thesaurus_file 1033;
    GO