Vue d’ensemble du schéma de recherche dans SharePoint Server

S’APPLIQUE À :  yes-img-13 2013  yes-img-16 2016  yes-img-19 2019  yes-img-se Subscription Edition  no-img-sop SharePoint in Microsoft 365

L’index de recherche est l’élément central de la recherche. Son contenu détermine ce que les utilisateurs trouvent lorsqu’ils saisissent des requêtes de recherche ou se servent de pages Internet ou intranet pour rechercher des informations.

Cet article explique comment le contenu est intégré dans l’index de recherche et de quelle manière il en est extrait au moyen du schéma de recherche. Le schéma de recherche comprend des propriétés analysées, des catégories de propriété analysé, le mappage entre propriétés analysées et gérées, ainsi que les paramètres de propriété gérée. Les paramètres de propriété gérée définissent le contenu à rechercher et le mode de recherche, par exemple si vous pouvez affiner une propriété ou réaliser une requête la concernant.

Analyse et propriétés analysées

Pour créer l'index de recherche, vous devez avant tout analyser le contenu. Diverses sources de contenu peuvent être analysées. Il peut s'agir, par exemple, de contenu SharePoint Server, de partages de fichiers ou de profils utilisateur. Le contenu et les métadonnées des éléments que vous analysez sont représentés sous la forme de propriétés analysées.

Chaque élément qui est analysé et transmis au composant de traitement du contenu est doté de propriétés analysées qui y sont associées. Les propriétés qui déterminent l' auteur, une fonction et une date de création en sont des exemples. Toutes les propriétés analysées sont découvertes automatiquement.

Les propriétés analysées sont regroupées en catégories fondées sur le IFilter ou le gestionnaire de protocole de l'élément. Office (propriétés analysées à partir de documents Word, feuilles de calcul Excel, etc.), les données métiers (propriétés analysées à partir de bases de données, par exemple) et Web (propriétés analysées à partir de sites web) sont des exemples de catégories.

Pour plus d’informations sur l’analyse, reportez-vous à l’article Planifier l’analyse et la fédération dans SharePoint Server.

Propriétés gérées et mappage des propriétés

Pour inclure le contenu des métadonnées des propriétés analysées dans l’index de recherche, vous devez mapper les propriétés analysées sur des propriétés gérées. Seules les propriétés gérées sont écrites dans l’index de recherche.

Les propriétés gérées peuvent être dotées d’un grand nombre de paramètres. Les paramètres au sein de la propriété gérée déterminent le mode d’affichage du contenu dans les résultats de la recherche et le mode de recherche disponible pour les utilisateurs.

Vous pouvez mapper plusieurs propriétés analysées sur une seule propriété gérée. Par exemple, vous pouvez mapper les propriétés analysées « Rédacteur » et « Auteur » sur la propriété gérée « Auteur ». Ou bien, vous pouvez mapper une propriété analysée unique sur plusieurs propriétés gérées.

De plus, l’ordre dans lequel les propriétés analysées sont mappées sur une propriété gérée peut déterminer le contenu de cette dernière. Par exemple, plusieurs propriétés analysées peuvent être mappées sur une propriété gérée et celle-ci peut être définie de façon à inclure toutes les valeurs de toutes les propriétés analysées mappées sur elle. Toutefois, si vous accordez la priorité à la propriété analysée contenant le titre SharePoint par rapport à un autre titre dans le mappage, le titre SharePoint sera affiché dans les résultats de recherche.

Un ensemble de mappages par défaut entre les propriétés analysées et gérées a été défini. Reportez-vous à la rubrique relative à la vue d’ensemble des propriétés analysées et gérées dans SharePoint Server.

Certains types de propriétés analysées créent automatiquement une nouvelle propriété gérée et un mappage entre propriétés analysées et propriétés gérées. À titre d’exemple, toutes les colonnes de site des bibliothèques SharePoint sont dotées de ces fonctions de création et de mappage automatiques. Lorsque vous créez une colonne de site dans une liste et que vous analysez cette liste, une propriété analysée, une propriété gérée et un mappage entre ces deux propriétés est automatiquement créé pour la colonne de site.

Vous pouvez modifier le mappage par défaut ou tout autre mappage des propriétés analysées sur des propriétés gérées, ainsi que créer des mappages ou des propriétés gérées. Lorsque vous créez une propriété gérée ou lorsque vous modifiez certains paramètres de propriétés gérées existantes, une analyse complète doit être effectuée pour que la propriété gérée et sa valeur soient incluses dans l’index de recherche. Si la nouvelle propriété ou la propriété modifiée figure dans une bibliothèque ou une liste SharePoint, vous pouvez réindexer cette bibliothèque ou cette liste sans avoir à lancer une analyse complète de la source de contenu SharePoint. Cette action a le même effet qu’une analyse complète.

Pour plus d'informations, consultez le tableau Vue d'ensemble des paramètres des propriétés gérées plus loin dans cet article.

Schéma de recherche

Le schéma de recherche est stocké dans la base de données d’administration de la recherche. Il contient les éléments suivants :

  • Le mappage entre les propriétés analysées et les propriétés gérées. Il peut s’agir d’un mappage d’une propriété analysée sur une propriété gérée, d’une propriété analysée sur plusieurs propriétés gérées, de plusieurs propriétés analysées sur une propriété gérée ou même de plusieurs propriétés analysées sur plusieurs propriétés gérées.

  • Le mode d’écriture des propriétés gérées dans l’index de recherche : par exemple, dans quel index de recherche en texte intégral les valeurs des propriétés gérées sont-elles à écrire et dans quel groupe de poids (contexte).

  • Les paramètres des différentes propriétés gérées. Par exemple, est-il possible de rechercher, interroger ou affiner des résultats de recherche en fonction de propriétés gérées spécifiques ?

  • Les catégories des propriétés analysées qui regroupent les propriétés en fonction de leur gestionnaire IFilter ou de protocole. Si vous modifiez une catégorie de propriétés analysées, vos modifications s’appliquent à l’intégralité des propriétés analysées de la catégorie. Cela peut avoir une influence sur les performances ainsi que sur la façon dont les éléments sont enregistrés dans l’index de recherche.

Les mises à jour du schéma de recherche sont propagées dans le système de recherche toutes les minutes.

Schémas de recherche multiples

Vous pouvez créer plusieurs schémas de recherche. Le schéma de recherche principal est défini dans l'application de service de recherche et peut être modifié sur le site Administration centrale. Les administrateurs de collection de sites et de client peuvent modifier le schéma de recherche d'une collection de sites ou d'un client en particulier. Par exemple, l'administrateur d'une collection de sites peut personnaliser le contenu de l'index de recherche en modifiant le schéma de recherche de cette même collection et, par la même, personnaliser l'expérience de recherche pour cette collection de sites. Les propriétaires de site peuvent consulter le schéma de recherche mais pas le modifier.

Notes

Vous ne pouvez pas afficher ou modifier le schéma de recherche de la collection de sites dans Administration centrale. Pour cela, vous devez utiliser l'Administration de la collection de sites.

Index de recherche

L’index de recherche se compose d’un ensemble de fichiers dans des dossiers sur un serveur. Le composant de traitement du contenu traite les éléments analysés, se sert du schéma de recherche pour mapper des propriétés analysées sur des propriétés gérées et convertit les propriétés gérées dans un format écrit dans l’index de recherche. Outre les divers index de recherche en texte intégral, il existe des index distincts pour les propriétés gérées marquées comment étant affichables dans les résultats d’une recherche et celles marquées en tant que propriétés utilisables dans une requête. Il existe également des vecteurs d’attributs et des index numériques.

Groupes de mises à jour d’index

Quand un élément est modifié, il doit être réindexé après avoir été une nouvelle fois analysé. Pour réduire la charge de réindexation, SharePoint Server introduit plusieurs groupes de mises à jour d'index distincts.

  • Par défaut: contient la majorité des propriétés gérées. Ce groupe de mises à jour d'index contient toutes les propriétés gérées qui n'appartiennent pas aux groupes de mises à jour d'index Sécurité, Lien, Utilisation ou Personnes.

  • Sécurité: contient la propriété gérée Liste de contrôle d'accès du document.

  • Lien: contient les propriétés gérées liées à la structure des liens.

  • Utilisation: contient les propriétés gérées liées à l'utilisation des données.

  • Personnes: contient les propriétés gérées liées à la recherche des personnes.

Chaque groupe de mises à jour est stocké dans un dossier différent dans l’index de recherche.

Index de recherche en texte intégral

Un index de recherche en texte intégral contient tout le texte des propriétés gérées pouvant faire l'objet d'une recherche et qui sont stockées dans cet index. L'index de recherche en texte intégral est divisé en groupes de poids, également appelés « contextes ». Ces contextes se rapportent à l'importance relative de la propriété gérée (l'une des caractéristiques de classement qui entrent dans le calcul du niveau de pertinence global d'un résultat de recherche). Le numéro, ou ID, du contexte importe peu ; le modèle de classement détermine son importance relative en attribuant un coefficient de contribution à un contexte spécifique. Plus ce coefficient est élevé, plus le score l'est aussi dans le classement. Pour plus d'informations, voir la section relative à l'Influencer le classement des résultats de recherche à l'aide du schéma de recherche de l'article Vue d'ensemble du classement des résultats de recherche dans SharePoint Server.

Il existe deux index de recherche en texte intégral prédéfinis en plus de celui par défaut : l’index de recherche en texte intégral des termes SharePoint (SpTermsIdx) et l’index Personnes (PeopleIdx).

La plupart des propriétés gérées sont déjà mappées sur un contexte approprié et un index de recherche en texte intégral par défaut. Nous vous déconseillons de modifier le contexte des propriétés gérées pouvant faire l’objet d’une recherche.

Vue d’ensemble des paramètres des propriétés gérées

Les paramètres des propriétés gérées déterminent la manière dont le contenu est enregistré dans l’index de recherche. Ils permettent également de définir si les utilisateurs peuvent rechercher du contenu et le récupérer et de quelle façon.

Le schéma de recherche peut être modifié dans les composants Administration centrale, Administration de la collection de sites et Administration des clients. Les administrateurs des sites peuvent consulter le schéma de recherche, mais pas le modifier. Le tableau suivant décrit les différents paramètres et indique s'ils peuvent être modifiés à différents niveaux d'administration.

Paramètre de propriété gérée Fonction Exemple Disponible dans Analyse complète ou réindexation de la liste/bibliothèque SharePoint nécessaire après la modification du paramètre
Utilisable dans une requête Permet d’interroger le contenu de la propriété gérée. Le contenu de cette propriété gérée est inclus dans l’index de recherche en texte intégral. Si la propriété est « auteur », une simple requête pour le nom « Smith » retourne des éléments contenant le mot « Smith » et les éléments dont la propriété Auteur contient ce même mot. Administration centrale / Administration de la collection de sites / Administration des clients Oui
Paramètres avancés pouvant faire l’objet d’une recherche Permet l'affichage et la modification de l'index de recherche en texte intégral dans lequel la propriété gérée est écrite. Il permet également de changer le contexte de la propriété gérée en vue du calcul du classement selon la pertinence. Nous vous déconseillons de modifier le contexte des propriétés gérées existantes. Pour plus d'informations, voir la section relative à l'Influencer le classement des résultats de recherche à l'aide du schéma de recherche de l'article Vue d'ensemble du classement des résultats de recherche dans SharePoint Server. Administration centrale / Administration de la collection de sites / Administration des clients Oui
Utilisable dans une requête Permet d’interroger la propriété gérée concernée. Le nom de la propriété gérée doit être inclus dans la requête, c’est-à-dire soit être précisé dans la requête même, soit être intégré par programme dans la requête. Si la propriété gérée est « auteur », la requête doit contenir « auteur:Smith ». Administration centrale / Administration de la collection de sites / Administration des clients Passage du statut Désactivé au statut Activé
Affichable dans les résultats d’une recherche Permet de retourner le contenu de cette propriété gérée dans les résultats de la recherche. Activez ce paramètre pour les propriétés gérées pertinentes à présenter dans les résultats de la recherche. Administration centrale / Administration de la collection de sites / Administration des clients Passage du statut Désactivé au statut Activé
Autoriser plusieurs valeurs Autorise plusieurs valeurs du même type dans cette propriété gérée. S’il s’agit de la propriété gérée « auteur » et si un document possède plusieurs auteurs, chaque nom d’auteur est stocké comme une valeur distincte dans la propriété gérée. Administration centrale Oui
Utilisable dans une recherche approfondie Oui - actif : permet l’utilisation de la propriété comme affinement pour les résultats de la recherche dans le composant frontal. Vous devez manuellement configurer l’affinement dans le composant WebPart.

Oui - latent : permet le passage ultérieur du statut utilisable dans une recherche approfondie au statut actif, sans avoir à refaire une analyse complète au moment de changer.

Les deux options nécessitent une analyse complète pour être opérationnelles.

IMPORTANT : si vous sélectionnez l'option « Oui - actif » ou « Oui - latent », définissez aussi la propriété gérée comme étant une propriété utilisable dans une requête.

Non pris en charge dans l’expérience de recherche moderne.
Si la propriété gérée « auteur » est définie sur Utilisable dans une recherche approfondie, vous pouvez définir Auteur comme affinement sur votre serveur de recherche frontal par la suite. Administration centrale Passage du statut Désactivé au statut Activé (si Triable n’est pas défini)
Triable Oui - actif : permet de trier le jeu de résultats en fonction de la propriété avant qu'il ne soit renvoyé.

Oui - latent : permet de passer le tri en mode actif par la suite sans avoir à refaire une analyse complète au moment de changer.

Les deux options nécessitent une analyse complète pour être opérationnelles.

Non pris en charge dans l’expérience de recherche moderne.
Utilisez ce paramètre pour des jeux de résultats impossibles à trier et extraire en même temps. Administration centrale Passage du statut Désactivé au statut Activé (si Utilisable dans une recherche approfondie n’est pas défini)
Alias Définit un alias pour une propriété gérée si vous préférez utiliser cet alias plutôt que le nom de la propriété gérée dans les requêtes et les résultats de la recherche. Utilisez la propriété gérée d’origine, et non l’alias, pour le mappage sur une propriété analysée. Ayez recours à un alias si vous ne souhaitez pas créer une propriété gérée ou n'avez pas l'autorisation d'en créer une. Administration centrale / Administration de la collection de sites / Administration des clients Non
Normalisation des jetons Permet de renvoyer les résultats sans tenir compte de la casse et des signes diacritiques employés dans la requête. La requête « curacao » renvoie également les termes « Curaçao », « curacao » et « Curacao ». Administration centrale / Administration de la collection de sites / Administration des clients Oui
Correspondance complète Par défaut, la recherche renvoie des correspondances partielles entre les requêtes sur une propriété gérée et le contenu de la propriété gérée.

Sélectionnez Correspondance complète pour la recherche afin de renvoyer des correspondances exactes à la place.
Si une propriété gérée « Title » contient « Contoso Sites », seul le titre de la requête : « Contoso Sites » donne un résultat. Administration centrale / Administration de la collection de sites / Administration des clients Oui
Tokenization linguistique neutre (SharePoint Server 2019 uniquement) Sélectionnez la tokenisation linguistique neutre si vous avez du contenu multilingue et que la propriété gérée contient des balises basées sur des ensembles de termes de métadonnées ou d’autres identificateurs.

Par défaut, la recherche dépend de la langue lorsqu’elle divise les requêtes et le contenu en parties (tokenization). Par exemple, une bibliothèque de documents contenant des feuilles de données de produit en anglais et en chinois dans laquelle les identificateurs de produit ont des caractères non alphanumériques, tels que « 11.132-84-115#4 ». Lorsque la recherche traite une feuille de données, elle détecte sa langue et jetonise tout ce qui y est en fonction de cette langue. Lorsque les utilisateurs recherchent un identificateur de produit, la recherche tokenise leur requête en fonction du paramètre de langue du site SharePoint’ils sont sur. Si le site est en anglais et que l’utilisateur recherche un identificateur de produit qui a été tokenisé en tant que texte chinois, les jetons peuvent ne pas correspondre et les utilisateurs n’obtiennent aucun résultat.

Pour améliorer les résultats pour les utilisateurs, map to make the crawled property for the product identifier to a new managed property, « ProductID », with language neutral tokenization enabled. Demandez aux utilisateurs de rechercher des identificateurs de produit par rapport à la nouvelle propriété gérée, comme ceci : ProductID:"11.132-8 ».
Si la propriété analyse d’un identificateur de produit est mappée sur la propriété gérée « ProductID », la recherche utilise la tokenisation de langue neutre pour les requêtes par rapport à « ProductID ». Administration centrale / Administration de la collection de sites / Administration des clients Oui
Tokenization de requête plus fine (SharePoint Server 2019 uniquement) Utilisez ce paramètre pour aider les utilisateurs à obtenir de meilleurs résultats de recherche lorsqu’ils recherchent dans des propriétés gérées qui contiennent des métadonnées avec des caractères non alphanumériques. Ce paramètre ralentit les requêtes sur la propriété gérée.

Les utilisateurs qui préfèrent entrer rapidement une requête, puis parcourir les résultats pour trouver la feuille de données qu’ils recherchent, entrent généralement des requêtes telles que ProductID:"132-884 ». Étant donné que la recherche par défaut divise le contenu de l’index de recherche en parties plus petites que pour les requêtes, la recherche risque de ne pas trouver de correspondances pour ces requêtes. Lorsque la requête est tokenisée plus fine, il est plus probable qu’il existe des correspondances entre les jetons dans l’index de recherche et dans la requête. Les utilisateurs peuvent également interroger le milieu ou la dernière partie de l’identificateur de produit.

Les utilisateurs qui recherchent une feuille de données et s’attendent à obtenir uniquement des résultats qui correspondent à l’identificateur complet du produit, écrivent généralement des requêtes telles que ProductID:"11.132-884-115#4 ». La tokenisation de requête plus fine n’a aucune différence avec ces requêtes.
Si vous avez une propriété gérée « Identificateur de produit » qui contient « 11.132-884-115#4 », les recherches telles que ProductID:"132-884 » obtiennent probablement des résultats. Administration centrale / Administration de la collection de sites / Administration des clients Non
Mappages sur les propriétés analysées La liste affiche toutes les propriétés analysées mappées sur cette propriété gérée. Une propriété gérée peut se procurer son contenu auprès d’une ou plusieurs propriétés analysées.

Vous pouvez soit inclure le contenu de la totalité des propriétés analysées, soit inclure le contenu de la première propriété analysée qui n’est pas vide en suivant un ordre bien précis.
Administration centrale / Administration de la collection de sites / Administration des clients Oui
Extraction des noms d’entreprise Permet au système d’extraire des noms de sociétés à partir de la propriété gérée lors de l’analyse d’éléments nouveaux ou mis à jour. Les entités extraites peuvent ensuite être réutilisées pour configurer des affinements.

Il existe un dictionnaire déjà bien rempli pour l’extraction des noms de sociétés. Le système enregistre le contenu inchangé de la propriété gérée d’origine dans l’index et il copie également les entités extraites dans la propriété gérée « sociétés ». Celle-ci est configurée en tant que propriété pouvant faire l’objet d’une recherche, utilisable dans une requête, affichable dans les résultats d’une recherche, triable et utilisable dans une recherche approfondie.

Vous pouvez modifier le dictionnaire des noms de sociétés dans le magasin de termes.

Pour plus d'informations, voir Gérer l'extraction des noms de sociétés dans SharePoint Server.

Non pris en charge dans l’expérience de recherche moderne.
Administration centrale / Administration de la collection de sites / Administration des clients Oui
Extraction de l’entité personnalisée Permet d’associer un ou plusieurs extracteurs d’entités personnalisées à cette propriété gérée. Le système peut ainsi extraire des entités à partir de la propriété gérée lors de l’analyse d’éléments nouveaux ou mis à jour. Les entités extraites peuvent ensuite être réutilisées pour configurer des affinements.

Pour plus d’informations, reportez-vous à l’article Créer et déployer des extracteurs d’entités personnalisées dans SharePoint Server.

Non pris en charge dans l’expérience de recherche moderne.
Administration centrale / Administration de la collection de sites Oui

Voir aussi

Gérer le schéma de recherche dans SharePoint Server

Vue d'ensemble des analysé et géré les propriétés de SharePoint Server

Planifier l'analyse et la fédération dans SharePoint Server