Planifier une recherche hybride dans le nuage pour SharePoint dans Microsoft 365

S’APPLIQUE À :  yes-img-13 2013  yes-img-16 2016  yes-img-19 2019  yes-img-se Subscription Edition  yes-img-sop SharePoint in Microsoft 365

La mise en place d'une recherche hybride dans le nuage pour SharePoint dans Microsoft 365 nécessite une planification minutieuse. Cet article vous aide à concevoir une solution de recherche hybride dans le nuage hautement fiable, sécurisée et évolutive.

De quelles expériences de recherche vos utilisateurs ont-ils besoin ?

Après avoir configuré la recherche hybride sur le cloud et une analyse complète du contenu local, le centre de recherche dans Office 365 affiche automatiquement les résultats hybrides issus de votre index Microsoft 365.

Recherche verticale - La recherche verticale permet de limiter les résultats à un ensemble spécifique de contenus, par exemple pour ne montrer que des vidéos. Si vous utilisez actuellement une recherche verticale dans un centre de recherche dans SharePoint Server, vous devez la recréer dans votre centre de recherche dans SharePoint dans Microsoft 365.

Recherche de site : Votre recherche en cours dans les bibliothèques de documents dans SharePoint Server cesse de renvoyer des résultats lorsque vous déplacez votre index de recherche vers Microsoft 365. La recherche est plus rapide lorsque les utilisateurs utilisent des centres de recherche qui se trouvent dans le même environnement que l'index de recherche. Ainsi, la recherche à partir d'un centre de recherche Microsoft 365 donne une meilleure expérience. Si vos utilisateurs ont besoin des résultats de l'index de recherche Microsoft 365 dans des sites SharePoint sur site, tels que les sites d'équipe existants dans SharePoint Server 2010, vous pouvez configurer la recherche à partir de SharePoint Server 2013 ou SharePoint Server 2016. Prévoyez une source de résultats à distance dans SharePoint Server 2013 ou SharePoint Server 2016 qui obtient des résultats de l'index de recherche Microsoft 365 et prévoyez l'utilisation de la fédération de requêtes. Comme SharePoint dans Microsoft 365 traite vos requêtes, vos utilisateurs doivent utiliser la syntaxe de requête que SharePoint dans Microsoft 365 prend en charge. Pour en savoir plus, consultez la page Afficher les résultats de Microsoft 365 dans SharePoint sur site avec recherche hybride sur le cloud.

eDiscovery - Vous devrez peut-être configurer l'eDiscovery séparément dans SharePoint Server et dans SharePoint dans Microsoft 365.

Publication intersites : la publication intersites n’est pas disponible avec la recherche hybride sur le cloud.

Comment souhaitez-vous afficher les résultats de la recherche ?

Aperçus : quand un utilisateur pointe sur un résultat de recherche provenant de Microsoft 365, des informations sur le contenu ainsi qu’un aperçu du contenu s’affichent. Les informations sur le contenu des résultats de la recherche provenant de l’environnement local s’affichent automatiquement, mais l’affichage des aperçus doit être configuré pour ce contenu. Planifiez une batterie de serveurs Office Web Apps Server et configurez SharePoint Server 2013 pour utiliser Office Web Apps Server. Si vous souhaitez en savoir plus, consultez l’article Afficher les résultats à partir de Microsoft 365 dans SharePoint local avec la recherche hybride sur le cloud.

Custom security trimming - SharePoint in Microsoft 365 doesn't support custom security trimming.

De quelles fonctionnalités de recherche avez-vous besoin ?

Certaines fonctionnalités de recherche que vous connaissez de SharePoint Server fonctionnent différemment avec la recherche hybride sur le cloud. Pensez à informer les utilisateurs de ces différences.

Best bets : fonctionnalité de SharePoint Server 2010. Utilisez plutôt les règles d'interrogation de SharePoint dans Microsoft 365.

Étendues de recherche personnalisées : fonctionnalité de SharePoint Server 2010. Utilisez plutôt les origines des résultats dans SharePoint dans Microsoft 365.

Promotion/rétrogradation des résultats de recherche : fonctionnalité de SharePoint Server 2010. Utilisez plutôt les origines des résultats de SharePoint dans Microsoft 365.

Suppression des résultats de la recherche locale : dans l’Administration centrale dans SharePoint Server, vous pouvez sélectionner une application Service de recherche et utiliser l’option « Réinitialiser l’index » pour supprimer tous les éléments de l’index de recherche. N’utilisez pas cette option pour une application de service de recherche dans le cloud. L’option supprime l’historique d’analyse des bases de données d’analyse, mais ne supprime pas les éléments locaux de l’index de recherche Microsoft 365, car il n’y a aucune communication directe entre l’application de service de recherche dans le cloud dans SharePoint Server et l’index de recherche dans Office 365. Ces éléments locaux deviennent orphelins dans l’index Microsoft 365. Pour supprimer toutes les métadonnées locales de l’index de recherche Microsoft 365, supprimez toutes les sources de contenu locales. Une fois le processus effectué, tous les éléments locaux restants dans l’index de recherche Microsoft 365 deviennent des éléments orphelins.

Certaines fonctionnalités de recherche que vous connaissez de SharePoint Server ne sont pas disponibles avec la recherche hybride sur le cloud. Pensez à en informer les utilisateurs.

Architecture mutualisée sur une batterie de serveurs SharePoint Server 2013 ou SharePoint Server 2016 : une batterie de serveurs SharePoint Server 2013 ou SharePoint Server 2016 peut être jointe à un seul client dans SharePoint Online dans Microsoft 365. Ainsi, SharePoint Online ne peut pas continuer à isoler le client dans une batterie de serveurs SharePoint Server 2013 ou SharePoint Server 2016 mutualisée.

Extraction des entités personnalisée : cette fonctionnalité n’est pas disponible avec la recherche hybride sur le cloud, car elle n’est pas prise en charge par SharePoint dans Microsoft 365.

Service web Enrichissement de contenu : la légende de ce service n’est pas disponible avec la recherche hybride sur le cloud, car l’extraction des entités personnalisée n’est pas prise en charge par SharePoint Online dans Microsoft 365.

Dictionnaire des synonymes : les dictionnaires des synonymes ne sont pas disponibles avec la recherche hybride sur le cloud, car ils ne sont pas pris en charge par SharePoint dans Microsoft 365.

Lorsque vous mettez en place une recherche hybride sur le cloud, l'une des étapes consiste à créer une application de service de recherche sur le cloud (cloud SSA) sur votre ferme de recherche SharePoint Server 2013 ou SharePoint Server 2016. Lorsque vous créez cette SSA en nuage, une architecture de recherche par défaut est créée pour vous sur le serveur qui exécute la SSA cloud. Chaque ferme de recherche ne peut avoir qu'un seul SSA could, mais peut avoir plusieurs SSA en combinaison avec le SSA cloud.

Une architecture de recherche pour la recherche hybride sur le cloud comprend des composants de recherche et des bases de données qui forment une topologie, et des serveurs qui hébergent cette topologie. Vous devez planifier le nombre de composants d’analyse pour votre topologie, les serveurs qui hébergent les composants de recherche et les bases de données et le matériel requis pour chaque serveur.

Avant de commencer, consultez la rubrique Découvrez la topologie de recherche pour la recherche hybride sur le cloud pour en savoir plus sur les composants de recherche dans une architecture de recherche pour la recherche hybride sur le cloud.

Étape 1 : Quel volume de contenu local puis-je indexer dans Microsoft 365 ?

Pour chaque To d’espace de stockage en pool détenu par votre client dans SharePoint Online, vous pouvez indexer 1 million d’éléments de contenu local dans l’index de recherche dans Office 1. Vous pouvez acheter davantage d’espace pour augmenter votre quota, jusqu’à atteindre le seuil de 20 millions. Pour indexer plus de 20 millions d’éléments de contenu local, contactez le Support Microsoft pour augmenter ce seuil.

Étape 2 : De quelle taille d’architecture de recherche dans le cloud ai-je besoin ?

Pour la recherche hybride dans le cloud, nous recommandons d’utiliser l’architecture de recherche par défaut que vous obtenez lorsque vous créez un cloud SSA :

Image illustrant la batterie de recherche avec des serveurs et des composants de recherche.

Les composants gris sont inactifs dans la recherche hybride sur le cloud mais ils doivent toujours être placés sur des serveurs, comme illustré. Consultez la rubrique Découvrez la topologie de recherche pour la recherche hybride sur le cloud pour en savoir plus sur les composants inactifs.

Comme pour la recherche de contenu d’entreprise locale uniquement, vous pouvez adapter votre architecture de recherche. La principale différence est que pour la recherche hybride sur le cloud, il convient seulement de mettre à l’échelle le composant d’analyse. Pour optimiser l’analyse, suivez les conseils fournis concernant l’analyse dans Reconcevoir la topologie de recherche de contenu d’entreprise pour respecter des exigences de performances spécifiques dans SharePoint 2016 (les conseils pour l’analyse s’appliquent également à la recherche hybride sur le cloud). Notez que si vous analysez le contenu local à un taux élevé, le système peut limiter le flux vers l’index de recherche Microsoft 365 pour protéger l’organisation Microsoft 365. Si votre architecture de recherche comprend deux composants d’analyse maximum, le taux d’analyse devrait être suffisant et acceptable.

Étape 3 : Quelle configuration matérielle requise dois-je utiliser pour l’architecture de recherche sur le cloud ?

Nous vous recommandons une architecture de recherche qui utilise des machines virtuelles, mais vous pouvez également utiliser des machines physiques. Pour plus d’informations, consultez la rubrique Choisir d’exécuter des serveurs physiques ou virtuels.

Ce tableau indique la quantité minimale de ressources matérielles dont a besoin chaque serveur d’applications ou serveur de bases de données :

Serveur Hôte Stockage RAM Processeur 1
Serveur d’applications
A
100 Go
16 Go
1,8 GHz 4 cœurs d’UC
Serveur de base de données
B
100 Go
16 Go
1,8 GHz 4 cœurs d’UC

1Le nombre de cœurs d’UC est spécifié ici, pas le nombre de threads d’UC.

En outre :

  • Veillez à ce que chaque serveur hôte dispose d’un espace disque suffisant pour l’installation de base du système d’exploitation Windows Server et des fichiers programmes SharePoint Server. Le serveur hôte doit aussi disposer d’un espace disque supplémentaire pour les fonctions de diagnostic, telles que la journalisation, le débogage et la création de fichiers d’image mémoire, pour les opérations quotidiennes et pour le fichier d’échange. Normalement, 80 Go d’espace disque sont suffisants pour le système d’exploitation Windows Server et pour les fichiers des programmes de SharePoint Server.

  • Ajoutez du stockage pour l'espace du journal SQL de chaque serveur de base de données. Si vous ne définissez pas le serveur de base de données pour sauvegarder les bases de données régulièrement, l'espace du journal SQL utilise beaucoup de stockage. Pour plus d'informations sur le mode de planification des bases de données SQL, voir Planification et configuration de la capacité de SQL Server et du stockage (SharePoint Server).

La façon dont vous décidez de distribuer les données provenant des composants de recherche et du système d’exploitation dans l’ensemble de votre stockage influe sur les performances de recherche. Il est conseillé de :

  • Fractionner les fichiers du système d’exploitation de Windows Server, les fichiers programmes de SharePoint Server et les journaux de diagnostic en trois volumes ou partitions de stockage distincts avec des performances normales.

  • Stocker les données de composant de recherche sur une partition ou un volume de stockage distinct avec des performances élevées.

Conseil

Vous pouvez définir un emplacement personnalisé pour les données de composant de recherche quand vous installez SharePoint Server sur un serveur hôte. Tous les composants de recherche sur le serveur hôte qui doivent stocker des données le font à cet emplacement. Pour modifier cet emplacement par la suite, réinstallez SharePoint Server sur ce serveur hôte.

Vérifiez que l’espace de stockage que vous avez est suffisamment rapide pour gérer le trafic des composants de recherche et des bases de données. La base de données d’analyse est le seul composant de l’architecture de recherche pour la recherche hybride sur le cloud ayant des exigences en matière d’E/S par seconde. La base de données d’analyse requiert des E/S par seconde moyennes à élevées et la charge habituelle sur un sous-système E/S est de 10 E/S par seconde pour un taux d’analyse d’1 document par seconde (DPS).

La topologie de recherche de la SSA cloud comprend les mêmes types de bases de données et de composants de recherche que la topologie de recherche d’une application de service de recherche standard dans SharePoint Server 2013 ou SharePoint Server 2016. Mais il existe des différences.

Bases de données et composants de recherche inutilisés dans la recherche hybride sur le cloud : dans la recherche hybride sur le cloud, Microsoft 365 traite le contenu, stocke l’index et traite l’analyse. La SSA cloud n’utilise pas son propre composant de traitement du contenu, composant d’index, composant de traitement de l’analyse, base de données de liens ni base de données d’analyse. Ces composants et bases de données sont inactifs.

Interaction entre les composants de recherche et les bases de données dans la recherche hybride sur le cloud : les composants de recherche et les bases de données interagissent différemment dans la topologie de recherche de la SSA cloud par rapport à la topologie de recherche d’une application de service de recherche standard :

Image illustrant les sources de contenu, la batterie de recherche avec des composants de recherche, et Microsoft 365. Les informations circulent à partir de sources de contenu, via le composant d’analyse, et vers Microsoft 365.

  1. Le composant d’analyse extrait du contenu de votre batterie de serveurs locale et envoie ce contenu à l’index de recherche dans Office 365. Il utilise des connecteurs pour interagir avec les sources de contenu et utilise la base de données d’analyse pour stocker les informations temporaires et historiques sur les éléments qu’il analyse, comme un composant d’analyse normal.

  2. Le composant d’administration de recherche exécute les processus système qui sont essentiels à la recherche, tout comme pour un SSA standard.

  3. Il est recommandé d’exécuter toutes les recherches à partir de Microsoft 365, car la recherche hybride sur le cloud y est optimisée. Mais vous pouvez configurer la recherche de site dans SharePoint Server pour obtenir les résultats de la recherche provenant de votre index de recherche dans Office 365. Si vous configurez la recherche dans une collection de sites locale pour interroger votre index Microsoft 365, ce composant de traitement de requête transmet les requêtes de la zone de recherche à l’index Microsoft 365 et les résultats de l’index Microsoft 365 à la zone de recherche.

Décider comment gérer l’analyse de votre contenu local

Vous pouvez influencer les performances d’analyse et l’actualisation de la recherche par votre façon de gérer les analyses, par exemple en utilisant efficacement des sources de contenu, en planifiant des analyses et des règles d’analyse. Les instructions de gestion de l’analyse pour la recherche locale uniquement s’applique aussi à la recherche hybride, consultez Best practices for crawling in SharePoint Server.

Décider comment synchroniser les Active Directories

Quand votre contenu local est analysé et chiffré, les listes de contrôle d’accès (ACL) pour chaque élément sont analysées également. L’index de recherche Microsoft 365 stocke les listes de contrôle d’accès avec l’élément. Le système doit donc être en mesure de reconnaître un utilisateur local comme étant la même personne dans Microsoft 365. Quand vous avez configuré la synchronisation Active Directory entre votre réseau local (Windows Server Active Directory) et votre organisation Microsoft 365 (Windows Azure Active Directory), le système mappe et traduit les listes de contrôle d’accès aux utilisateurs appropriés, et les utilisateurs obtiennent de l’index Microsoft 365 des résultats de recherche filtrés à des fins de sécurité.

Il existe deux méthodes pour synchroniser les annuaires Active Directories :

  • Synchronisation d’annuaires avec synchronisation de mot de passe

  • Synchronisation d’annuaires avec authentification unique (SSO)

Si vous choisissez l’option d’authentification unique, vous pouvez également configurer la synchronisation de mot de passe si vous le souhaitez, par précaution, mais au moins l’une des deux options (synchronisation de mot de passe ou authentification unique) doit être configurée. Découvrez comment configurer les deux méthodes dans Intégration de Microsoft 365 aux environnements locaux.

Pourquoi les utilisateurs ne peuvent-ils pas obtenir de résultats hybrides avec la recherche hybride sur le cloud quand ils sont membres du groupe de sécurité Utilisateurs de domaine ?

Certaines organisations attribuent des droits d’accès à leur contenu local en utilisant l’un des groupes de sécurité par défaut dans Windows Server Active Directory (AD), par exemple le groupe de sécurité Utilisateurs du domaine.

L’outil de synchronisation Azure Active Directory Connect exclut par défaut certains objets de la synchronisation. Les groupes de sécurité qui ont l’attribut « IsCriticalSecurityObject=true » forment un ensemble d’objets exclu par l’outil ; Utilisateurs de domaine est l’un d’entre eux. Ainsi, les droits d’accès pour les membres d’Utilisateurs de domaine ne sont pas disponibles dans Azure Active Directory (AAD). Même si les utilisateurs ont accès au contenu local, ils n’obtiennent pas les résultats de la recherche quand ils recherchent ce contenu.

Attribuez plutôt des droits d’accès à l’aide d’un groupe sans l’attribut « IsCriticalSecurityObject=true », à l’instar du groupe Tout le monde, du groupe Utilisateurs authentifiés ou d’un groupe personnalisé. Pour obtenir la liste des conditions d’exclusion des objets et en savoir plus sur les résultats de synchronisation inattendus, consultez l’article relatif aux objets qui ne se synchronisent pas quand l’outil de synchronisation Azure Active Directory est utilisé.

Votre organisation a-t-elle du contenu local sensible ?

Certaines entreprises ont du contenu local considéré comme sensible en raison des contraintes géopolitiques, juridiques ou réglementaires. Dans certains cas, il est interdit d’ajouter des métadonnées provenant de contenu local sensible à l’index de recherche Microsoft 365. Dans d’autres cas, les métadonnées provenant de contenu local sensible peuvent être ajoutées à l’index de recherche Microsoft 365, mais seul un nombre limité d’utilisateurs est autorisé à ouvrir les résultats de la recherche à partir du contenu sensible.

Voici deux exemples de la façon dont vous pouvez configurer la recherche hybride pour répondre à ces contraintes :

Quand les métadonnées provenant de contenu local sensible sont autorisées dans l’index Microsoft 365

Configurez la recherche hybride sur le cloud et planifiez avec soin des droits d’accès au contenu sensible. Ainsi, seuls les utilisateurs appropriés peuvent accéder au contenu sensible lorsqu’ils sélectionnent un résultat de la recherche.

Quand les métadonnées provenant de contenu local sensible ne sont pas autorisées dans l’index Microsoft 365

Configurez la recherche hybride sur le cloud en combinaison avec la recherche fédérée hybride.

Image illustrant une configuration combinée de recherche hybride sur le Cloud, recherche fédérée hybride et recherche d’entreprise.

  • Planifiez des sources de contenu pour l’application de service de recherche dans le cloud (SSA cloud) dans SharePoint Server, qui couvrent tout le contenu local à l’exception du contenu sensible. Les métadonnées pour le contenu analysé sont ajoutées à l’index de recherche dans Office 365.

  • Planifiez la recherche de contenu d’entreprise dans SharePoint Server pour analyser le contenu local sensible (consultez l’article Planifier la recherche dans SharePoint Server). Planifiez les sources de contenu pour la SSA qui couvrent le contenu sensible. Les métadonnées provenant du contenu sensible analysé sont ajoutées à l’index de recherche dans SharePoint Server.

  • Si vos utilisateurs ont besoin des résultats de l’index de recherche Microsoft 365 dans des sites SharePoint locaux, planifiez la recherche fédérée hybride de SharePoint Server pour afficher les résultats de la recherche de l’index de recherche dans SharePoint Server et de l’index de recherche dans Office 365. Consultez l’article relatif à la planification de la recherche fédérée hybride pour SharePoint Server.

Planifier la validation de la recherche hybride sur le cloud avant de l’exposer à vos utilisateurs

Après avoir créé et configuré la SSA cloud et effectué une analyse complète, votre Centre de recherche Microsoft 365 affiche à la fois les résultats de recherche locaux et en ligne. Nous vous recommandons de conserver l’expérience de recherche d’origine intacte quand vous validez et mettez au point la nouvelle expérience de recherche dans un Centre de recherche distinct.

Planifiez une origine des résultats personnalisée qui limite vos Centres de recherche dans Office 365 pour afficher uniquement le contenu Microsoft 365. L’illustration suivante décrit un environnement dans lequel vous pouvez valider et régler la façon dont vos résultats de recherche hybride sont affichés :

Illustration montrant comment le contenu parvient à l’index d’Office 365 à partir d’une batterie de contenu SharePoint Server et de Microsoft 365.

  1. Contenu local. Pendant l’analyse, les métadonnées provenant de ce contenu sont ajoutées à l’index de recherche Microsoft 365.

  2. Contenu Microsoft 365. Pendant l’analyse, les métadonnées provenant de ce contenu sont ajoutées à l’index de recherche Microsoft 365.

  3. Centre de recherche Microsoft 365 par défaut (ou existant). Vous créez une origine des résultats personnalisée pour ce Centre de recherche qui limite les résultats de recherche pour afficher uniquement le contenu Microsoft 365.

  4. Nouveau Centre de recherche Microsoft 365 où vous validez et optimisez l’affichage des résultats de la recherche hybride. Ce Centre de recherche utilise l’origine des résultats par défaut et indique les résultats de recherche à la fois pour le contenu local et Microsoft 365. Vous configurez l’accès afin que seuls les testeurs et les administrateurs puissent accéder à ce site.

Notes

Même si vous pouvez conserver l’expérience de recherche d’origine intacte pendant le réglage, vous ne pouvez pas conserver l’expérience Office Delve d’origine. Quand les métadonnées provenant du contenu local se trouvent dans l’index de recherche Office 365, Delve affiche ce contenu.

[En savoir plus sur la recherche hybride dans le cloud pour SharePoint dans Microsoft 365](learn-about-cloud-hybrid-search-for-SharePoint in Microsoft 365.md)

Configurer la recherche hybride sur le cloud - feuille de route

Recherche hybride dans SharePoint