Configurer la récupération d’urgence à grande échelle de machines virtuelles VMware et de serveurs physiques

Article
08/31/2023

Cet article explique comment configurer la récupération d’urgence sur Azure de grands nombres (> 1000) de machines virtuelles VMware locales ou de serveurs physiques locaux dans votre environnement de production à l’aide du service Azure Site Recovery.

Définir votre stratégie de continuité d’activité et reprise d’activité

Dans le cadre de votre stratégie de continuité d’activité et reprise d’activité (BCDR), vous définissez des objectifs de point de récupération (RPO) et des objectifs de délai de récupération (RTO) pour vos applications métier et charges de travail. Un objectif de délai de récupération mesure la période et le niveau de service dans lesquels une application métier ou un processus doivent être restaurés et disponibles afin d’éviter les problèmes de continuité d’activité.

Site Recovery assure la réplication continue des machines virtuelles VMware et des serveurs physiques et implémente un Contrat de niveau de service pour l’objectif de délai de récupération.
Lorsque vous planifiez une récupération d’urgence à grande échelle pour des machines virtuelles VMware et déterminez les ressources Azure dont vous avez besoin, vous pouvez spécifier une valeur RTO qui sera utilisée pour les calculs de capacité.

Meilleures pratiques

Meilleures pratiques générales pour la récupération d’urgence à grande échelle. Ces meilleures pratiques sont décrites plus en détail dans les sections suivantes du document.

Identifier la configuration requise de la cible : estimez les besoins en capacité et ressources d’Azure avant de configurer la récupération d’urgence.
Planifier les composants Site Recovery : déterminez les composants de Site Recovery (serveur de configuration, serveurs de processus) dont vous avez besoin pour atteindre la capacité estimée.
Configurer un ou plusieurs serveurs de processus scale-out : n’utilisez pas le serveur de processus qui s’exécute par défaut sur le serveur de configuration.
Obtenir les dernières mises à jour : l’équipe Site Recovery publie régulièrement de nouvelles versions des composants Site Recovery, et vous devez vous assurer que vous exécutez des versions les plus récentes. À cette fin, suivez les Nouveautés afin d’être informé des mises à jour, et activez et installez les mises à jour au fur et à mesure de leur publication.
Surveiller de manière proactive : une fois la récupération d’urgence opérationnelle, vous devez surveiller de manière proactive l’état et l’intégrité des machines répliquées et des ressources d’infrastructure.
Exercices de récupération d’urgence : vous devez exécuter régulièrement des exercices de récupération d’urgence. Ceux-ci n’ont aucune incidence sur votre environnement de production, mais vous aident à vous assurer que le basculement vers Azure fonctionnera comme prévu le cas échéant.

Collecter les informations pour la planification de la capacité

Collectez des informations sur votre environnement local afin d’évaluer les besoins en capacité de la cible (Azure).

Pour les machines virtuelles VMware, exécutez le Planificateur de déploiement.
Pour les serveurs physiques, collectez les informations manuellement.

Exécuter les Planificateur de déploiement pour les serveurs physiques

Le Planificateur de déploiement vous aide à recueillir des informations sur votre environnement local VMware.

Exécutez le Planificateur de déploiement pendant une période correspondant à un cycle typique pour vos machines virtuelles. Cela permet de générer des estimations et recommandations plus précises.
Nous vous recommandons d’exécuter le Planificateur de déploiement sur le serveur de configuration afin de calculer le débit de celui-ci. Apprenez-en davantage sur la mesure du débit.
Si vous n’avez pas encore de serveur de configuration configuré :
- Consultez la présentation des composants Site Recovery.
- Configurez un serveur de configuration pour pouvoir exécuter le Planificateur de déploiement sur celui-ci.

Ensuite, exécutez le Planificateur comme suit :

Découvrez le Planificateur de déploiement. Vous pouvez télécharger la dernière version à partir du portail ou directement ici.
Examinez les conditions préalables et les dernières mises à jour pour le Planificateur de déploiement, puis téléchargez et extrayez l’outil.
Exécutez le Planificateur de déploiement sur le serveur de configuration.
Générez un rapport pour synthétiser des estimations et recommandations.
Analysez les recommandations du rapport et les estimations de coûts.

Notes

Par défaut, l’outil est configuré pour profiler jusqu’à 1 000 machines virtuelles et générer un rapport sur celles-ci. Vous pouvez modifier cette limite en augmentant la valeur de la clé MaxVMsSupported dans le fichier ASRDeploymentPlanner.exe.config.

Planifier la configuration requise et la capacité de la cible (Azure)

À l’aide des estimations et recommandations rassemblées, vous pouvez planifier les ressources et la capacité de la cible. Si vous avez exécuté le Planificateur de déploiement pour des machines virtuelles VMware, vous pouvez vous aider d’un certain nombre de recommandations de rapport .

Machines virtuelles compatibles : ce nombre permet de déterminer combien de machines virtuelles sont prêtes pour la récupération d’urgence sur Azure. Les recommandations en matière de bande passante réseau et de cœurs Azure sont basées sur ce nombre.
Bande passante réseau requise : notez la bande passante dont vous avez besoin pour la réplication delta de machines virtuelles compatibles.
- Lorsque vous exécutez le planificateur, vous spécifiez l’objectif de point de récupération souhaité exprimé en minutes. Les recommandations vous indiquent la bande passante nécessaire pour respecter cet objectif de point de récupération de 100 % et 90 % du temps.
- Les recommandations en matière de bande passante réseau prennent en compte la bande passante nécessaire pour le nombre total de serveurs de configuration et de serveurs de processus recommandé par le Planificateur.
Cœurs Azure nécessaires : notez le nombre de cœurs dont vous avez besoin dans la région Azure cible, en fonction du nombre de machines virtuelles compatibles. Si vous ne disposez pas de suffisamment de cœurs, lors du basculement, Site Recovery ne pourra pas créer les machines virtuelles Azure requises.
Taille de lot de machines virtuelles recommandée : la taille de lot recommandée est basée sur la capacité à terminer la réplication initiale pour le lot dans les 72 heures par défaut, tout en conservant un objectif de point de récupération de 100 %. La valeur d’heures peut être modifiée.

Vous pouvez utiliser ces recommandations pour planifier les ressources Azure, la bande passante réseau et les lots de machines virtuelles.

Planifier les abonnements et quotas Azure

Nous tenons à nous assurer que les quotas disponibles dans l’abonnement cible sont suffisants pour gérer le basculement.

Tâche	Détails	Action
Vérifier les cœurs	Si les cœurs que compte le quota disponible ne sont pas en nombre égal ou supérieur au nombre total cible au moment du basculement, les basculements échoueront.	Pour les machines virtuelles VMware, vérifiez que l’abonnement cible contient suffisamment de cœurs pour respecter la recommandation du Planificateur de déploiement en matière de cœurs. Pour les serveurs physiques, vérifiez que les cœurs Azure répondent à vos estimations manuelles. Pour vérifier les quotas, dans le portail Azure >Abonnement, cliquez sur Utilisation + quotas. Apprenez-en davantage sur l’augmentation des quotas.
Vérifier les limites de nombre de basculements	Le nombre de basculements ne doit pas dépasser les limites de nombre de basculements de Site Recovery.	Si le nombre de basculements dépasse les limites, vous pouvez ajouter des abonnements pour basculer vers plusieurs abonnements ou augmenter le quota pour un abonnement.

Limites de nombre de basculements

Les limites indiquent le nombre de basculements que Site Recovery prend en charge en une heure, en supposant que chaque machine dispose de trois disques.

Que signifie « conforme » ? Pour démarrer une machine virtuelle Azure, Azure requiert que certains pilotes soient à l’état de démarrage, et que des services tels que DHCP soient configurés pour démarrer automatiquement.

Sur les machines « conformes », ces paramètres sont déjà configurés.
Pour les ordinateurs exécutant Windows, vous pouvez en vérifier la conformité de façon proactive et les rendre conformes si nécessaire. Plus d’informations
Les machines Linux ne sont mises en conformité qu’au moment du basculement.

La machine est-elle conforme pour Azure ?	Limites de machine virtuelle Azure (basculement de disque managé)
Oui	2000
Non	1 000

Les limites supposent qu’un minimum d’autres travaux sont en cours dans la région cible pour l’abonnement.
Certaines régions Azure de petite taille peuvent avoir des limites légèrement inférieures.

Planifier l’infrastructure et la connectivité de machine virtuelle

Après le basculement vers Azure, vous avez besoin que vos charges de travail fonctionnent de la même manière que localement, et que vos utilisateurs puissent accéder aux charges de travail exécutées sur les machines virtuelles Azure.

Apprenez-en davantage sur le basculement de votre infrastructure locale Active Directory ou DNS vers Azure.
Apprenez-en davantage sur la préparation de la connexion aux machines virtuelles Azure après le basculement.

Planifier la capacité et la configuration requise de la source

Il est important que vous disposiez d’un nombre suffisant de serveurs de configuration et de serveurs de processus scale-out pour répondre aux besoins en capacité. Lorsque vous décidez d’opérer votre déploiement à grande échelle, commencez avec un seul serveur de configuration et un seul serveur de processus scale-out. À mesure que vous atteignez les limites prescrites, ajoutez des serveurs.

Notes

Pour les machines virtuelles VMware, le Planificateur de déploiement formule des recommandations sur la configuration et les serveurs de processus dont vous avez besoin. Nous vous recommandons de vous reporter aux tables incluses dans les procédures suivantes au lieu de suivre les recommandations du Planificateur de déploiement.

Configurer un serveur de configuration

La capacité du serveur de configuration dépend du nombre de machines à répliquer, non du taux de variation des données. Pour déterminer si vous avez besoin de serveurs de configuration supplémentaires, utilisez ces limites de machine virtuelle définies.

UC	Mémoire	Disque cache	Limite de machine répliquée
8 processeurs virtuels 2 sockets * 4 cœurs à 2,5 GHz	16 Go	600 Go	Jusqu’à 550 machines En supposant que chaque machine source dispose de trois disques de 100 Go chacun.

Ces limites sont basées sur un serveur de configuration configuré à l’aide d’un modèle OVF.
Les limites sont basées sur l’hypothèse que n’utilisez pas le serveur de processus qui s’exécute par défaut sur le serveur de configuration.

Si vous avez besoin d’ajouter un serveur de configuration, procédez comme suit :

Configurez un serveur de configuration pour la récupération d’urgence de machines virtuelles VMware en utilisant un modèle OVF.
Configurez un serveur de configuration manuellement pour les serveurs physiques ou les déploiements VMware qui ne peuvent pas utiliser de modèle OVF.

Lorsque vous configurez un serveur de configuration, tenez compte de ce qui suit :

Lorsque vous configurez un serveur de configuration, il est important de prendre en compte l’abonnement et le coffre dans lesquels il réside, car ceux-ci ne doivent pas être modifiés après la configuration. Si vous n’avez pas besoin de modifier le coffre, vous devez en dissocier le serveur de configuration, puis le réinscrire. Cela a pour effet d’arrêter la réplication des machines virtuelles dans le coffre.
Si vous souhaitez configurer un serveur de configuration avec plusieurs cartes réseau, vous devez le faire pendant la configuration. Vous ne pouvez pas le faire après l’inscription du serveur de configuration dans le coffre.

Configurer un serveur de processus

La capacité du serveur de processus dépend des taux de variation des données, non du nombre de machines activées pour la réplication.

Pour les déploiements de grande envergure, vous devez toujours avoir au moins un serveur de processus scale-out.
Pour déterminer si vous avez besoin de serveurs supplémentaires, reportez-vous au tableau suivant.
Nous vous recommandons d’ajouter un serveur répondant à la spécification la plus élevée.

UC	Mémoire	Disque cache	Taux de variation
12 processeurs virtuels 2 sockets * 6 cœurs à 2,5 GHz	24 Go	1 To	Jusqu’à 2 To par jour

Configurez le serveur de processus comme suit :

Examinez les conditions préalables.
Installez le serveur via le portail ou à partir de la ligne de commande.
Configurez des machines répliquées pour utiliser le nouveau serveur. Si vous avez déjà des machines qui répliquent :
- Vous pouvez déplacer toute la charge de travail d’un serveur de processus vers le nouveau serveur de processus.
- Vous pouvez également déplacer des machines virtuelles spécifiques vers le nouveau serveur de processus.

Activer la réplication à grande échelle

Après avoir planifié la capacité et déployé les composants et l’infrastructure requis, activez la réplication pour de grands nombres de machines virtuelles.

Triez les machines en lots. Vous activez la réplication pour les machines virtuelles d’un lot, puis passez au lot suivant.
- Pour les machines virtuelles VMware, vous pouvez utiliser la taille de lot de machines virtuelles recommandée dans le rapport du Planificateur de déploiement.
- Pour les machines physiques, nous vous recommandons de constituer des lots basés sur l’homogénéité de la taille et de la quantité de données des machines, ainsi que sur le débit réseau disponible. L’objectif est d’obtenir des lots de machines susceptibles d’accomplir leur réplication initiale à peu près dans le même temps.
Si l’attrition de disque d’une machine est élevée ou dépasse les limites préconisées par le Planificateur de déploiement, vous pouvez déplacer les fichiers non critiques que vous n’avez pas besoin de répliquer (tels que les vidages de journaux ou les fichiers temporaires) hors de la machine. Pour les machines virtuelles VMware, vous pouvez déplacer ces fichiers vers un disque séparé, puis exclure ce disque de la réplication.
Avant d’activer la réplication, vérifiez que les machines répondent aux exigences de réplication.
Configurez une stratégie de réplication pour des machines virtuelles VMware ou des serveurs physiques.
Activez la réplication pour des machines virtuelles VMware ou des serveurs physiques. Cela a pour effet de lancer la réplication initiale pour les machines sélectionnées.

Surveiller votre déploiement

Une fois la réplication lancée pour le premier lot de machines virtuelles, démarrez la surveillance de votre déploiement comme suit :

Affectez un administrateur de récupération d’urgence pour surveiller l’état d’intégrité des machines répliquées.
Surveillez les événements pour les éléments et l’infrastructure répliqués.
Surveillez l’intégrité de vos serveurs de processus scale-out.
Inscrivez-vous pour recevoir des notifications par e-mail concernant les événements, afin de faciliter la surveillance.
Exécutez des exercices de récupération d’urgence pour vous assurer que tout fonctionne comme prévu.

Planifier des basculements à grande échelle

En cas d’urgence, il se peut que vous deviez basculer un grand nombre de machines/charges de travail vers Azure. Préparez-vous à ce type d’événement comme suit.

Vous pouvez vous préparer au basculement comme suit :

Préparez votre infrastructure et vos machines virtuelles de telle sorte que vos charges de travail soient disponibles après le basculement et que les utilisateurs puissent accéder aux machines virtuelles Azure.
Vérifiez les limites de nombre de basculements plus haut dans ce document. Assurez-vous que vos basculements s’inscrivent dans ces limites.
Effectuez régulièrement des exercices de récupération d’urgence. Les exercices sont utiles pour :
- Trouver les lacunes dans votre déploiement avant le basculement.
- Estimer l’objectif de délai de récupération de bout en bout pour vos applications.
- Estimer l’objectif de point de récupération de bout en bout pour vos applications.
- Identifier des conflits de plage d’adresses IP.
- Nous vous recommandons de ne pas utiliser de réseaux de production pour les exercices et de nettoyer les tests de basculements après chaque exercice.

Pour exécuter un basculement à grande échelle, nous recommandons de procéder comme suit :

Créez des plans de récupération pour le basculement de charge de travail.
- Chaque plan de récupération peut déclencher le basculement de jusqu’à 100 machines.
- Découvrez d’autres informations sur les plans de récupération.
Ajoutez des scripts de runbook Azure Automation aux plans de récupération pour automatiser toutes les tâches manuelles sur Azure. Les tâches typiques incluent la configuration d’équilibreurs de charge, la mise à jour de DNS, etc. En savoir plus
Avant le basculement, préparez les machines Windows afin qu’elles soient conformes à l’environnement Azure. Les limites de nombre de basculements sont plus élevées pour les machines conformes. Apprenez-en davantage sur les runbooks.
Déclenchez le basculement avec la cmdlet PowerShell Start-AzRecoveryServicesAsrPlannedFailoverJob, ainsi qu’un plan de récupération.

Étapes suivantes

Surveiller Site Recovery

Share via