Maintenance des machines virtuelles dans Azure

S’applique aux : ✔️ Machines virtuelles Linux ✔️ Machines virtuelles Windows ✔️ Groupes identiques flexibles ✔️ Groupes identiques uniformes

Azure met régulièrement à jour sa plateforme pour améliorer la fiabilité, le niveau de performance et la sécurité de l’infrastructure hôte des machines virtuelles. L’objectif de ces mises à jour comprend l’application d’une mise à jour corrective aux composants logiciels de l’environnement d’hébergement, la mise à niveau des composants réseau et la désactivation du matériel.

Les mises à jour affectent rarement les machines virtuelles hébergées. Lorsque les mises à jour ont un effet, Azure choisit alors la méthode ayant le moins d’impact pour l’exécution des mises à jour :

  • Si une mise à jour sans redémarrage est possible, la machine virtuelle est en pause pendant la mise à jour de l’hôte ou fait l’objet d’une migration dynamique vers un hôte déjà mis à jour.
  • Si la maintenance nécessite un redémarrage, vous êtes averti de la maintenance planifiée. Azure vous permet également de disposer d’un intervalle de temps durant lequel vous pouvez démarrer la maintenance vous-même, au moment qui vous convient. La période de maintenance manuelle est généralement de 35 jours pour les machines hôtes, sauf si la maintenance est urgente. Azure investit dans des technologies qui permettent de réduire le nombre de cas où une maintenance de la plateforme exige que les machines virtuelles soient redémarrées. Pour plus d’informations sur la procédure de gestion de la maintenance planifiée, consultez Gestion des notifications de maintenance planifiée à l’aide d’Azure CLI, de PowerShell ou du portail.

Cette page décrit la façon dont Azure effectue les deux types de maintenance. Pour plus d’informations sur les événements non planifiés (interruptions), consultez Gérer la disponibilité des machines virtuelles pour Windows ou l’article correspondant pour Linux.

Dans une machine virtuelle, vous pouvez recevoir une notification concernant une maintenance à venir à l’aide de Scheduled Events pour Windows ou pour Linux.

Maintenance ne nécessitant aucun redémarrage

La plupart des mises à jour de la plateforme n’affectent pas les machines virtuelles clientes. Lorsqu’une mise à jour sans impact n’est pas possible, Azure choisit alors le mécanisme ayant le moins d’impact pour les machines virtuelles clientes.

La plupart des maintenances ayant un impact mettent la machine virtuelle en pause pendant moins de 10 secondes. Dans certains cas, Azure utilise des mécanismes de maintenance avec préservation de la mémoire. Ces mécanismes mettent en pause la machine virtuelle généralement pendant 30 secondes et préservent la mémoire de la RAM. Une fois la machine virtuelle redémarrée, son horloge est synchronisée automatiquement.

La maintenance avec préservation de la mémoire fonctionne avec plus de 90 % des machines virtuelles Azure. Elle ne fonctionne pas pour les séries G, L, M, N et H. Azure utilise de plus en plus les technologies de migration dynamique et améliore les mécanismes de maintenance avec préservation de la mémoire pour réduire la durée de la mise en pause.

Ces opérations de maintenance qui ne nécessitent pas de redémarrage sont appliquées à un domaine d’erreur à la fois. Elles s’arrêtent si elles reçoivent des signaux d’avertissement d’intégrité de la part des outils de supervision de la plateforme.

Ces types de mise à jour peuvent affecter certaines applications. Lorsque la machine virtuelle fait l’objet d’une migration dynamique vers un autre hôte, certaines charges de travail sensibles peuvent subir une légère détérioration des performances au cours des quelques minutes qui précèdent la mise en pause de la machine virtuelle. Afin de préparer la maintenance de la machine virtuelle et de réduire l’impact sur la maintenance d’Azure, essayez d’utiliser Scheduled Events pour Windows ou Linux sur de telles applications.

Pour un meilleur contrôle sur toutes les activités de maintenance, notamment les mises à jour sans impact et sans redémarrage, vous pouvez créer une fonctionnalité de configuration de maintenance. Une configuration de maintenance vous permet d’ignorer toutes les mises à jour de plateforme et d’appliquer les mises à jour à l’heure de votre choix. Pour plus d’informations, consultez Gestion des mises à jour des plateformes avec des configurations de maintenance.

Migration dynamique

La migration dynamique est une opération qui ne nécessite aucun redémarrage et qui conserve la mémoire pour la machine virtuelle. Elle entraîne une pause ou un blocage qui dure généralement moins de 5 secondes. Toutes les machines virtuelles infrastructure as a service (IaaS) sont éligibles pour la migration dynamique, à l’exception des machines de série G, M, N et H. Les machines virtuelles éligibles représentent plus de 90 % des machines virtuelles IaaS déployées sur la flotte Azure.

Notes

Vous ne recevrez pas de notification sur le portail Azure pour les opérations de migration dynamique qui ne nécessitent pas de redémarrage. Pour afficher la liste des migrations dynamiques qui ne nécessitent pas de redémarrage, interrogez les événements planifiés.

La plateforme Azure démarre la migration dynamique dans les scénarios suivants :

  • Maintenance planifiée
  • Défaillance matérielle
  • Optimisations de l’allocation

Certains scénarios de maintenance planifiée utilisent la migration dynamique. Vous pouvez utiliser Scheduled Events pour connaître à l’avance la date de démarrage des opérations de migration dynamique.

La migration dynamique peut également servir à déplacer des machines virtuelles lorsque les algorithmes d’Azure Machine Learning prédisent une défaillance matérielle imminente ou lorsque vous souhaitez optimiser les allocations de machines virtuelles. Pour plus d’informations sur la modélisation prédictive détectant les instances de matériel détérioré, consultez Améliorer la résilience des machines virtuelles Azure grâce à la migration dynamique et au Machine Learning prédictif. Les notifications de migration dynamique s’affichent sur le portail Azure, dans les journaux Monitor et Service Health ainsi que dans Scheduled Events si vous utilisez ces services.

Maintenance nécessitant un redémarrage

Dans les rares cas où les machines virtuelles doivent redémarrer dans le cadre d’une maintenance planifiée, vous recevez une notification à l’avance. Une maintenance planifiée comprend deux phases : celle de libre-service et celle de maintenance planifiée.

Lors de la phase de libre-service, qui dure généralement quatre semaines, vous démarrez la maintenance sur vos machines virtuelles. Puisqu’il s’agit d’un libre-service, vous pouvez interroger chaque machine virtuelle pour afficher leur état et vérifier le résultat de votre dernière requête de maintenance.

Quand vous démarrez la maintenance libre-service, votre machine virtuelle est redéployée sur un nœud déjà mis à jour. À cause du redémarrage de la machine virtuelle, le disque temporaire est perdu et les adresses IP dynamiques associées à l’interface réseau virtuelle sont mises à jour.

Si vous rencontrez une erreur lors de la maintenance en libre-service, l’opération s’interrompt, la machine virtuelle n’est pas mise à jour et vous aurez la possibilité de retenter la maintenance en libre-service.

Lorsque la phase de libre-service se termine, la phase de maintenance planifiée commence. Pendant cette phase, vous pouvez toujours interroger la phase de maintenance, mais vous ne pouvez pas démarrer la maintenance vous-même.

Pour plus d’informations sur la gestion de la maintenance nécessitant un redémarrage, consultez Gestion des notifications de maintenance planifiée à l’aide d’Azure CLI, de PowerShell ou du portail.

Considérations relatives à la disponibilité lors de la maintenance planifiée

Si vous décidez d’attendre jusqu’à la phase de maintenance planifiée, plusieurs éléments sont à prendre en compte si vous voulez maintenir une haute disponibilité de vos machines virtuelles.

Régions jumelées

Chaque région Azure est jumelée à une autre région de la même zone géographique. Elles constituent une paire de régions. Durant la phase de maintenance planifiée, Azure met uniquement à jour les machines virtuelles d’une seule des régions d’une paire de régions. Par exemple, durant la mise à jour de la machine virtuelle dans la région USA Centre Nord, Azure ne met à jour simultanément aucune machine virtuelle dans la région USA Centre Sud. En revanche, les autres régions, Europe Nord par exemple, peuvent faire l’objet d’une maintenance en même temps que la région USA Est. Comprendre le fonctionnement des paires régionales peut vous aider à mieux répartir vos machines virtuelles entre les régions. Pour en savoir plus, consultez Paires régionales Azure.

Zones de disponibilité

Les Zones de disponibilité sont des emplacements physiques uniques au sein d’une région Azure. Chaque zone de disponibilité est composée d’un ou de plusieurs centres de données équipés d’une alimentation, d’un système de refroidissement et d’un réseau indépendants. Pour garantir la résilience, il existe un minimum de trois zones distinctes dans toutes les régions activées.

Une zone de disponibilité combine un domaine d’erreur et un domaine de mise à jour. Si vous créez trois machines virtuelles ou plus dans trois zones d’une région Azure, vos machines virtuelles sont efficacement réparties sur trois domaines d’erreur et trois domaines de mise à jour. La plateforme Azure reconnaît cette répartition entre les domaines de mise à jour pour vous assurer que les machines virtuelles des différentes zones ne sont pas mises à jour en même temps.

Chaque mise à jour d’infrastructure est déployée par zone au sein d’une seule région. Cependant, le déploiement peut avoir lieu dans une Zone 1, en même temps qu’un autre déploiement dans une Zone 2. Les déploiements ne sont pas tous sérialisés. En revanche, un seul déploiement n’est déployé que sur une zone à la fois afin de limiter les risques.

Groupes identiques de machines virtuelles

Les groupes de machines virtuelles identiques avec orchestration Flexible sont des ressources de calcul Azure qui vous permettent de combiner la scalabilité des groupes de machines virtuelles identiques utilisant le mode d’orchestration Uniform avec les garanties de disponibilité régionale des groupes à haute disponibilité.

Avec l’orchestration Flexible, vous pouvez choisir si vos instances doivent être réparties sur plusieurs zones, ou réparties sur plusieurs domaines d’erreur au sein d’une même région.

Groupes à haute disponibilité et groupes identiques Uniform

Lorsque vous déployez une charge de travail sur des machines virtuelles Azure, vous pouvez créer des machines virtuelles dans un groupe à haute disponibilité afin de fournir une haute disponibilité pour votre application. À l’aide des groupes à haute disponibilité, vous pouvez vous assurer qu’au moins une machine virtuelle est disponible en cas de panne ou d’événements de maintenance nécessitant un redémarrage.

Au sein d’un groupe à haute disponibilité, les machines virtuelles individuelles sont réparties sur un maximum de 20 domaines de mise à jour. Durant la maintenance planifiée, un seul domaine de mise à jour est mis à jour à un moment donné. Les domaines de mise à jour ne sont pas systématiquement mis à jour de façon séquentielle.

Les groupes de machines virtuelles identiques en mode d’orchestration Uniform sont des ressources de calcul Azure que vous pouvez utiliser pour déployer et gérer un ensemble de machines virtuelles identiques comme une seule et même ressource. Le groupe identique est automatiquement déployé dans les domaines de mise à jour, comme les machines virtuelles dans un groupe à haute disponibilité. Comme pour les groupes à haute disponibilité, un seul UD est mis à jour à un moment donné dans les groupes identiques Uniform durant la maintenance planifiée.

Pour plus d’informations sur la configuration de vos machines virtuelles pour la haute disponibilité, consultez Gérer la disponibilité de vos machines virtuelles pour Windows ou l’article correspondant pour Linux.

Étapes suivantes

Vous pouvez utiliser Azure CLI, Azure PowerShell ou le portail pour gérer la maintenance planifiée.