Manutenção de máquinas virtuais no Azure

Aplica-se a: ✔️ VMs ✔️ Linux VMs ✔️ do Windows Conjuntos ✔️ de escala flexíveis Conjuntos de balanças uniformes

O Azure atualiza periodicamente a sua plataforma para melhorar a fiabilidade, o desempenho e a segurança da infraestrutura de anfitrião para máquinas virtuais. O objetivo destas atualizações vai da correção de componentes de software no ambiente anfitrião à atualização de componentes de rede ou desativação de hardware.

As atualizações raramente afetam as VMs alojadas. Quando as atualizações têm efeito, o Azure escolhe o método com menos impacto para as atualizações:

  • Se a atualização não exigir um reinício, a VM será colocada em pausa enquanto o anfitrião é atualizado ou a VM será migrada em direto para um anfitrião já atualizado.
  • Se a manutenção exigir um reinício, será notificado sobre a manutenção planeada. O Azure também fornece uma janela de tempo na qual o utilizador pode iniciar a manutenção, num momento que lhe for conveniente. A janela de automanutenção é normalmente de 35 dias (para máquinas anfitriãs), a menos que a manutenção seja urgente. O Azure está a investir em tecnologias para reduzir o número de casos em que a manutenção planeada da plataforma exige que as VMs sejam reiniciadas. Para obter instruções sobre como gerenciar a manutenção planejada, consulte Manipulando notificações de manutenção planejada usando a CLI do Azure, PowerShell ou portal.

Esta página descreve como o Azure executa ambos os tipos de manutenção. Para obter mais informações sobre eventos não planejados (interrupções), consulte Gerenciar a disponibilidade de VMs para Windows ou o artigo correspondente para Linux.

Dentro de uma VM, você pode receber notificações sobre manutenção futura usando Eventos Agendados para Windows ou Linux.

Manutenção que não requer uma reinicialização

A maioria das atualizações de plataforma não afeta as VMs dos clientes. Quando uma atualização sem impacto não é possível, o Azure escolhe o mecanismo de atualização menos impactante para as VMs do cliente.

Quando a manutenção com impacto na VM é necessária, ela quase sempre será concluída por meio de uma pausa da VM por menos de 10 segundos. Em circunstâncias raras, não mais do que uma vez a cada 18 meses para tamanhos de VM de uso geral, o Azure usa um mecanismo que pausará a VM por cerca de 30 segundos. Após qualquer operação de pausa, o relógio da VM é sincronizado automaticamente após a retomada.

A manutenção de preservação de memória funciona para mais de 90% das VMs do Azure. Não funciona para as séries G, M, N e H. O Azure usa cada vez mais tecnologias de migração ao vivo e melhora os mecanismos de manutenção de preservação de memória para reduzir as durações de pausa.

Essas operações de manutenção que não exigem uma reinicialização são aplicadas um domínio de falha de cada vez. Eles param se receberem sinais de saúde de aviso das ferramentas de monitoramento da plataforma. As operações de manutenção que não exigem uma reinicialização podem ocorrer simultaneamente em regiões emparelhadas ou zonas de disponibilidade. Para uma determinada alteração, a implantação é sequenciada principalmente entre zonas de disponibilidade e entre pares de regiões, mas pode haver sobreposição na cauda.

Esses tipos de atualizações podem afetar alguns aplicativos. Quando a VM é migrada ao vivo para um host diferente, algumas cargas de trabalho confidenciais podem mostrar uma ligeira degradação de desempenho nos poucos minutos que antecedem a pausa da VM. Para se preparar para a manutenção de VM e reduzir o impacto durante a manutenção do Azure, tente usar Eventos Agendados para Windows ou Linux para esses aplicativos.

Para maior controle sobre todas as atividades de manutenção, incluindo atualizações de impacto zero e sem reinicialização, você pode criar um recurso de Configuração de Manutenção. A criação de uma Configuração de Manutenção dá-lhe a opção de ignorar todas as atualizações da plataforma e aplicar as atualizações à sua escolha. Para obter mais informações, consulte Gerenciando atualizações de plataforma com configurações de manutenção.

Migração em direto

A migração ao vivo é uma operação que não requer uma reinicialização e que preserva a memória para a VM. Provoca uma pausa ou congelamento, normalmente não durando mais de 5 segundos. Com exceção das séries G, L, N e H, todas as VMs de infraestrutura como serviço (IaaS) são qualificadas para migração ao vivo. A migração ao vivo está disponível na maioria das SKUs da série M. As VMs qualificadas representam mais de 90% das VMs IaaS implantadas na frota do Azure.

Nota

Você não receberá uma notificação no portal do Azure para operações de migração ao vivo que não exijam uma reinicialização. Para ver uma lista de migrações ao vivo que não exigem uma reinicialização, consulte eventos agendados.

A plataforma Azure inicia a migração ao vivo nos seguintes cenários:

  • Manutenção planeada
  • Falha de hardware
  • Otimizações de alocação

Alguns cenários de manutenção planejada usam migração ao vivo e você pode usar Eventos Agendados para saber com antecedência quando as operações de migração ao vivo serão iniciadas.

A migração ao vivo também pode ser usada para mover VMs quando os algoritmos do Azure Machine Learning preveem uma falha de hardware iminente ou quando você deseja otimizar as alocações de VM. Para obter mais informações sobre a modelagem preditiva que deteta instâncias de hardware degradado, consulte Melhorando a resiliência da VM do Azure com aprendizado de máquina preditivo e migração ao vivo. As notificações de migração ao vivo aparecem no portal do Azure nos logs do Monitor e da Integridade do Serviço, bem como em Eventos Agendados se você usar esses serviços.

Manutenção que requer uma reinicialização

No caso raro em que as VMs precisam ser reinicializadas para manutenção planejada, você será notificado com antecedência. A manutenção planejada tem duas fases: a fase de autoatendimento e a fase de manutenção programada.

Durante a fase de autoatendimento, que normalmente dura quatro semanas, você inicia a manutenção em suas VMs. Como parte do autoatendimento, você pode consultar cada VM para ver seu status e o resultado da sua última solicitação de manutenção.

Nota

Para séries de VM que não oferecem suporte à migração ao vivo, os dados de discos locais (efêmeros) podem ser perdidos durante os eventos de manutenção. Consulte cada série de VMs individual para obter informações sobre se a Migração ao Vivo é suportada.

Quando você inicia a manutenção de autoatendimento, sua VM é reimplantada em um nó já atualizado. Como a VM é reimplantada, o disco temporário é perdido e os endereços IP dinâmicos públicos associados à interface de rede virtual são atualizados.

Se surgir um erro durante a manutenção de autoatendimento, a operação será interrompida, a VM não será atualizada e você terá a opção de repetir a manutenção de autoatendimento.

Quando a fase de autoatendimento termina, a fase de manutenção programada começa. Durante essa fase, você ainda pode consultar a fase de manutenção, mas não pode iniciar a manutenção sozinho.

Para obter mais informações sobre como gerenciar a manutenção que requer uma reinicialização, consulte Manipulando notificações de manutenção planejada usando a CLI do Azure, PowerShell ou portal.

Considerações sobre disponibilidade durante a manutenção programada

Se você decidir esperar até a fase de manutenção agendada, há algumas coisas que você deve considerar para manter a mais alta disponibilidade de suas VMs.

Regiões emparelhadas

Cada região do Azure é emparelhada com outra região dentro da mesma vizinhança geográfica. Em conjunto, formam um par de regiões. Durante a fase de manutenção agendada, o Azure atualiza apenas as VMs numa única região de um par de regiões. Por exemplo, ao atualizar a VM no Centro-Norte dos EUA, o Azure não atualiza nenhuma VM no Centro-Sul dos EUA ao mesmo tempo. No entanto, outras regiões, como a Europa do Norte, podem estar sob manutenção em simultâneo como os E.U.A. Leste. Compreender como os pares de regiões funcionam pode ajudá-lo a distribuir melhor suas VMs entre regiões. Para obter mais informações, consulte Pares de região do Azure.

Zonas de disponibilidade

As zonas de disponibilidade são locais físicos exclusivos dentro de uma região do Azure. Cada zona é composta por um ou mais datacenters equipados com energia, refrigeração e rede independentes. Para garantir a resiliência, há um mínimo de três zonas separadas em todas as regiões ativadas.

Uma zona de disponibilidade é uma combinação de um domínio de falha e um domínio de atualização. Se você criar três ou mais VMs em três zonas em uma região do Azure, suas VMs serão efetivamente distribuídas em três domínios de falha e três domínios de atualização. A plataforma Azure reconhece essa distribuição entre domínios de atualização para garantir que as VMs em zonas diferentes não sejam atualizadas ao mesmo tempo.

Cada atualização de infraestrutura é implantada zona por zona, dentro de uma única região. Mas, você pode ter a implantação acontecendo na Zona 1 e a implantação diferente na Zona 2, ao mesmo tempo. As implantações não são todas serializadas. Mas, uma única implantação que exija uma reinicialização distribui apenas uma zona de cada vez para reduzir o risco. Em geral, as atualizações que exigem uma reinicialização são evitadas quando possível, e o Azure tenta usar a Migração ao Vivo ou fornecer controle aos clientes.

Conjuntos de dimensionamento de máquinas virtuais

Os conjuntos de dimensionamento de máquina virtual no modo de orquestração flexível são um recurso de computação do Azure que permite combinar a escalabilidade de conjuntos de escala de máquina virtual no modo de orquestração uniforme com as garantias de disponibilidade regional dos conjuntos de disponibilidade.

Com a orquestração flexível, você pode escolher se suas instâncias estão espalhadas por várias zonas ou entre domínios de falha em uma única região.

Conjuntos de disponibilidade e conjuntos de escalas uniformes

Ao implantar uma carga de trabalho em VMs do Azure, você pode criar as VMs dentro de um conjunto de disponibilidade para fornecer alta disponibilidade ao seu aplicativo. Utilizando conjuntos de disponibilidade, pode garantir que, durante uma indisponibilidade ou eventos de manutenção que exijam um reinício, pelo menos uma VM esteja disponível.

Dentro de um conjunto de disponibilidade, as VMs individuais são distribuídas em até 20 domínios de atualização. Durante a manutenção agendada, apenas um domínio de atualização é atualizado a qualquer momento. Os domínios de atualização não são necessariamente atualizados sequencialmente.

Os conjuntos de dimensionamento de máquina virtual no modo de orquestração uniforme são um recurso de computação do Azure que você pode usar para implantar e gerenciar um conjunto de VMs idênticas como um único recurso. O conjunto de dimensionamento é implantado automaticamente em UDs, como VMs em um conjunto de disponibilidade. Assim como acontece com os conjuntos de disponibilidade, quando você usa conjuntos de escala uniforme, apenas uma UD é atualizada a qualquer momento durante a manutenção agendada.

Para obter mais informações sobre como configurar suas VMs para alta disponibilidade, consulte Gerenciar a disponibilidade de suas VMs para Windows ou o artigo correspondente para Linux.

Próximos passos

Você pode usar a CLI do Azure, o Azure PowerShell ou o portal para gerenciar a manutenção planejada.