Arquitetura da recuperação após desastre do Azure para o Azure

Artigo
02/29/2024

Este artigo descreve a arquitetura, os componentes e os processos usados quando você implanta a recuperação de desastres para máquinas virtuais (VMs) do Azure usando o serviço Azure Site Recovery . Com a configuração de recuperação de desastres, as VMs do Azure replicam continuamente para uma região de destino diferente. Se ocorrer uma interrupção, você poderá fazer failover de VMs para a região secundária e acessá-las a partir daí. Quando tudo estiver funcionando normalmente novamente, você poderá fazer failback e continuar trabalhando no local principal.

Componentes da arquitetura

Os componentes envolvidos na recuperação de desastres para VMs do Azure são resumidos na tabela a seguir.

Componente	Requisitos
VMs na região de origem	Uma das mais VMs do Azure em uma região de origem com suporte. As VMs podem estar executando qualquer sistema operacional suportado.
Armazenamento de VM de origem	As VMs do Azure podem ser gerenciadas ou ter discos não gerenciados espalhados entre contas de armazenamento. Saiba mais sobre o armazenamento suportado do Azure.
Redes VM de origem	As VMs podem estar localizadas em uma ou mais sub-redes em uma rede virtual (VNet) na região de origem. Saiba mais sobre os requisitos de rede.
Conta de armazenamento em cache	Você precisa de uma conta de armazenamento em cache na rede de origem. Durante a replicação, as alterações de VM são armazenadas no cache antes de serem enviadas para o armazenamento de destino. O uso de um cache garante um impacto mínimo nos aplicativos de produção em execução em uma VM. Saiba mais sobre os requisitos de armazenamento em cache.
Recursos de destino	Os recursos de destino são usados durante a replicação e quando ocorre um failover. A Recuperação de Site pode configurar o recurso de destino por padrão ou você pode criá-los/personalizá-los. Na região de destino, verifique se você é capaz de criar VMs e se sua assinatura tem recursos suficientes para suportar tamanhos de VM necessários na região de destino.

Diagrama mostrando a replicação de origem e destino.

Recursos de destino

Quando você habilita a replicação para uma VM, o Site Recovery oferece a opção de criar recursos de destino automaticamente.

Recurso de Destino	Configuração padrão
Subscrição de destino	O mesmo que a assinatura de origem.
Grupo de recursos alvo	O grupo de recursos ao qual as VMs pertencem após o failover. Ele pode estar em qualquer região do Azure, exceto na região de origem. A Recuperação de Site cria um novo grupo de recursos na região de destino, com um sufixo "asr".
Rede virtual de destino	A rede virtual (VNet) na qual as VMs replicadas estão localizadas após o failover. Um mapeamento de rede é criado entre redes virtuais de origem e de destino e vice-versa. O Site Recovery cria uma nova VNet e uma nova sub-rede, com o sufixo "asr".
Conta de armazenamento de destino	Se a VM não usar um disco gerenciado, essa será a conta de armazenamento para a qual os dados serão replicados. O Site Recovery cria uma nova conta de armazenamento na região de destino para espelhar a conta de armazenamento de origem.
Discos gerenciados por réplica	Se a VM usa um disco gerenciado, esses são os discos gerenciados para os quais os dados são replicados. O Site Recovery cria discos gerenciados de réplica na região de armazenamento para espelhar a origem.
Conjuntos de disponibilidade de destino	Conjunto de disponibilidade no qual as VMs replicantes estão localizadas após o failover. O Site Recovery cria um conjunto de disponibilidade na região de destino com o sufixo "asr", para VMs localizadas em um conjunto de disponibilidade no local de origem. Se existir um conjunto de disponibilidade, ele será usado e um novo não será criado.
Zonas de disponibilidade de destino	Se a região de destino oferecer suporte a zonas de disponibilidade, a Recuperação de Site atribuirá o mesmo número de zona usado na região de origem.

Gerir os recursos-alvo

Você pode gerenciar os recursos de destino da seguinte maneira:

Você pode modificar as configurações de destino à medida que habilita a replicação. Observe que a SKU padrão para a VM da região de destino é a mesma que a SKU da VM de origem (ou a próxima melhor SKU disponível em comparação com a SKU da VM de origem). A lista suspensa mostra apenas SKUs relevantes da mesma família que a VM de origem (Gen 1 ou Gen 2).
Você pode modificar as configurações de destino depois que a replicação já estiver funcionando. Semelhante a outros recursos, como o grupo de recursos de destino, o nome do destino e outros, a SKU da VM da região de destino também pode ser atualizada após a replicação estar em andamento. Um recurso que não pode ser atualizado é o tipo de disponibilidade (instância única, conjunto ou zona). Para alterar essa configuração, você precisa desabilitar a replicação, modificar a configuração e, em seguida, reativar.

Política de replicação

Quando você habilita a replicação de VM do Azure, o Site Recovery cria uma nova política de replicação com as configurações padrão resumidas na tabela, por padrão.

Definição de política	Detalhes	Predefinição
Retenção no ponto de recuperação	Especifica por quanto tempo a Recuperação de Site mantém os pontos de recuperação.	Um dia
Frequência de snapshot consistente com aplicativos	Com que frequência a Recuperação de Site tira um instantâneo consistente com o aplicativo.	Zero horas (Desativado)

Gerenciando políticas de replicação

Você pode gerenciar e modificar as configurações das políticas de replicação padrão da seguinte maneira:

Você pode modificar as configurações à medida que habilita a replicação.
Você pode criar uma política de replicação a qualquer momento e, em seguida, aplicá-la quando habilitar a replicação.

Nota

Um período de retenção de ponto de recuperação alto pode ter uma implicação no custo de armazenamento, uma vez que mais pontos de recuperação podem precisar ser salvos.

Consistência de várias VMs

Se quiser que as VMs sejam replicadas juntas e tenham compartilhado pontos de recuperação consistentes com falhas e consistentes com aplicativos no failover, você poderá reuni-las em um grupo de replicação. A consistência de várias VMs afeta o desempenho da carga de trabalho e só deve ser usada para VMs que executam cargas de trabalho que precisam de consistência em todas as máquinas.

Instantâneos e pontos de recuperação

Os pontos de recuperação são criados a partir de instantâneos de discos de VM tirados em um point-in-time específico. Ao fazer failover de uma VM, você usa um ponto de recuperação para restaurar a VM no local de destino.

Ao fazer failover, geralmente queremos garantir que a VM comece sem corrupção ou perda de dados e que os dados da VM sejam consistentes para o sistema operacional e para aplicativos executados na VM. Isso depende do tipo de instantâneos tirados.

O Site Recovery tira instantâneos da seguinte maneira:

A Recuperação de Site obtém instantâneos de dados consistentes com falhas por padrão e instantâneos consistentes com aplicativos se você especificar uma frequência para eles.
Os pontos de recuperação são criados a partir dos snapshots e armazenados de acordo com as configurações de retenção na política de replicação.

Consistência

A tabela a seguir explica diferentes tipos de consistência.

Consistente com a falha

Descrição	Detalhes	Recomendação
Um instantâneo consistente com falhas captura dados que estavam no disco quando o instantâneo foi tirado. Não inclui nada na memória. Ele contém o equivalente aos dados no disco que estariam presentes se a VM falhasse ou o cabo de alimentação fosse retirado do servidor no instante em que o instantâneo foi tirado. Uma falha consistente não garante a consistência de dados para o sistema operacional ou para aplicativos na VM.	O Site Recovery cria pontos de recuperação consistentes com falhas a cada cinco minutos por padrão. Essa configuração não pode ser modificada.	Hoje, a maioria dos aplicativos pode se recuperar bem de pontos consistentes com falhas. Pontos de recuperação consistentes com falhas são suficientes para a replicação de sistemas operacionais e aplicativos como servidores DHCP e servidores de impressão.

Consistente com a aplicação

Descrição	Detalhes	Recomendação
Os pontos de recuperação consistentes com aplicativos são criados a partir de instantâneos consistentes com aplicativos. Um instantâneo consistente com o aplicativo contém todas as informações em um instantâneo consistente com falhas, além de todos os dados na memória e transações em andamento.	Os instantâneos consistentes com o aplicativo usam o VSS (Serviço de Cópias de Sombra de Volume): 1) O Azure Site Recovery usa o método de backup somente cópia (VSS_BT_COPY), que não altera o tempo de backup do log de transações do Microsoft SQL e o número de sequência 2) Quando um instantâneo é iniciado, o VSS executa uma operação de cópia na gravação (COW) no volume. 3) Antes de executar o COW, o VSS informa a cada aplicativo na máquina que ele precisa liberar seus dados residentes na memória para o disco. 4) O VSS permite que o aplicativo de backup/recuperação de desastres (neste caso, o Site Recovery) leia os dados do snapshot e prossiga.	Os instantâneos consistentes com o aplicativo são tirados de acordo com a frequência especificada. Essa frequência deve ser sempre menor do que a definida para reter pontos de recuperação. Por exemplo, se você retiver pontos de recuperação usando a configuração padrão de 24 horas, deverá definir a frequência em menos de 24 horas. Eles são mais complexos e levam mais tempo para serem concluídos do que instantâneos consistentes com falhas. Eles afetam o desempenho de aplicativos executados em uma VM habilitada para replicação.

Processo de replicação

Quando você habilita a replicação para uma VM do Azure, acontece o seguinte:

A extensão do serviço Mobilidade de Recuperação de Site é instalada automaticamente na VM.
A extensão registra a VM com o Site Recovery.
A replicação contínua começa para a VM. As gravações de disco são imediatamente transferidas para a conta de armazenamento em cache no local de origem.
O Site Recovery processa os dados no cache e os envia para a conta de armazenamento de destino ou para os discos gerenciados pela réplica.
Depois que os dados são processados, pontos de recuperação consistentes com falhas são gerados a cada cinco minutos. Os pontos de recuperação consistentes com o aplicativo são gerados de acordo com a configuração especificada na política de replicação.

Diagrama mostrando o processo de replicação, etapa 2.

Processo de replicação

Requisitos de conectividade

As VMs do Azure que você replica precisam de conectividade de saída. O Site Recovery nunca precisa de conectividade de entrada com a VM.

Conectividade de saída (URLs)

Se o acesso de saída para VMs for controlado com URLs, permita essas URLs.

Nome	Comerciais	Administração Pública	Descrição
Armazenamento	`*.blob.core.windows.net`	`*.blob.core.usgovcloudapi.net`	Permite que os dados sejam escritos da VM para a conta de armazenamento em cache na região de origem.
Microsoft Entra ID	`login.microsoftonline.com`	`login.microsoftonline.us`	Fornece autorização e autenticação para os URLs do serviço Site Recovery.
Replicação	`*.hypervrecoverymanager.windowsazure.com`	`*.hypervrecoverymanager.windowsazure.us`	Permite que a VM comunique com o serviço Site Recovery.
Service Bus	`*.servicebus.windows.net`	`*.servicebus.usgovcloudapi.net`	Permite que a VM escreva dados de monitorização e diagnóstico do Site Recovery.
Key Vault	`*.vault.azure.net`	`*.vault.usgovcloudapi.net`	Permite o acesso para habilitar a replicação para máquinas virtuais habilitadas para ADE via portal
Azure Automation	`*.automation.ext.azure.com`	`*.azure-automation.us`	Permite habilitar a atualização automática do agente de mobilidade para um item replicado via portal

Conectividade de saída para intervalos de endereços IP

Para controlar a conectividade de saída para VMs usando endereços IP, permita esses endereços. Observe que os detalhes dos requisitos de conectividade de rede podem ser encontrados no white paper de rede.

Regras da região de origem

Regra	Detalhes	Etiqueta de serviço
Permitir saída HTTPS: porta 443	Permitir intervalos que correspondam a contas de armazenamento na região de origem	Armazenamento.<nome-da-região>
Permitir saída HTTPS: porta 443	Permitir intervalos que correspondam ao ID do Microsoft Entra	AzureActiveDirectory
Permitir saída HTTPS: porta 443	Permita intervalos que correspondam ao Hub de Eventos na região de destino.	EventHub.<nome-da-região>
Permitir saída HTTPS: porta 443	Permitir intervalos que correspondam ao Azure Site Recovery	AzureSiteRecovery
Permitir saída HTTPS: porta 443	Permitir intervalos que correspondam ao Cofre de Chaves do Azure (isso é necessário apenas para habilitar a replicação de máquinas virtuais habilitadas para ADE via portal)	AzureKeyVault
Permitir saída HTTPS: porta 443	Permitir intervalos que correspondam ao Controlador de Automação do Azure (isso é necessário apenas para habilitar a atualização automática do agente de mobilidade para um item replicado via portal)	GuestAndHybridManagement

Regras da região de destino

Regra	Detalhes	Etiqueta de serviço
Permitir saída HTTPS: porta 443	Permitir intervalos que correspondam a contas de armazenamento na região de destino	Armazenamento.<nome-da-região>
Permitir saída HTTPS: porta 443	Permitir intervalos que correspondam ao ID do Microsoft Entra	AzureActiveDirectory
Permitir saída HTTPS: porta 443	Permitir intervalos que correspondam ao Hub de Eventos na região de origem.	EventHub.<nome-da-região>
Permitir saída HTTPS: porta 443	Permitir intervalos que correspondam ao Azure Site Recovery	AzureSiteRecovery
Permitir saída HTTPS: porta 443	Permitir intervalos que correspondam ao Cofre de Chaves do Azure (isso é necessário apenas para habilitar a replicação de máquinas virtuais habilitadas para ADE via portal)	AzureKeyVault
Permitir saída HTTPS: porta 443	Permitir intervalos que correspondam ao Controlador de Automação do Azure (isso é necessário apenas para habilitar a atualização automática do agente de mobilidade para um item replicado via portal)	GuestAndHybridManagement

Controlar o acesso com regras do Grupo de Segurança de Rede

Se você controlar a conectividade de VM filtrando o tráfego de rede de e para redes/sub-redes do Azure usando regras do Grupo de Segurança de Rede, observe os seguintes requisitos:

As regras do Grupo de Segurança de Rede para a região do Azure de origem devem permitir o acesso de saída para o tráfego de replicação.
Recomendamos que você crie regras em um ambiente de teste antes de colocá-las em produção.
Use tags de serviço em vez de permitir endereços IP individuais.
- As tags de serviço representam um grupo de prefixos de endereço IP reunidos para minimizar a complexidade ao criar regras de segurança.
- A Microsoft atualiza automaticamente as etiquetas de serviço ao longo do tempo.

Saiba mais sobre a conectividade de saída para Recuperação de Site e o controle da conectividade com Grupos de Segurança de Rede.

Conectividade para consistência de várias VMs

Se ativar a consistência multi-VM, as máquinas no grupo de replicação comunicam entre si pela porta 20004.

Certifique-se de que não há nenhum dispositivo de firewall bloqueando a comunicação interna entre as VMs pela porta 20004.
Se pretender que as VMs do Linux pertençam a um grupo de replicação, certifique-se de que o tráfego de saída na porta 20004 é aberto manualmente de acordo com as orientações da versão específica do Linux.

Processo de failover

Quando você inicia um failover, as VMs são criadas no grupo de recursos de destino, na rede virtual de destino, na sub-rede de destino e no conjunto de disponibilidade de destino. Durante um failover, você pode usar qualquer ponto de recuperação.

Diagrama mostrando o processo de failover com ambientes de origem e destino.

Próximos passos

Replique rapidamente uma VM do Azure para uma região secundária.