Proteger as VMs implantadas no Azure Stack Hub-resistenteProtect VMs deployed on Azure Stack Hub - Ruggedized

Use este artigo como um guia para desenvolver um plano para proteger máquinas virtuais (VMs) que os usuários implantam no Hub Azure Stack.Use this article as a guide to develop a plan for protecting virtual machines (VMs) that your users deploy on Azure Stack Hub.

Para proteger contra perda de dados e tempo de inatividade não planejado, implemente um plano de proteção de dados e recuperação de desastre para aplicativos baseados em VM no Hub de Azure Stack.To protect against data loss and unplanned downtime, implement a data protection and disaster recovery plan for VM-based applications on Azure Stack Hub. O plano de proteção implementado dependerá dos requisitos de negócios e do design do aplicativo.The protection plan implemented will depend on business requirements and design of the application. Esse plano deve seguir a estrutura estabelecida pela estratégia de ' continuidade de negócios e de recuperação de desastres (BC/DR) abrangente da sua organização.This plan should follow the framework established by your organization's comprehensive business continuity and disaster recovery (BC/DR) strategy. Para obter uma visão geral de alto nível das considerações de BC/DR para Azure Stack Hub, consulte Azure Stack: considerações para continuidade dos negócios e recuperação de desastres.For a high level overview of the BC/DR considerations for Azure Stack Hub, see Azure Stack: Considerations for business continuity and disaster recovery.

Objetivos de recuperação do aplicativoApplication recovery objectives

Determine a quantidade de tempo de inatividade e perda de dados que sua organização pode tolerar para cada aplicativo.Determine the amount of downtime and data loss your organization can tolerate for each application. Ao quantificar o tempo de inatividade e a perda de dados, você pode criar um plano de recuperação que minimiza o impacto de um desastre em sua organização.By quantifying downtime and data loss, you can create a recovery plan that minimizes the impact of a disaster on your organization. Para cada aplicativo, considere:For each application, consider:

  • Objetivo de tempo de recuperação (RTO)Recovery time objective (RTO)
    RTO é o tempo máximo aceitável que um aplicativo pode ficar indisponível após um incidente.RTO is the maximum acceptable time that an app can be unavailable after an incident. Por exemplo, um RTO de 90 minutos significa que você deve ser capaz de restaurar o aplicativo para um estado de execução dentro de 90 minutos desde o início de um desastre.For example, an RTO of 90 minutes means that you must be able to restore the app to a running state within 90 minutes from the start of a disaster. Se você tiver um RTO baixo, poderá manter uma segunda implantação continuamente em execução no modo de espera para proteger contra uma interrupção regional.If you have a low RTO, you might keep a second deployment continually running on standby to protect against a regional outage.

  • Objetivo de ponto de recuperação (RPO)Recovery point objective (RPO)
    RPO é a duração máxima de perda de dados que é aceitável durante um desastre.RPO is the maximum duration of data loss that is acceptable during a disaster. Por exemplo, se você armazenar dados em um único banco de dado cujo backup é feito por hora e não tiver nenhuma replicação para outros bancos de dados, você poderá perder até uma hora.For example, if you store data in a single database which is backed up hourly and has no replication to other databases, you could lose up to an hour of data.

Conduza uma avaliação para definir o RTO e o RPO para cada aplicativo.Conduct an assessment to define the RTO and RPO for each application.

Outra métrica importante a ser considerada é a hora de recuperação (MTTR), que é o tempo médio necessário para restaurar o aplicativo após uma falha.Another important metric to consider is Mean Time to Recover (MTTR), which is the average time that it takes to restore the application after a failure. MTTR é um valor de empírica para um sistema.MTTR is an empirical value for a system. Se MTTR exceder o RTO, uma falha no sistema causará uma interrupção de negócios inaceitável porque ' não é possível restaurar o sistema dentro do RTO definido.If MTTR exceeds the RTO, then a failure in the system will cause an unacceptable business disruption because it won't be possible to restore the system within the defined RTO.

Opções de proteção para VMs IaaSProtection options for IaaS VMs

Backup-restaurarBackup-restore

O esquema de proteção mais comum para aplicativos baseados em VM é usar o software de backup.The most common protection scheme for VM-based apps is to use backup software. O backup de uma VM normalmente inclui o sistema operacional, a configuração do sistema operacional, os binários de aplicativos e os dados de aplicativos persistentes contidos dentro da VM.Backing up a VM typically includes the operating system, operating system configuration, application binaries, and persistent application data contained inside the VM. Os backups são criados usando um agente no sistema operacional convidado para capturar o aplicativo, o sistema operacional ou OS volumes/sistemas de arquivos.The backups are created by using an agent in the guest OS to capture application, OS, or file system/volumes. Outra abordagem é sem agente, contando com a integração com as APIs de Hub Azure Stack para ler informações sobre a configuração da VM e instantâneos dos discos anexados à VM.Another approach is agent-less by relying on integration with Azure Stack Hub APIs to read information about the VM configuration and snapshot the disks attached to the VM. Observe que Azure Stack Hub não dá suporte ao backup diretamente do hipervisor.Please note that Azure Stack Hub does not support backing up directly from the hypervisor.

Planejando sua estratégia de backupPlanning your backup strategy

Planejar sua estratégia de backup e definir requisitos de escala começa com a quantificação do número de instâncias de VM que precisam ser protegidas.Planning your backup strategy and defining scale requirements starts with quantifying the number of VM instances that need to be protected. O backup de todas as VMs no sistema pode não ser a maneira mais eficiente de proteger o aplicativo.Backing up all VMs in the system may not be the most effective way to protect application. Com o Hub de Azure Stack, as VMs em um conjunto de dimensionamento ou conjunto de disponibilidade não devem ser submetidas a backup no nível da VM.With Azure Stack Hub, VMs in a scale-set or availability set should not be backed up at the VM level. Essas VMs são consideradas efêmeras, pois o conjunto de VMs pode ser expandido ou reduzido. O ideal é que todos os dados que precisam ser persistentes estejam em um repositório separado, como um banco de dados ou um repositório de objetos.These VMs are considered ephemeral since the set of VMs can be scaled-in or out. Ideally any data that needs to be persisted is in a separate repository such as a database or object store. Se os aplicativos implantados em uma arquitetura de expansão contiverem dados que devem ser persistentes e protegidos, isso exigirá o backup de nível de aplicativo usando recursos nativos fornecidos pelo aplicativo ou contando com um agente.If the applications deployed in a scale-out architecture contains data that must be persisted and protected, then that will require application level backup using native capabilities provided by the application or by relying on an agent.

Considerações importantes para fazer backup de VMs no Azure Stack:Important considerations for backing up VMs on Azure Stack:

  • CategorizaçãoCategorization
    • Considere um modelo em que os usuários aceitem o backup da VM.Consider a model where users opt into VM backup.
    • Defina um SLA (contrato de nível de serviço) de recuperação com base na prioridade dos aplicativos ou no impacto para os negócios.Define a recovery service level agreement (SLA) based on the priority of the applications or the impact to the business.
  • DimensionarScale
    • Considere backups escalonados ao integrar um grande número de novas VMs (se o backup for necessário).Consider staggered backups when on-boarding a large number of new VMs (if backup is required).
    • Avalie os produtos de backup que podem capturar e transmitir dados de backup com eficiência para minimizar o conteúdo de recursos na solução.Evaluate backup products that can efficiently capture and transmit backup data to minimize resource content on the solution.
    • Avalie os produtos de backup que armazenam com eficiência os dados de backup usando backups incrementais ou diferenciais para minimizar a necessidade de backups completos em todas as VMs no ambiente.Evaluate backup products that efficiently store backup data using incremental or differential backups to minimize the need for full backups across all VMs in the environment.
  • RestaurarRestore
    • Os produtos de backup podem restaurar discos virtuais, dados de aplicativo em uma VM existente ou todo o recurso da VM e discos virtuais associados.Backup products can restore virtual disks, app data within an existing VM, or the entire VM resource and associated virtual disks. O esquema de restauração necessário depende de como você planeja restaurar o aplicativo.The restore scheme you need depends on how you plan to restore the app. Por exemplo, pode ser mais fácil reimplantar o SQL Server de um modelo e, em seguida, restaurar os bancos de dados em vez de restaurar toda a VM ou o conjunto de VMs.For example, it may be easier to redeploy SQL server from a template and then restore the databases instead of restoring the entire VM or set of VMs.

Failover de replicação/manualReplication/manual failover

Uma abordagem alternativa para dar suporte à recuperação é replicar dados para outro ambiente.An alternate approach to supporting recovery is to replicate data to another environment. Os dados podem ser delimitados para o aplicativo, como replicação de banco de dados ou para o sistema operacional no SO convidado usando um agente ou no nível de VM, integrando-se com as APIs de Hub de Azure Stack.The data can be scoped to the application like database replication or to the operating system in the guest OS using an agent, or at the VM level by integrating with Azure Stack Hub APIs. No caso de um desastre, o failover para o local secundário é necessário.In the event of a disaster, failover to the secondary location is required. O failover pode ser tratado nativamente pelo aplicativo, como os grupos de disponibilidade do SQL ou no nível do sistema operacional convidado usando agentes ou tecnologia de cluster, ou no nível da VM usando um produto de proteção.The failover can be handled natively by the application like with SQL Availability Groups or at the guest OS level using agents or cluster technology, or at the VM level using a protection product.

Alta disponibilidade/failover automáticoHigh availability/automatic failover

Os aplicativos que oferecem suporte nativo à alta disponibilidade ou dependem do software de cluster para alcançar alta disponibilidade entre nós podem ser implantados em um grupo de VMs em um hub de Azure Stack ou em várias instâncias de Hub de Azure Stack.Applications that natively support high availability or rely on cluster software to achieve high availability across nodes can be deployed across a group of VMs in one Azure Stack Hub or across multiple Azure Stack Hub instances. Em todos os casos, um nível de balanceamento de carga é necessário para garantir que o tráfego do aplicativo seja roteado corretamente.In all cases, some level of load balancing is required to ensure application traffic is routed correctly. Nessa configuração, o aplicativo pode se recuperar automaticamente de falhas.In this configuration, the application can automatically recover from faults. Para falhas de hardware local, Azure Stack infraestrutura de Hub implementa alta disponibilidade e tolerância a falhas na infraestrutura física.For local hardware faults, Azure Stack Hub infrastructure implements high availability and fault tolerance in the physical infrastructure. Para falhas de nível de computação, Azure Stack Hub usa vários nós em uma unidade de escala em uma configuração N-1.For compute level faults, Azure Stack Hub uses multiple nodes in a scale unit in an N-1 configuration. No nível da VM, os conjuntos de disponibilidade e escala modelam cada nó na unidade de escala como um domínio de falha para garantir a antiafinidade em nível de nó, de modo que as falhas de nó não desfazem um aplicativo distribuído.At the VM level, availability and scale sets model each node in the scale-unit as a fault domain to guarantee node-level anti-affinity so node failures do not take down a distributed application.

Sem proteçãoNo protection

Alguns aplicativos podem não ter dados que precisam ser persistentes.Some applications may not have data that needs to be persisted. Por exemplo, as VMs usadas para desenvolvimento e teste normalmente não ' precisam ser recuperadas.For example, VMs used for development and testing typically don't need to be recovered. Outro exemplo é um aplicativo sem estado que pode ser reimplantado de um pipeline de CI/CD em caso de falha.Another example is a stateless application that can be re-deployed from a CI/CD pipeline in the event of a failure. É importante identificar os aplicativos que não exigem proteção para evitar a proteção desnecessária de VMs.It is important to identify the applications that do not require protection to avoid unnecessarily protecting VMs.

Próximas etapasNext steps

Este artigo forneceu diretrizes gerais para proteger VMs do usuário implantadas em Azure Stack.This article provided general guidelines for protecting user VMs deployed on Azure Stack. Para obter informações sobre como usar os serviços do Azure para proteger as VMs do usuário, consulte:For information about using Azure services to protect user VMs, refer to:

Produtos de parceirosPartner products