Error y recuperación ante desastres para aplicaciones de AzureFailure and disaster recovery for Azure applications

Recuperación ante desastres es el proceso de restaurar la funcionalidad de la aplicación de la reactivación de una pérdida catastrófica.Disaster recovery is the process of restoring application functionality in the wake of a catastrophic loss.

La tolerancia de funcionalidad reducida durante un desastre es una decisión empresarial que varía de una aplicación a la siguiente.Your tolerance for reduced functionality during a disaster is a business decision that varies from one application to the next. Podría ser aceptable para algunas aplicaciones que no esté completamente disponible o esté disponible parcialmente con funcionalidad reducida o procesamiento durante un período de tiempo diferido.It might be acceptable for some applications to be completely unavailable or to be partially available with reduced functionality or delayed processing for a period of time. Para otras aplicaciones, no es aceptable cualquier funcionalidad reducida.For other applications, any reduced functionality is unacceptable.

Plan de recuperación ante desastresDisaster recovery plan

Empiece por crear un plan de recuperación.Start by creating a recovery plan. El plan se considera completado después de que haya probado por completo.The plan is considered complete after it has been fully tested. Incluyen personas, procesos y aplicaciones necesarias para restaurar la funcionalidad en el acuerdo de nivel de servicio (SLA) que haya definido para los clientes.Include the people, processes, and applications needed to restore functionality within the service-level agreement (SLA) you've defined for your customers.

Tenga en cuenta las sugerencias siguientes al crear y probar el plan de recuperación ante desastres:Consider the following suggestions when creating and testing your disaster recovery plan:

  • En el plan, incluya el proceso para ponerse en contacto con soporte técnico y escalar los problemas.In your plan, include the process for contacting support and for escalating issues. Esta información le ayudará a evitar tiempos de inactividad prolongado mientras trabaja por primera vez el proceso de recuperación.This information will help to avoid prolonged downtime as you work out the recovery process for the first time.
  • Evalúe el impacto de negocio de los errores de las aplicaciones.Evaluate the business impact of application failures.
  • Elija una arquitectura de recuperación entre regiones para las aplicaciones críticas.Choose a cross-region recovery architecture for mission-critical applications.
  • Designe un propietario específico del plan de recuperación ante desastres, incluida la automatización y las pruebas.Identify a specific owner of the disaster recovery plan, including automation and testing.
  • Documenta el proceso, especialmente en los pasos manualmente.Document the process, especially any manual steps.
  • Automatizar el proceso tanto como sea posible.Automate the process as much as possible.
  • Establecer una estrategia de copia de seguridad para todas las referencia y los datos transaccionales y restauración de copia de seguridad de prueba con regularidad.Establish a backup strategy for all reference and transactional data, and test backup restoration regularly.
  • Configurar alertas para la pila de los servicios de Azure utilizados por la aplicación.Set up alerts for the stack of the Azure services consumed by your application.
  • Entrenar al personal de operaciones para ejecutar el plan.Train operations staff to execute the plan.
  • Realizar simulaciones de desastres periódicas para validar y mejorar el plan.Perform regular disaster simulations to validate and improve the plan.

Si usas Azure Site Recovery para replicar máquinas virtuales (VM), cree un plan de recuperación totalmente automatizada para conmutar por error toda la aplicación.If you're using Azure Site Recovery to replicate virtual machines (VMs), create a fully automated recovery plan to fail over the entire application.

Respuestas manualesManual responses

Aunque la automatización es ideal, algunas estrategias de recuperación ante desastres requieren respuestas manuales.Although automation is ideal, some strategies for disaster recovery require manual responses.

AlertasAlerts

Supervise la aplicación para detectar señales de advertencia que puedan requerir una intervención proactiva.Monitor your application for warning signs that may require proactive intervention. Por ejemplo, si Azure SQL Database o Azure Cosmos DB limita constantemente la aplicación, es posible que deba aumentar su capacidad de la base de datos u optimizar las consultas.For example, if Azure SQL Database or Azure Cosmos DB consistently throttles your application, you might need to increase your database capacity or optimize your queries. Aunque la aplicación puede tratar los errores de limitación de forma transparente, la telemetría debería generar una alerta para que pueda realizar el seguimiento.Even though the application might handle the throttling errors transparently, your telemetry should still raise an alert so that you can follow up.

Para los límites de servicio y los umbrales de cuota, se recomienda configurar alertas en los recursos de Azure las métricas y registros de diagnóstico.For service limits and quota thresholds, we recommend configuring alerts on Azure resources metrics and diagnostics logs. Cuando sea posible, configure alertas en métricas, que son una menor latencia que los registros de diagnóstico.When possible, set up alerts on metrics, which are lower latency than diagnostics logs.

A través de Resource Health, Azure proporciona comprobaciones de estado que pueden ayudarle a diagnosticar problemas de limitación del servicio Azure de algún estado integrada.Through Resource Health, Azure provides some built-in health status checks that can help you diagnose Azure service throttling issues.

Conmutación por errorFailover

Configurar una estrategia de recuperación ante desastres para cada aplicación de Azure y sus servicios de Azure.Configure a disaster recovery strategy for each Azure application and its Azure services. Estrategias de implementación aceptable para admitir la recuperación ante desastres pueden variar según los SLA necesarios para todos los componentes de cada aplicación.Acceptable deployment strategies to support disaster recovery may vary based on the SLAs required for all components of each application.  

Azure proporciona diferentes características de muchos servicios de Azure para permitir la conmutación por error manual, como redis caché georréplicas, o para la conmutación por error, como grupos de conmutación por error automática de SQL.Azure provides different features within many Azure services to allow for manual failover, such as redis cache geo-replicas, or for automated failover, such as SQL auto-failover groups. Por ejemplo:For example:

  • Para una aplicación que utiliza, principalmente, las máquinas virtuales, puede usar Azure Site Recovery para los niveles web y lógica.For an application that mainly uses virtual machines, you can use Azure Site Recovery for the web and logic tiers. Para obtener más información, consulte arquitectura de recuperación ante desastres en Azure.For more information, see Azure to Azure disaster recovery architecture. SQL Server en máquinas virtuales, utilice grupos de disponibilidad de SQL Server Always On.For SQL Server on VMs, use SQL Server Always On availability groups.
  • Para una aplicación que usa App Service y Azure SQL Database, puede usar un plan de App Service de nivel más pequeño configurado en la región secundaria, que escala automáticamente cuando se produce una conmutación por error.For an application that uses App Service and Azure SQL Database, you can use a smaller tier App Service plan configured in the secondary region, which autoscales when a failover occurs. Usar grupos de conmutación por error para el nivel de base de datos.Use failover groups for the database tier.

En cualquier caso, un Azure Traffic Manager perfil proporciona para la conmutación por error automatizada entre regiones.In either scenario, an Azure Traffic Manager profile provides for the automated failover across regions. Los equilibradores de cargaapplication Gateway debe configurarse en la región secundaria para admitir una disponibilidad más rápida en la conmutación por error.Load balancers or application gateways should be set up in the secondary region to support faster availability on failover.

Las pruebas de preparación operativaOperational readiness testing

Realice una prueba de preparación operativa para conmutación por error a la región secundaria y la conmutación por recuperación a la región primaria.Perform an operational readiness test for failover to the secondary region and for failback to the primary region. Muchos servicios de Azure admiten la conmutación por error manual o la conmutación por error de prueba para maniobras de recuperación ante desastres.Many Azure services support manual failover or test failover for disaster recovery drills. Como alternativa, puede simular una interrupción al apagar o quitar servicios de Azure.Alternatively, you can simulate an outage by shutting down or removing Azure services.

Error de la aplicaciónApplication failure

Errores de aplicación son recuperable o irrecuperable.Application failures are either recoverable or nonrecoverable. Puede mitigar un error recuperable, pero los errores irrecuperables desactivan la aplicación.You can mitigate a recoverable error, but nonrecoverable errors will bring down the application.

  • Algunos errores pueden tratarse de forma transparente mediante el control de errores automáticamente y realizando acciones alternativas.Some failures can be addressed transparently by handling faults automatically and taking alternate actions. Por ejemplo, Traffic Manager controla automáticamente los errores producidos en el software de hardware o sistema operativo subyacente de la máquina virtual host.For example, Traffic Manager automatically handles failures that result from the underlying hardware or operating system software in the host virtual machine.
  • Con algunos errores, la aplicación puede seguir a controlar las solicitudes de usuario con funcionalidad reducida.With some errors, the application can continue handling user requests with reduced functionality.
  • Las interrupciones del servicio más graves podrían representar la aplicación no está disponible.More severe service disruptions might render the application unavailable.

Un sistema bien diseñado separa las responsabilidades en el nivel de servicio — en tiempo de diseño y en tiempo de ejecución.A well-designed system separates responsibilities at the service level — at design time and at runtime. Esta separación evita una interrupción del servicio dependiente desactive toda la aplicación.This separation prevents a dependent service disruption from bringing down the entire application. Por ejemplo, considere una aplicación web de comercio electrónico con los siguientes módulos:For example, consider a web commerce application with the following modules:

AGREGAR VÍNCULO A IMÁGENES

Si la base de datos para hospedar los pedidos deja de funcionar, el servicio de procesamiento de pedidos no puede procesar las transacciones de ventas.If the database for hosting orders goes down, the Order Processing service can't process sales transactions. Dependiendo de la arquitectura, podría ser imposible que los servicios de envío del pedido y procesamiento de pedidos continuar.Depending on the architecture, it might be impossible for the Order Submission and Order Processing services to continue. Sin embargo, si los datos de product se almacenan en una ubicación diferente, el catálogo de productos sigue estando disponible, aunque otras partes de la aplicación podrían no estar disponibles.However, if product data is stored in a different location, the Product Catalog is still available, even though other parts of the application might be unavailable.

Depende de las notificaciones adecuadas en el sistema de compilación y determinar cómo informará la aplicación a los usuarios de los problemas temporales.It's up to you to determine how the application will inform users of any temporary problems and to build appropriate notifications into the system. En el ejemplo anterior, podría permitir la aplicación para ver los productos y agregarlos a un carro de la compra.In the previous example, the application might allow for viewing products and for adding them to a shopping cart. Sin embargo, cuando el cliente intenta realizar una compra, la aplicación debe notificarlos a la funcionalidad de ordenación no está disponible temporalmente.However, when the customer attempts to make a purchase, the application should notify them that the ordering functionality is temporarily unavailable. Aunque no es ideal para el cliente, este enfoque evita una interrupción del servicio de toda la aplicación.Although not ideal for the customer, this approach prevents an application-wide service disruption.

Restauración y daños en los datosData corruption and restoration

Si se produce un error en un almacén de datos, puede haber incoherencias en los datos cuando vuelva a estar disponible, especialmente si los datos se replican.If a data store fails, there might be data inconsistencies when it becomes available again, especially if the data was replicated. Descripción del objetivo de tiempo de recuperación (RTO) y recuperación (RPO) de los almacenes de datos replicadas puede ayudar a predecir la cantidad de pérdida de datos de punto de recuperación.Understanding the recovery time objective (RTO) and recovery point objective (RPO) of replicated data stores can help you predict the amount of data loss.

Para entender si se inicia la conmutación por error de interregional manual o por Microsoft, revisar los SLA de servicio de Azure.To understand whether the cross-regional failover is started manually or by Microsoft, review the Azure service SLAs. Para los servicios con ningún SLA para interregional conmutación por error, Microsoft normalmente decide cuándo conmutar por error y normalmente da prioridad a la recuperación de datos en la región primaria.For services with no SLAs for cross-regional failover, Microsoft typically decides when to fail over and usually prioritizes recovery of data in the primary region. Si los datos en la región primaria se consideran irrecuperables, Microsoft se conmuta en la región secundaria.If data in the primary region is deemed unrecoverable, Microsoft fails over to the secondary region.

Restaurar datos a partir de copias de seguridadRestoring data from backups

Las copias de seguridad protección contra la pérdida de un componente de la aplicación debido a la eliminación accidental o daños en los datos.Backups protect you from losing a component of the application because of accidental deletion or data corruption. Conserva una versión funcional del componente de un momento anterior, que puede utilizar para restaurarla.They preserve a functional version of the component from an earlier time, which you can use to restore it.

Estrategias de recuperación ante desastres no son un reemplazo para las copias de seguridad, pero las copias de seguridad periódicas de los datos de aplicación admiten algunos escenarios de recuperación ante desastres.Disaster recovery strategies are not a replacement for backups, but regular backups of application data support some disaster recovery scenarios. Las opciones de almacenamiento de copia de seguridad deben basarse en su estrategia de recuperación ante desastres.Your backup storage choices should be based on your disaster recovery strategy.

La frecuencia de ejecución del proceso de copia de seguridad determina el RPO.The frequency of running the backup process determines your RPO. Por ejemplo, si realiza copias de seguridad por hora y dos minutos antes de la copia de seguridad se produce un desastre, perderá 58 minutos de datos.For example, if you perform hourly backups and a disaster occurs two minutes before the backup, you will lose 58 minutes of data. El plan de recuperación ante desastres debe incluir la forma de redirigir datos perdidos.Your disaster recovery plan should include how you will address lost data.

Es común para los datos en un almacén de datos a los datos de referencia en otro almacén.It's common for data in one data store to reference data in another store. Por ejemplo, considere la posibilidad de una base de datos de SQL con una columna que se vincula a un blob de Azure Storage.For example, consider a SQL Database with a column that links to a blob in Azure Storage. Si las copias de seguridad no se realizan simultáneamente, la base de datos puede tener un puntero a un blob que no era una copia de seguridad antes del error.If backups don't happen simultaneously, the database might have a pointer to a blob that wasn't backed up before the failure. La aplicación o el plan de recuperación ante desastres debe implementar procesos que controlen esta incoherencia tras una recuperación.The application or the disaster recovery plan must implement processes to handle this inconsistency after a recovery.

Nota

En algunos escenarios, como los de máquinas virtuales de copia de seguridad con Azure Backup, puede restaurar solo desde una copia de seguridad en la misma región.In some scenarios, such as that of VMs backed up using Azure Backup, you can restore only from a backup in the same region. Otros servicios de Azure, como caché de Azure para Redis, proporcionar copias con replicación geográfica, que puede usar para restaurar los servicios entre regiones.Other Azure services, such as Azure Cache for Redis, provide geo-replicated backups, which you can use to restore services across regions.

Almacenamiento de Azure y Azure SQL DatabaseAzure Storage and Azure SQL Database

Azure almacena automáticamente datos de base de datos de SQL y Azure Storage tres veces dentro de distintos dominios de error en la misma región.Azure automatically stores Azure Storage and SQL Database data three times within different fault domains in the same region. Si utiliza la replicación geográfica, los datos se almacenan tres veces más en una región distinta.If you use geo-replication, the data is stored three additional times in a different region. Sin embargo, si los datos se daña o se elimina de la copia principal (por ejemplo, debido a errores de usuario), los cambios se repliquen a las demás copias.However, if the data is corrupted or deleted in the primary copy (for example, because of user error), the changes replicate to the other copies.

Tiene dos opciones para administrar los posibles datos dañados o eliminación:You have two options for managing potential data corruption or deletion:

  • Cree una estrategia de copia de seguridad personalizada.Create a custom backup strategy. Puede almacenar las copias de seguridad en Azure o en local, según sus necesidades empresariales y las regulaciones gubernamentales.You can store your backups in Azure or on-premises, depending on your business requirements and governance regulations.
  • Utilice la opción de restauración en un momento para recuperar una base de datos de SQL.Use the point-in-time restore option to recover a SQL Database.

Recuperación del almacenamiento de AzureAzure Storage recovery

Puede desarrollar un proceso de copia de seguridad personalizado para el almacenamiento de Azure o use una de las muchas herramientas de copia de seguridad de terceros.You can develop a custom backup process for Azure Storage or use one of many third-party backup tools.

Almacenamiento de Azure ofrece resistencia de datos mediante réplicas automatizadas, pero no impide que el código de aplicación o los usuarios dañen datos.Azure Storage provides data resiliency through automated replicas, but it doesn't prevent application code or users from corrupting data. Mantiene los datos de fidelidad después del error de aplicación o un usuario requiere técnicas más avanzadas, como copiar los datos a una ubicación de almacenamiento secundaria con un registro de auditoría.Maintaining data fidelity after application or user error requires more advanced techniques, such as copying the data to a secondary storage location with an audit log. Tiene varias opciones:You have several options:

  • Blobs en bloques.Block blobs. Cree una instantánea de un momento dado de cada blob en bloques.Create a point-in-time snapshot of each block blob. Para cada instantánea, se le cobrará solo por el almacenamiento necesario para almacenar las diferencias en el blob desde el estado de la instantánea anterior.For each snapshot, you are charged only for the storage required to store the differences within the blob since the previous snapshot state. Las instantáneas son dependientes en el blob original, por lo que recomendamos copiar a otro blob o incluso a otra cuenta de almacenamiento.The snapshots are dependent on the original blob, so we recommend copying to another blob or even to another storage account. Este enfoque garantiza que los datos de copia de seguridad está protegidos contra eliminación accidental.This approach ensures that backup data is protected against accidental deletion. Use AzCopy o Azure PowerShell para copiar los blobs en otra cuenta de almacenamiento.Use AzCopy or Azure PowerShell to copy the blobs to another storage account.

    Para obtener más información, consulte Crear una instantánea de un blob.For more information, see Creating a Snapshot of a Blob.

  • Archivos de Azure.Azure Files. Use compartir instantáneas, AzCopy o PowerShell para copiar los archivos a otra cuenta de almacenamiento.Use share snapshots, AzCopy, or PowerShell to copy your files to another storage account.

  • Azure Table storage.Azure Table storage. Use AzCopy para exportar los datos de tablas a otra cuenta de almacenamiento de otra región.Use AzCopy to export the table data into another storage account in another region.

Recuperación de base de datos SQLSQL Database recovery

Para proteger su negocio frente a pérdidas de datos, base de datos SQL automáticamente realiza una combinación de copias de seguridad completas semanales, copias de seguridad diferenciales cada hora, registro de transacciones y copias de seguridad cada 5 a 10 minutos.To protect your business from data loss, SQL Database automatically performs a combination of full database backups weekly, differential database backups hourly, and transaction log backups every 5 to 10 minutes. Los niveles básico, estándar y Premium de SQL Database, use punto-in-time restore para restaurar una base de datos a un momento anterior.For the Basic, Standard, and Premium SQL Database tiers, use point-in-time restore to restore a database to an earlier time. Para obtener más información, consulte los siguientes artículos:See the following articles for more information:

Otra opción es usar la replicación geográfica activa para SQL Database, que replica automáticamente los cambios de la base de datos en bases de datos secundarias en la misma u otra región de Azure.Another option is to use active geo-replication for SQL Database, which automatically replicates database changes to secondary databases in the same or different Azure region. Para obtener más información, consulte creación y uso de replicación geográfica activa.For more information, see Creating and using active geo-replication.

También puede usar un enfoque más manual para copia de seguridad y restauración:You can also use a more manual approach for backup and restore:

  • Use la copiar base de datos comando para crear una copia de seguridad de la base de datos con coherencia transaccional.Use the DATABASE COPY command to create a backup copy of the database with transactional consistency.
  • Use el servicio de Import/Export de Azure SQL Database, que permite exportar bases de datos a los archivos BACPAC (archivos comprimidos que contienen el esquema de base de datos y los datos asociados) que se almacenan en Azure Blob storage.Use the Azure SQL Database Import/Export Service, which supports exporting databases to BACPAC files (compressed files containing your database schema and associated data) that are stored in Azure Blob storage. Para protegerse contra una interrupción del servicio de toda la región, copie los archivos BACPAC en una región alternativa.To protect against a region-wide service disruption, copy the BACPAC files to an alternate region.

SQL Server en máquinas virtualesSQL Server on VMs

Para SQL Server que se ejecutan en máquinas virtuales, tiene dos opciones: copias de seguridad tradicionales y trasvase de registros.For SQL Server running on VMs, you have two options: traditional backups and log shipping.

  • Con las copias de seguridad tradicionales, puede restaurar a un momento dado, pero el proceso de recuperación es lento.With traditional backups, you can restore to a specific point in time, but the recovery process is slow. La restauración de copias de seguridad tradicionales requiere que comience con una copia de seguridad completa inicial y, a continuación, aplicar las copias de seguridad incrementales.Restoring traditional backups requires that you start with an initial full backup and then apply any incremental backups.
  • Puede configurar una sesión de trasvase de registros del registro para retrasar la restauración de copias de seguridad del registro.You can configure a log shipping session to delay the restore of log backups. Esto proporciona un tiempo para recuperarse de errores en la réplica principal.This provides a window to recover from errors made on the primary replica.

Azure Database for MySQL y Azure Database for PostgreSQLAzure Database for MySQL and Azure Database for PostgreSQL

En Azure Database for MySQL y -Azure Database for PostgreSQL, el servicio de base de datos realiza automáticamente una copia de seguridad cada cinco minutos.In Azure Database for MySQL and Azure Database for PostgreSQL, the database service automatically makes a backup every five minutes. Puede utilizar estas copias de seguridad automatizadas para restaurar el servidor y sus bases de datos desde un punto anterior en el tiempo a un nuevo servidor.You can use these automated backups to restore the server and its databases from an earlier point in time to a new server. Para más información, consulte:For more information, see:

Azure Cosmos DBAzure Cosmos DB

COSMOS DB realiza automáticamente una copia de seguridad a intervalos regulares.Cosmos DB automatically makes a backup at regular intervals. Las copias de seguridad se almacenan por separado en otro servicio de almacenamiento y se replican globalmente para protegerse frente a desastres regionales.Backups are stored separately in another storage service and are replicated globally to protect against regional disasters. En caso de que elimine accidentalmente su base de datos o colección, puede presentar una incidencia de soporte técnico o llamar al servicio de soporte técnico de Azure para restaurar los datos a partir de la copia de seguridad automática más reciente.If you accidentally delete your database or collection, you can file a support ticket or call Azure support to restore the data from the last automatic backup. Para obtener más información, consulte Online backup y restore de petición en Azure Cosmos DB.For more information, see Online backup and on-demand restore in Azure Cosmos DB.

Azure Virtual MachinesAzure Virtual Machines

Para proteger las máquinas virtuales de Azure de errores de aplicación o la eliminación accidental, use Azure Backup.To protect Azure Virtual Machines from application errors or accidental deletion, use Azure Backup. Las copias de seguridad creados son coherentes en varios discos de máquina virtual.The created backups are consistent across multiple VM disks. Además, el almacén de copia de seguridad de Azure se puede replicar entre regiones para admitir la recuperación de pérdidas regionales.In addition, the Azure Backup vault can be replicated across regions to support recovery from a regional loss.

Interrupción de la redNetwork outage

Cuando las partes de la red de Azure son inaccesibles, no puede tener acceso a la aplicación o sus datos.When parts of the Azure network are inaccessible, you might not be able to access your application or data. En esta situación, se recomienda diseñar la estrategia de recuperación ante desastres para ejecutar la mayoría de las aplicaciones con funcionalidad reducida.In this situation, we recommend designing the disaster recovery strategy to run most applications with reduced functionality.

Si reducir la funcionalidad no es una opción, las opciones restantes son tiempo de inactividad de aplicación o conmutación por error a una región alternativa.If reducing functionality isn't an option, the remaining options are application downtime or failover to an alternate region.

En un escenario de funcionalidad reducida:In a reduced functionality scenario:

  • Si la aplicación no puede tener acceso a sus datos debido a una interrupción de red de Azure, puede ejecutar localmente con funcionalidad reducida de la aplicación mediante el uso de datos almacenados en caché.If your application can't access its data because of an Azure network outage, you might be able to run locally with reduced application functionality by using cached data.
  • Podría ser capaz de almacenar datos en una ubicación alternativa hasta que se restaure la conectividad.You might be able to store data in an alternate location until connectivity is restored.

Error de servicio dependienteDependent service failure

Para cada servicio dependiente, debe comprender las implicaciones de una interrupción del servicio y la manera en que responderá la aplicación.For each dependent service, you should understand the implications of a service disruption and the way that the application will respond. Muchos servicios incluyen características que admiten la resistencia y disponibilidad, por lo que evaluar cada servicio por separado suele mejorar el plan de recuperación ante desastres.Many services include features that support resiliency and availability, so evaluating each service independently is likely to improve your disaster recovery plan. Por ejemplo, Azure Event Hubs admite conmutación por error al espacio de nombres secundario.For example, Azure Event Hubs supports failing over to the secondary namespace.

Interrupciones del servicio en toda la regiónRegion-wide service disruptions

Número de errores es fáciles de administrar en la misma región de Azure.Many failures are manageable within the same Azure region. Sin embargo, en el improbable caso de una interrupción del servicio de toda la región, las copias redundantes locales de los datos no están disponibles.However, in the unlikely event of a region-wide service disruption, the locally redundant copies of your data aren't available. Si ha habilitado la replicación geográfica, hay tres copias adicionales de los blobs y tablas en una región distinta.If you've enabled geo-replication, there are three additional copies of your blobs and tables in a different region. Si Microsoft declara la región perdida, Azure reasignará todas las entradas DNS en la región secundaria.If Microsoft declares the region lost, Azure remaps all the DNS entries to the secondary region.

Nota

Este proceso se produce solo para las interrupciones del servicio en toda la región y no está dentro de su control.This process occurs only for region-wide service disruptions and is not within your control. Considere la posibilidad de utilizar Azure Site Recovery para conseguir un RPO y un RTO más altos.Consider using Azure Site Recovery to achieve better RPO and RTO. Con Site Recovery, decida qué es una interrupción aceptable y cuándo se debe conmutar por error a las máquinas virtuales replicadas.Using Site Recovery, you decide what is an acceptable outage and when to fail over to the replicated VMs.

La respuesta a una interrupción del servicio de toda la región depende de la implementación y el plan de recuperación ante desastres.Your response to a region-wide service disruption depends on your deployment and your disaster recovery plan.

  • Como una estrategia de control de costos, para las aplicaciones no críticas que no requieren un tiempo de recuperación garantizado, tendría sentido para volver a implementar en una región diferente.As a cost-control strategy, for non-critical applications that don't require a guaranteed recovery time, it might make sense to redeploy to a different region.
  • Para las aplicaciones que se hospedan en otra región con roles implementados pero no distribución el tráfico entre regiones (implementación activa/pasiva), cambie al servicio hospedado secundario en la región alternativa.For applications that are hosted in another region with deployed roles but don't distribute traffic across regions (active/passive deployment), switch to the secondary hosted service in the alternate region.
  • Para las aplicaciones que tienen una implementación a gran escala secundaria en otra región (implementación activa/activa), enrutar el tráfico a esa región.For applications that have a full-scale secondary deployment in another region (active/active deployment), route traffic to that region.

Para más información sobre la recuperación de una interrupción del servicio de toda la región, consulte recuperarse de una interrupción del servicio de toda la región.To learn more about recovering from a region-wide service disruption, see Recover from a region-wide service disruption.

Recuperación de máquina virtualVM recovery

Para las aplicaciones críticas, plan de recuperación de máquinas virtuales en el caso de una interrupción del servicio de toda la región.For critical apps, plan for recovering VMs in the event of a region-wide service disruption.

  • Use Azure Backup u otro método de copia de seguridad para crear copias de seguridad entre regiones que sean coherentes con la aplicación.Use Azure Backup or another backup method to create cross-region backups that are application consistent. (Replicación del almacén de copia de seguridad debe configurarse en el momento de creación).(Replication of the Backup vault must be configured at the time of creation.)
  • Use Site Recovery para replicar entre regiones para las pruebas de conmutación por error y la conmutación por error de aplicación con un solo clic.Use Site Recovery to replicate across regions for one-click application failover and failover testing.
  • Use Traffic Manager para automatizar la conmutación por error de tráfico de usuario en otra región.Use Traffic Manager to automate user traffic failover to another region.

Para obtener más información, consulte recuperarse ante una interrupción del servicio en toda la región, las máquinas virtuales.To learn more, see Recover from a region-wide service disruption, Virtual machines.

Recuperación de almacenamientoStorage recovery

Para proteger el almacenamiento en el caso de una interrupción del servicio de toda la región:To protect your storage in the event of a region-wide service disruption:

  • Usar el almacenamiento con redundancia geográfica.Use geo-redundant storage.
  • Conozca la ubicación del almacenamiento con replicación geográfica.Know where your storage is geo-replicated. Esto afecta a dónde implementar otras instancias de los datos que requieren afinidad regional con el almacenamiento.This affects where you deploy other instances of your data that require regional affinity with your storage.
  • Comprobar los datos para mantener la coherencia después de la conmutación por error y, si es necesario, restaurar una copia de seguridad.Check data for consistency after failover and, if necessary, restore from a backup.

Para obtener más información, consulte diseñar aplicaciones de alta disponibilidad mediante RA-GRS.To learn more, see Designing highly available applications using RA-GRS.

SQL Database y SQL ServerSQL Database and SQL Server

Azure SQL Database proporciona dos tipos de recuperación:Azure SQL Database provides two types of recovery:

Para SQL Server que se ejecutan en máquinas virtuales, consulte alta disponibilidad y recuperación ante desastres para SQL Server en Azure Virtual Machines.For SQL Server running on VMs, see High availability and disaster recovery for SQL Server in Azure Virtual Machines.

Guía específica del servicioService-specific guidance

Los siguientes artículos describen la recuperación ante desastres para servicios específicos de Azure:The following articles describe disaster recovery for specific Azure services:

ServicioService ArtículoArticle
Azure Database for MySQLAzure Database for MySQL Introducción a la continuidad empresarial con Azure Database for MySQLOverview of business continuity with Azure Database for MySQL
Azure Database for PostgreSQLAzure Database for PostgreSQL Introducción a la continuidad empresarial con Azure Database for PostgreSQLOverview of business continuity with Azure Database for PostgreSQL
Azure Cloud ServicesAzure Cloud Services Qué hacer en caso de una interrupción del servicio de Azure que afecte a Azure Cloud ServicesWhat to do in the event of an Azure service disruption that impacts Azure Cloud Services
Cosmos DBCosmos DB Alta disponibilidad con Azure Cosmos DBHigh availability with Azure Cosmos DB
Azure Key VaultAzure Key Vault Redundancia y disponibilidad de Azure Key VaultAzure Key Vault availability and redundancy
Azure StorageAzure Storage Recuperación ante desastres y conmutación por error de la cuenta de almacenamiento (versión preliminar) en Azure StorageDisaster recovery and storage account failover (preview) in Azure Storage
SQL DatabaseSQL Database Restaurar una base de datos de SQL Azure o la conmutación por error en una región secundariaRestore an Azure SQL Database or failover to a secondary region
Virtual MachinesVirtual Machines Lo que a una instancia de Azure en el caso de interrupción del servicio afecta a la nube de AzureWhat to do in the event of an Azure service disruption impacts Azure Cloud
Azure Virtual NetworkAzure Virtual Network Virtual Network: continuidad del negocioVirtual Network – Business Continuity

Pasos siguientesNext steps