Co dělat v případě výpadku služby Azure, který má dopad na Azure Cloud ServicesWhat to do in the event of an Azure service disruption that impacts Azure Cloud Services

V Microsoftu pracujeme na tom, abychom zajistili, že naše služby jsou vždycky k dispozici, až je budete potřebovat.At Microsoft, we work hard to make sure that our services are always available to you when you need them. Síly nad rámec našeho ovládacího prvku někdy ovlivňují způsob, jakým způsobují neplánované výpadky služeb.Forces beyond our control sometimes impact us in ways that cause unplanned service disruptions.

Společnost Microsoft poskytuje smlouva SLA (SLA) pro své služby jako závazek pro dobu provozu a připojení.Microsoft provides a Service Level Agreement (SLA) for its services as a commitment for uptime and connectivity. Smlouvu SLA pro jednotlivé služby Azure najdete na stránce smlouvy o úrovni služeb Azure.The SLA for individual Azure services can be found at Azure Service Level Agreements.

Azure už obsahuje mnoho vestavěných funkcí platformy, které podporují vysoce dostupné aplikace.Azure already has many built-in platform features that support highly available applications. Další informace o těchto službách najdete v tématu zotavení po havárii a vysoká dostupnost pro aplikace Azure.For more about these services, read Disaster recovery and high availability for Azure applications.

Tento článek se zabývá skutečným scénářem zotavení po havárii, když celá oblast dojde k výpadku, protože došlo k závažné přirozené havárii nebo rozšířenému přerušení služby.This article covers a true disaster recovery scenario, when a whole region experiences an outage due to major natural disaster or widespread service interruption. Jedná se o vzácná opakování, ale musíte připravit na možnost, že dojde k výpadku celé oblasti.These are rare occurrences, but you must prepare for the possibility that there is an outage of an entire region. Pokud v celé oblasti dojde k přerušení služby, místně redundantní kopie vašich dat nebudou dočasně k dispozici.If an entire region experiences a service disruption, the locally redundant copies of your data would temporarily be unavailable. Pokud jste povolili geografickou replikaci, budou se tři další kopie Azure Storage objektů BLOB a tabulek ukládat v jiné oblasti.If you have enabled geo-replication, three additional copies of your Azure Storage blobs and tables are stored in a different region. V případě úplného výpadku v oblasti regionu nebo havárie, ve kterém se primární oblast nedá obnovit, Azure přemapuje všechny položky DNS do geografické replikované oblasti.In the event of a complete regional outage or a disaster in which the primary region is not recoverable, Azure remaps all of the DNS entries to the geo-replicated region.

Poznámka

Mějte na paměti, že k tomuto procesu nemáte žádnou kontrolu a dojde k tomu jenom pro přerušení služeb v rámci datového centra.Be aware that you do not have any control over this process, and it will only occur for datacenter-wide service disruptions. Z tohoto důvodu musíte také spoléhat na jiné strategie zálohování specifické pro aplikace, abyste dosáhli nejvyšší úrovně dostupnosti.Because of this, you must also rely on other application-specific backup strategies to achieve the highest level of availability. Další informace najdete v tématu zotavení po havárii a vysoká dostupnost pro aplikace založené na Microsoft Azure.For more information, see Disaster recovery and high availability for applications built on Microsoft Azure. Pokud chcete mít možnost ovlivnit vlastní převzetí služeb při selhání, můžete zvážit použití geograficky redundantního úložiště s přístupem pro čtení (RA-GRS), které v jiné oblasti vytvoří kopii vašich dat jen pro čtení.If you would like to be able to affect your own failover, you might want to consider the use of read-access geo-redundant storage (RA-GRS), which creates a read-only copy of your data in another region.

Možnost 1: Použití nasazení zálohy prostřednictvím Azure Traffic ManagerOption 1: Use a backup deployment through Azure Traffic Manager

Nejbezpečnější řešení pro zotavení po havárii zahrnuje údržbu více nasazení aplikace v různých oblastech a následné použití Azure Traffic Manager k přímému směrování provozu mezi nimi.The most robust disaster recovery solution involves maintaining multiple deployments of your application in different regions, then using Azure Traffic Manager to direct traffic between them. Azure Traffic Manager poskytuje několik metod směrování, takže si můžete vybrat, jestli chcete spravovat nasazení pomocí primárního nebo záložního modelu, nebo rozdělit přenos mezi nimi.Azure Traffic Manager provides multiple routing methods, so you can choose whether to manage your deployments using a primary/backup model or to split traffic between them.

Vyvážení Cloud Services Azure napříč oblastmi pomocí Azure Traffic Manager

Pro nejrychlejší reakci na ztrátu oblasti je důležité nakonfigurovat monitorování koncového boduTraffic Manager.For the fastest response to the loss of a region, it is important that you configure Traffic Manager's endpoint monitoring.

Možnost 2: Nasazení aplikace do nové oblastiOption 2: Deploy your application to a new region

Údržba několika aktivních nasazení, jak je popsáno v předchozí možnosti, jsou další průběžné náklady.Maintaining multiple active deployments as described in the previous option incurs additional ongoing costs. Pokud je váš cíl doby obnovení (RTO) dostatečně flexibilní a máte původní kód nebo kompilovaný Cloud Services balíček, můžete vytvořit novou instanci aplikace v jiné oblasti a aktualizovat záznamy DNS tak, aby odkazovaly na nové nasazení.If your recovery time objective (RTO) is flexible enough and you have the original code or compiled Cloud Services package, you can create a new instance of your application in another region and update your DNS records to point to the new deployment.

Další informace o tom, jak vytvořit a nasadit aplikaci cloudové služby, najdete v tématu jak vytvořit a nasadit cloudovou službu.For more detail about how to create and deploy a cloud service application, see How to create and deploy a cloud service.

V závislosti na zdrojích dat aplikací může být nutné ověřit postupy obnovení pro zdroj dat aplikace.Depending on your application data sources, you may need to check the recovery procedures for your application data source.

Možnost 3: Počkat na obnoveníOption 3: Wait for recovery

V takovém případě se nevyžaduje žádná akce s vaší částí, ale vaše služba nebude dostupná, dokud se oblast neobnoví.In this case, no action on your part is required, but your service will be unavailable until the region is restored. Aktuální stav služby můžete zobrazit na řídicím panelu Azure Service Health.You can see the current service status on the Azure Service Health Dashboard.

Další postupNext steps

Další informace o tom, jak implementovat strategii zotavení po havárii a vysokou dostupnost, najdete v tématu zotavení po havárii a vysoká dostupnost pro aplikace Azure.To learn more about how to implement a disaster recovery and high availability strategy, see Disaster recovery and high availability for Azure applications.

Podrobné technické porozumění funkcím cloudové platformy najdete v tématu technické pokyny k odolnosti Azure.To develop a detailed technical understanding of a cloud platform’s capabilities, see Azure resiliency technical guidance.