Přehled pilíře spolehlivosti

Spolehlivost zajišťuje, aby vaše aplikace splňovala závazky vůči zákazníkům. Návrh odolnosti proti chybám do aplikační architektury zajišťuje, aby vaše úlohy byly dostupné a bylo možné je zotavit z chyb v libovolném měřítku.

Sestavování pro zajištění spolehlivosti zahrnuje:

  • Zajištění vysoce dostupné architektury
  • Zotavení ze selhání, jako jsou ztráta dat, závažné výpadky nebo incidenty ransomwaru

Pokud chcete vyhodnotit spolehlivost úloh pomocí tenetů, které najdete v Microsoft Azure Well-Architected Frameworku,nahlédněte do Microsoft Azure Well-Architected Review.

Další informace najdete v následujícím videu, ve které se můžete hlouběji věnovat spolehlivosti úloh Azure:

Tradiční vývoj aplikací se obvykle zaměřoval na prodloužení střední doby mezi poruchami (MTBF). Úsilí se věnovalo snaze předejít selhání systému. Z cloud computing důvodů se vyžaduje jiné myšlení:

  • Distribuované systémy jsou komplexní a selhání v jednom bodě se potenciálně může kaskádovitě přenést na celý systém.
  • Náklady na cloudová prostředí jsou udržovány na nízké úrovni prostřednictvím komoditního hardwaru, takže je nutné očekávat občasná selhání hardwaru.
  • Aplikace jsou často závislé na externích službách, které mohou být dočasně nedostupné nebo mohou omezovat uživatele s vysokým objemem žádostí.
  • Dnešní uživatelé očekávají aplikaci, která bude dostupná 24 hodin denně 7 dní v týdnu a nikdy nebude mít výpadek.

Všechny tyto faktory znamenají, že cloudové aplikace je nutné navrhovat s očekáváním příležitostných selhání a jejich náprav. Mnoho funkcí týkajících se odolnosti proti chybám je součástí platformy Azure. Příklad:

  • Azure Storage, SQL Database a Cosmos DB poskytují integrovanou replikaci dat mezi zónami dostupnosti a oblastmi.
  • Spravované disky Azure se automaticky umísťují do odlišných uložišť jednotek škálování, aby se omezily následky selhání hardwaru.
  • Virtuální počítače ve skupině dostupnosti jsou rozložené mezi několik domén selhání. Doména selhání je skupina virtuálních počítače, které sdílejí společný zdroj napájení a síťový přepínač. Rozmístění virtuálních počítačů napříč několika doménami selhání omezuje dopady fyzických selhání hardwaru, výpadků sítě nebo přerušení napájení.
  • Zóny dostupnosti jsou fyzicky oddělená umístění v každé oblasti Azure. Každá zóna se skládá z jednoho nebo více datacenter vybavených nezávislým napájením, chlazením a síťovou infrastrukturou. Pomocí zón dostupnosti můžete navrhovat a provozovat aplikace a databáze, které automaticky přechádují mezi zónami bez přerušení, což zajišťuje odolnost v případě ovlivnění jedné zóny. Další informace najdete v referenčních informacích k oblastem a Zóny dostupnosti v Azure.

Přesto je nutné odolnost proti chybám do aplikace zabudovat. Strategie odolnosti proti chybám je možné použít na všech úrovních architektury. Některá omezení rizik jsou taktickou povahou, například opakování vzdáleného — volání po přechodném selhání sítě. Jiná zmírnění rizik jsou zase strategičtější – například převzetí služby při selhání celé aplikace sekundární oblastí. Taktická zmírnění mohou mít velký význam. I když k přerušení dochází v celé oblasti jen zřídka, přechodné problémy, jako je zahlcení sítě, jsou častější, takže na tyto problémy se zaměřte — jako na první. Správné monitorování a diagnostika jsou také důležité. Obě tyto funkce rozpoznávají poruchy, když nastanou, a hledají původní příčiny.

Při návrhu aplikace odolné proti chybám musíte rozumět svým požadavkům na dostupnost. Jak velká doba výpadku je přijatelná? Objem výpadků je částečně funkcí nákladů. Kolik bude případný výpadek vaši firmu stát? Kolik byste měli investovat do vysoké dostupnosti aplikace?

Témata a osvědčené postupy

Pilíř spolehlivosti se zabývá následujícími tématy a osvědčenými postupy, které vám pomůžou vytvořit odolnou úlohu:

Téma o spolehlivosti Popis
Principy spolehlivosti Tyto kritické principy slouží jako objektivy k vyhodnocení spolehlivosti aplikace nasazené v Azure.
Návrh pro spolehlivost Zvažte, jak systémy Zóny dostupnosti, provádět škálovatelnost, reagovat na selhání a další strategie, které optimalizují spolehlivost návrhu aplikací.
Kontrolní seznam k odolnosti pro konkrétní služby Azure Každá technologie má své vlastní konkrétní režimy selhání, které musíte vzít v úvahu při návrhu a implementaci aplikace. Tento kontrolní seznam slouží ke kontrole požadavků na odolnost proti chybám pro konkrétní služby Azure.
Požadavky na cílovou i ne funkční funkci Cílové i ne funkční požadavky, jako jsou cíle dostupnosti a cíle obnovení, umožňují měřit dostupnost a prostoje vašich úloh. Jasně definované cíle je zásadní pro dosažení cíle, se který je třeba měřit.
Odolnost a závislosti Obnovení systému při selhání by mělo být součástí fází architektury a návrhu od začátku, aby se zabránilo riziku selhání. K plnému provozu aplikace se vyžaduje závislosti.
Zóny dostupnosti Zóny dostupnosti lze použít k rozložení řešení mezi několik zón v rámci oblasti, což umožňuje, aby aplikace i nadále fungovala, když selže jedna zóna.
Dostupnost služeb Dostupnost služeb napříč oblastmi Azure závisí na typu oblasti. Obecné zásady Azure pro nasazování služeb do jakékoli dané oblasti se primárně řídí typem oblasti, kategoriemi služeb a poptávkou zákazníků.
Terminologie zóny dostupnosti Abyste lépe porozuměli oblastem a zónám dostupnosti v Azure, pomůže vám to pochopit klíčové pojmy nebo koncepty.
Osvědčené postupy Během fáze architektury se soustřeďte na implementaci postupů, které splňují vaše obchodní požadavky, identifikujte body selhání a minimalizujte rozsah selhání.
Testování spolehlivosti Pravidelné testování by se mělo provádět jako součást každé hlavní změny, aby se ověřily stávající prahové hodnoty, cíle a předpoklady.
Monitorování spolehlivosti Získejte celkový přehled o stavu aplikace. Pokud něco selže, musíte vědět, že selhalo, kdy selhalo a proč.
Vzory spolehlivosti Aplikace musí být navrženy a implementovány tak, aby maximalizovaly dostupnost.

Další krok