Principy pilíře spolehlivosti
Vytváření spolehlivých aplikací v cloudu se liší od tradičního vývoje aplikací. I když jste historicky nakoupili úrovně redundantního hardwaru s vyšším počtem, aby se minimalizovala pravděpodobnost selhání celé aplikační platformy v cloudu, potvrzujeme, že dojde k selhání. Místo snahy kompletně zabránit selháním je cílem minimalizace dopadu selhání jedné komponenty.
Aplikační framework
Tyto kritické principy slouží jako rozptylová skla k vyhodnocení spolehlivosti aplikace nasazené v Azure. Poskytují rozhraní pro otázky hodnocení aplikace, které následují.
Pokud chcete vyhodnotit vaše úlohy pomocí principů dobře navržené architektury Microsoft Azure, přečtěte si téma Dobře navržená architektura Microsoft Azure.
Definování a testování dostupnosti a cílů obnovení – Cíle dostupnosti, jako jsou smlouvy o úrovni služeb (SLA) a cíle na úrovni služby (SLO) a cíle obnovení, jako jsou například cíle pro čas obnovení (RTO) a cíle bodu obnovení (RPO), by měly být definovány a testovány, aby se zajistilo, že spolehlivost aplikace bude zarovnána s podnikovými požadavky.
Návrh aplikací, které mají být odolné vůči chybám – Odolné architektury aplikací by měly být navržené tak, aby se korektně obnovily z chyb v zarovnání s definovanými cíli spolehlivosti.
Zajistěte, aby požadovaná kapacita a služby byly dostupné v cílových oblastech – Služby a kapacita Azure se můžou v jednotlivých oblastech lišit, takže je důležité pochopit, jestli cílové oblasti nabízejí požadované možnosti.
Plán pro zotavení po havárii – Zotavení po havárii je proces obnovení funkčnosti aplikace při probuzení závažného selhání. Může být přijatelné, aby některé aplikace byly v určitou dobu nedostupné nebo částečně dostupné s omezenou funkčností, zatímco jiné aplikace nemusí být schopné tolerovat omezené funkce.
Navrhněte aplikační platformu tak, aby splňovala požadavky na spolehlivost – Navrhování odolnosti a dostupnosti aplikační platformy je důležité pro zajištění celkové spolehlivosti aplikací.
Navrhněte datovou platformu pro splnění požadavků na spolehlivost – Navrhování odolnosti a dostupnosti datové platformy je důležité pro zajištění celkové spolehlivosti aplikací.
Zotavení z chyb – Odolné aplikace by měly být schopné automaticky obnovit z chyb pomocí moderních vzorů kódu cloudových aplikací.
Zajistěte, aby sítě a připojení splňovaly požadavky na spolehlivost – Identifikace a zmírnění potenciálních síťových krku nebo bodů, které jsou příčinou selhání, podporuje spolehlivou a škálovatelnou základnu, na jejímž základě můžou vzájemně komunikovat odolné součásti aplikace.
Umožnění spolehlivosti a výkonu – Odolné aplikace by měly být schopné automaticky škálovat v reakci na změnu zatížení za účelem zachování dostupnosti aplikace a splnění požadavků na výkon.
Řešení rizik souvisejících se zabezpečením – Identifikace a řešení rizik souvisejících se zabezpečením pomáhá minimalizovat výpadky aplikací a ztráty dat způsobené neočekávanými bezpečnostními riziky.
Definování, automatizace a testování provozních procesů – Provozní procesy pro nasazení aplikací, jako je převýšení a vrácení zpět, by měly být definované, dostatečně automatizované a testované, aby bylo zajištěno sblížení s cíli spolehlivosti.
Test odolnosti proti chybám – Úlohy aplikací by měly být testovány, aby bylo možné ověřit spolehlivost proti definovaným cílům spolehlivosti.
Monitorování a měření stavu aplikace – Monitorování a měření dostupnosti aplikace je důležité pro zajištění celkového stavu aplikace a pokroku směrem k vymezeným cílům spolehlivosti.