Přehled zotavení po havárii a pokyny pro infrastrukturu pro úlohy SAP

Mnoho organizací, které provozují důležité obchodní aplikace v Azure, nastavila strategii vysoké dostupnosti (HA) i zotavení po havárii (DR). Účelem vysoké dostupnosti je zvýšit smlouvu SLA obchodních systémů odstraněním kritických bodů selhání v základní systémové infrastruktuře. Technologie vysoké dostupnosti snižují vliv neplánovaných selhání infrastruktury a pomáhají s plánovanou údržbou. Zotavení po havárii je definováno jako zásady, nástroje a postupy, které umožňují zotavení nebo pokračování zásadní technologické infrastruktury a systémů po geograficky rozšířené přírodní nebo lidské havárii.

Kvůli zajištění vysoké dostupnosti pro úlohy SAP v Azure se virtuální počítače obvykle nasazují ve skupině dostupnosti, zónách dostupnosti nebo v flexibilní škálovací sadě za účelem ochrany aplikací před údržbou infrastruktury nebo selháním v rámci oblasti. Nasazení ale nechrání aplikace před rozsáhlou havárií v rámci oblasti. Aby se aplikace chránily před regionálními haváriemi, měla by být zavedená strategie zotavení po havárii pro aplikace. Zotavení po havárii je zdokumentovaný a strukturovaný přístup, který pomáhá organizaci při provádění procesů obnovení v reakci na havárii a k ochraně nebo minimalizaci přerušení IT služeb a podpoře zotavení.

Tento dokument obsahuje podrobnosti o ochraně úloh SAP před katastrofou ve velkém měřítku implementací strukturovaného přístupu zotavení po havárii. Podrobnosti v tomto dokumentu jsou uvedeny na abstraktní úrovni založené na různých službách Azure a komponentách SAP. Přesná strategie zotavení po havárii a pořadí obnovení úloh SAP je potřeba pravidelně testovat, zdokumentovat a doladit. Dokument se také zaměřuje na strategii zotavení po havárii Azure do Azure pro úlohy SAP.

Obecné aspekty plánu zotavení po havárii

Úloha SAP v Azure běží na virtuálních počítačích v kombinaci s různými službami Azure pro nasazení různých vrstev (centrální služby, aplikační servery, databázový server) typické aplikace SAP NetWeaver. Obecně platí, že strategie zotavení po havárii by měla být naplánována pro celou oblast IT běžící v Azure, což znamená, že je potřeba vzít v úvahu i aplikace mimo SAP. Obchodní řešení spuštěné v systémech SAP nemusí běžet jako celek, pokud závislé služby nebo prostředky nejsou v lokalitě zotavení po havárii obnoveny. Proto musíte přijít s dobře definovaným komplexním plánem zotavení po havárii s ohledem na všechny komponenty a systémy.

V případě zotavení po havárii v Azure by organizace měly zvážit různé scénáře, které můžou aktivovat převzetí služeb při selhání.

  • Dostupnost aplikace SAP nebo obchodního procesu
  • Služby Azure (jako jsou virtuální počítače, úložiště, nástroj pro vyrovnávání zatížení atd.) nedostupnost v rámci oblasti kvůli rozsáhlému selhání.
  • Potenciální hrozby a ohrožení zabezpečení aplikace (například útok DDoS aplikační vrstvy)
  • Obchodní dodržování předpisů vyžadovalo provozní úlohy pro testování strategie zotavení po havárii (například cvičení o selhání zotavení po havárii, které se má provádět každý rok podle dodržování předpisů).

Aby organizace dosáhla cíle obnovení pro různé scénáře, musí na základě obchodních požadavků nastínit cíl doby obnovení (RTO) a cíl bodu obnovení (RPO). RtO popisuje dobu, po kterou může být aplikace nižší, obvykle měřená v hodinách, minutách nebo sekundách. Zatímco RPO popisuje množství transakčních dat, která je přijatelná pro firmu, aby se ztratily, aby normální operace mohly pokračovat. Identifikace RTO a RPO vaší firmy je zásadní, protože by vám pomohla optimálně navrhnout strategii zotavení po havárii. Komponenty (výpočetní prostředky, úložiště, databáze atd.) zapojené do úlohy SAP se replikují do oblasti zotavení po havárii pomocí různých technik (nativní služby Azure, technologie replikace nativní databáze, vlastní skripty). Každá technika poskytuje jiný cíl bodu obnovení, který je potřeba při návrhu strategie zotavení po havárii zohlednit. V Azure můžete použít některé nativní služby Azure, jako je Azure Site Recovery, Azure Backup, které vám pomůžou splnit rto a cíl bodu obnovení úloh SAP. Projděte si smlouvu SLA služby Azure Site Recovery a Azure Backup , abyste optimálně odpovídali vašemu rto a bodu obnovení.

Aspekty návrhu pro zotavení po havárii v Azure

Při návrhu řešení zotavení po havárii v Azure je potřeba zvážit různé prvky. Principy a koncepty, které se považují za návrh místních řešení zotavení po havárii, platí i pro Azure. Výběr oblastí v Azure je ale klíčovou součástí strategie návrhu pro zotavení po havárii. Při výběru oblasti zotavení po havárii v Azure proto mějte na paměti následující body.

  • Požadavky na dodržování předpisů nebo obchodní předpisy můžou určovat požadavky na vzdálenost mezi primární lokalitou a lokalitou pro zotavení po havárii. Požadavek na vzdálenost pomáhá zajistit dostupnost v případě přírodní katastrofy v širší geografické oblasti. V takovém případě může organizace zvolit jinou oblast Azure jako lokalitu pro zotavení po havárii. Oblasti Azure jsou často oddělené velkou vzdáleností, která může být stovky nebo dokonce tisíce kilometrů jako v USA. Kvůli vzdálenosti bude latence odezvy sítě vyšší, což může mít za následek vyšší cíl bodu obnovení.

  • Zákazníci, kteří chtějí napodobovat místní strategii zotavení po havárii metra v Azure, můžou využít zóny dostupnosti k zotavení po havárii. Strategie zotavení po havárii mezi zónami ale může spadat pod požadavek na odolnost, pokud existuje geograficky rozšířená přírodní katastrofa.

  • V Azure se každá oblast spáruje s jinou oblastí ve stejné zeměpisné oblasti (s výjimkou Brazílie – jih). Tento přístup umožňuje replikaci prostředků napříč oblastmi poskytovanou platformou. Výhodu výběru spárované oblasti najdete v dokumentu párů oblastí. Když se organizace rozhodne použít spárované oblasti Azure, je potřeba zvážit několik dalších bodů pro úlohu SAP:

    • Ne všechny služby Azure nabízejí replikaci mezi oblastmi ve spárované oblasti.

    • Služby a funkce Azure ve spárovaných oblastech Azure nemusí být symetrické. Například azure NetApp Files, skladové položky virtuálních počítačů, jako jsou M-Series dostupné v primární oblasti, nemusí být ve spárované oblasti dostupné. Pokud chcete zjistit, jestli je produkt nebo služby Azure dostupné v oblasti, přečtěte si téma Produkty Azure podle oblastí.

    • Možnost GRS je dostupná pro účet úložiště se standardním typem úložiště, který replikuje data do spárované oblasti. Standardní úložiště ale není vhodné pro SAP DBMS nebo virtuální datové disky.

    • Služba Azure Backup, která se používá k zálohování podporovaných řešení , může replikovat zálohy pouze mezi spárovanými oblastmi. Pro všechna ostatní data spusťte vlastní replikace s nativními funkcemi DBMS, jako je SQL Server AlwaysOn, replikace systému SAP HANA a další služby. Pro aplikační vrstvu SAP použijte kombinaci Azure Site Recovery, rsync nebo robocopy a dalšího softwaru třetích stran.

Referenční nasazení úloh SAP

Po identifikaci oblasti zotavení po havárii je důležité, aby byla dostupná šířka základních služeb Azure (například sítě, výpočetních prostředků, úložiště), které jste nakonfigurovali v primární oblasti, a je možné ji nakonfigurovat v oblasti zotavení po havárii. Organizace musí vyvíjet model nasazení zotavení po havárii pro úlohy SAP. Model nasazení se liší a musí odpovídat potřebám organizace.

  • Nasaďte produkční úlohy SAP do primární oblasti a neprodukční úlohy do oblasti zotavení po havárii.
  • Nasaďte všechny úlohy SAP (produkční a neprodukční) do primární oblasti. Oblast zotavení po havárii se používá jenom v případě, že dojde k převzetí služeb při selhání.

Následující referenční architektura ukazuje typický systém SAP NetWeaver běžící v Azure spolu s vysokou dostupností v primární oblasti. Sekundární lokalita zobrazená níže je lokalita pro zotavení po havárii, kde se systémy SAP po havárii obnoví. Primární i oblasti zotavení po havárii jsou součástí stejného předplatného. Pokud chcete dosáhnout zotavení po havárii pro úlohy SAP, musíte identifikovat strategii obnovení pro každou vrstvu SAP spolu s různými službami Azure, které aplikace používá.

Organizace by měly plánovat a navrhovat strategii zotavení po havárii pro celou oblast IT. Systémy SAP běžící v produkčním prostředí jsou obvykle integrované s různými službami a rozhraními, jako je Active Directory, DNS, aplikace třetích stran atd. Proto musíte do plánování zotavení po havárii zahrnout i systémy, které nejsou systémy SAP a další služby. Tento dokument se zaměřuje na plánování obnovení pro aplikace SAP. Můžete ale rozšířit velikost a rozsah plánování zotavení po havárii pro závislé komponenty tak, aby vyhovovaly vašim požadavkům.

Disaster Recovery reference architecture for SAP workload

Komponenty infrastruktury řešení zotavení po havárii pro úlohy SAP

Úloha SAP spuštěná v Azure používá k provozování obchodního řešení různé komponenty infrastruktury. Pokud chcete naplánovat zotavení po havárii pro takové řešení, je nezbytné, aby byly k dispozici všechny komponenty infrastruktury nakonfigurované v primární oblasti a je možné je nakonfigurovat i v oblasti zotavení po havárii. Při navrhování řešení zotavení po havárii pro úlohy SAP v Azure by se měly počítat následující komponenty infrastruktury.

  • Síť
  • Compute
  • Úložiště

Síť

  • ExpressRoute rozšiřuje vaši místní síť do cloudu Microsoftu přes privátní připojení pomocí poskytovatele připojení. Při návrhu architektury zotavení po havárii je nutné počítat s vytvářením robustního připojení k back-endové síti pomocí geograficky redundantního okruhu ExpressRoute. Doporučuje se nastavit alespoň jeden okruh ExpressRoute z místního prostředí do primární oblasti. A ostatní se musí připojit k oblasti zotavení po havárii. Přečtěte si článek Návrh Azure ExpressRoute pro zotavení po havárii, který popisuje různé scénáře návrhu zotavení po havárii pro ExpressRoute.

    Poznámka:

    Zvažte nastavení sítě VPN typu site-to-site (S2S) jako zálohy Azure ExpressRoute. Další informace najdete v tématu Použití S2S VPN jako zálohy pro privátní partnerský vztah Azure ExpressRoute.

  • Virtuální síť a podsítě zahrnují všechny zóny dostupnosti v oblasti. V případě zotavení po havárii ve dvou oblastech je potřeba nakonfigurovat samostatné virtuální sítě a podsítě v oblasti zotavení po havárii. Další informace o nastavení sítě v oblasti zotavení po havárii virtuálního počítače Azure najdete v tématu O sítích v oblasti zotavení po havárii.

  • Azure Standard Load Balancer poskytuje síťové prvky pro návrh systémů SAP s vysokou dostupností. Pro clusterované systémy poskytuje Load Balancer úrovně Standard virtuální IP adresu pro clusterovou službu, jako jsou instance ASCS/SCS a databáze spuštěné na virtuálních počítačích. Aby bylo možné spustit vysoce dostupný systém SAP v lokalitě zotavení po havárii, musí se vytvořit samostatný nástroj pro vyrovnávání zatížení a odpovídajícím způsobem by se měla upravit konfigurace clusteru.

  • Aplikace Azure Gateway je nástroj pro vyrovnávání zatížení webového provozu. Díky své funkci Firewallu webových aplikací je její dobře vhodná služba pro zveřejnění webových aplikací na internetu s lepším zabezpečením. Aplikace Azure Gateway může v závislosti na konfiguraci obsluhovat veřejné (internetové) nebo privátní klienty nebo obojí. Pokud chcete po převzetí služeb při selhání přijmout podobný příchozí provoz HTTP v oblasti zotavení po havárii, musí být v oblasti zotavení po havárii nakonfigurovaná samostatná brána Aplikace Azure.

  • Vzhledem k tomu, že síťové komponenty (například virtuální síť, brána firewall atd.) se vytvářejí samostatně v oblasti zotavení po havárii, je potřeba zajistit, aby se úloha SAP v oblasti zotavení po havárii přizpůsobila změnám sítí, jako je aktualizace DNS, brána firewall atd.

  • Virtuální sítě v obou oblastech jsou nezávislé a pro navázání komunikace mezi těmito dvěma oblastmi potřebujete povolit partnerský vztah virtuálních sítí.

Virtuální počítače

  • V Azure se různé komponenty jednoho systému SAP spouštějí na virtuálních počítačích s různými typy skladových položek. V případě zotavení po havárii je možné ochranu aplikace (SAP NetWeaver a jiné než SAP) spuštěné na virtuálních počítačích Azure povolit replikací komponent pomocí Azure Site Recovery do jiné oblasti Nebo zóny Azure. S Azure Site Recovery se virtuální počítače Azure replikují nepřetržitě z primární lokality do lokality pro zotavení po havárii. V závislosti na vybrané oblasti zotavení po havárii azure nemusí být typ skladové položky virtuálního počítače dostupný na webu zotavení po havárii. Musíte se ujistit, že požadované typy skladových položek virtuálních počítačů jsou k dispozici i v oblasti Azure DR. Zkontrolujte produkty Azure podle oblastí a zjistěte, jestli je požadovaný typ skladové položky řady virtuálních počítačů dostupný nebo ne.

    Důležité

    Pokud je systém SAP nakonfigurovaný s flexibilní škálovací sadou s FD=1, musíte k nastavení Azure Site Recovery pro zotavení po havárii použít PowerShell . V současné době je jedinou dostupnou metodou konfigurace zotavení po havárii pro virtuální počítače nasazené ve škálovací sadě.

  • U databází spuštěných na virtuálních počítačích Azure se doporučuje k synchronizaci dat do lokality pro zotavení po havárii použít nativní replikační technologii databáze. Velké virtuální počítače, na kterých jsou databáze spuštěné, nemusí být dostupné ve všech oblastech. Pokud pro zotavení po havárii používáte zóny dostupnosti, měli byste zkontrolovat, jestli jsou příslušné skladové položky virtuálních počítačů dostupné v zóně lokality pro zotavení po havárii.

    Poznámka:

    Nedoporučuje se používat Azure Site Recovery pro databáze, protože nezaručuje konzistenci databáze a omezení četnosti změn dat.

  • V případě produkčních aplikací spuštěných v primární oblasti se rezervované instance obvykle používají k úsporě nákladů na Azure. Pokud používáte rezervované instance, musíte si zaregistrovat 1 rok nebo 3letý závazek, který nemusí být nákladově efektivní pro web zotavení po havárii. Nastavení Služby Azure Site Recovery také nezaručuje kapacitu požadované skladové položky virtuálního počítače během převzetí služeb při selhání. Pokud chcete zajistit dostupnost kapacity skladové položky virtuálního počítače, můžete zvážit možnost povolení rezervace kapacity na vyžádání. Vyhrazuje si výpočetní kapacitu v oblasti Azure nebo v zóně dostupnosti Azure po libovolnou dobu bez závazku. Azure Site Recovery je integrovaný s rezervací kapacity na vyžádání. Díky této integraci můžete pomocí kapacity rezervace kapacity pomocí Azure Site Recovery rezervovat výpočetní kapacitu v lokalitě zotavení po havárii a zaručit převzetí služeb při selhání. Další informace najdete v tématu Omezení a omezení rezervace kapacity na vyžádání.

  • Předplatné Azure má kvóty pro rodiny virtuálních počítačů (například řadu Mv2) a další prostředky. Organizace někdy chtějí pro zotavení po havárii používat jiné předplatné Azure. Každé předplatné (primární a zotavení po havárii) může mít přiřazené různé kvóty pro každou řadu virtuálních počítačů. Ujistěte se, že předplatné používané pro web zotavení po havárii má k dispozici dostatek výpočetních kvót.

Úložiště

  • Při povolení Azure Site Recovery pro virtuální počítač k nastavení zotavení po havárii se operační systém a místní datové disky připojené k virtuálním počítačům replikují do lokality zotavení po havárii. Během replikace se zápisy na disky virtuálního počítače posílají do účtu úložiště mezipaměti ve zdrojové oblasti. Data se odtud odesílají do cílové oblasti a body obnovení se vygenerují z dat. Při převzetí služeb při selhání virtuálního počítače během zotavení po havárii se k obnovení virtuálního počítače v cílové oblasti použije bod obnovení. Azure Site Recovery ale nepodporuje všechny typy úložišť, které jsou dostupné v Azure. Další informace najdete v matici podpory azure Site Recovery pro úložiště.

  • Kromě spravovaných datových disků Azure připojených k virtuálním počítačům se k provozování aplikace SAP v Azure používají různá nativní řešení úložiště Azure. Přístup zotavení po havárii pro každé řešení úložiště Azure se může lišit, protože Azure Site Recovery nepodporuje všechny služby úložiště dostupné v Azure. Níže je seznam typu úložiště, který se obvykle používá pro úlohy SAP.

    Typ úložiště Doporučení strategie zotavení po havárii
    Spravovaný disk Azure Site Recovery
    NFS ve službě Soubory Azure (LRS nebo ZRS) Vlastní skript pro replikaci dat mezi dvěma lokalitami (například rsync)
    NFS ve službě Azure NetApp Files Použití replikace svazků Azure NetApp Files mezi oblastmi
    Sdílený disk Azure (LRS nebo ZRS) Vlastní řešení pro replikaci dat mezi dvěma lokalitami
    SMB v souborech Azure (LRS nebo ZRS) Kopírování souborů mezi dvěma lokalitami pomocí Nástroje RoboCopy
    SMB v Azure NetApp Files Použití replikace svazků Azure NetApp Files mezi oblastmi
  • Pro vlastní sestavená řešení úložiště, jako je cluster NFS, je potřeba zajistit, aby byla zavedená příslušná strategie zotavení po havárii.

  • Různé nativní služby úložiště Azure (například Azure Files, Azure NetApp Files, Sdílený disk Azure) nemusí být dostupné ve všech oblastech. Pokud tedy chcete mít po převzetí služeb při selhání podobné nastavení SAP v oblasti zotavení po havárii, ujistěte se, že je v lokalitě zotavení po havárii nabízená příslušná služba úložiště. Další informace najdete v produktech Azure podle oblastí.

  • Pokud používáte zóny dostupnosti pro zotavení po havárii, mějte na paměti následující body:

    • Funkce Azure NetApp Files zatím není v zóně. V současné době není funkce Azure NetApp Files nasazená ve všech zónách dostupnosti v oblasti Azure. Může se tedy stát, že služba Azure NetApp Files není pro vaši strategii zotavení po havárii dostupná ve zvolené zóně dostupnosti.
    • Replikace svazků Azure NetApp File mezi oblastmi je dostupná jenom ve dvojicích s pevnou oblastí, ne napříč zónami.
  • Pokud jste nakonfigurovali úložiště s integrací služby Active Directory, mělo by se podobné nastavení provést i v účtu úložiště lokality zotavení po havárii.

  • Sdílené disky Azure vyžadují software clusteru, jako je windows serverový cluster s podporou převzetí služeb při selhání (WSFC), který zpracovává komunikaci uzlů clusteru a zamykání zápisu. Pokud tedy chcete mít strategii zotavení po havárii pro sdílený disk Azure, musíte mít také sdílený disk spravovaný softwarem clusteru v lokalitě zotavení po havárii. Pak můžete pomocí skriptu zkopírovat data ze sdíleného disku připojeného ke clusteru v primární oblasti na sdílený disk připojený k jinému clusteru v oblasti zotavení po havárii.

Další kroky