Nastavení zotavení po havárii ve velkém měřítku pro virtuální počítače nebo fyzické servery VMware
Tento článek popisuje, jak nastavit zotavení po havárii do Azure pro velká čísla (> 1000) místních virtuálních počítačů VMware nebo fyzických serverů v produkčním prostředí pomocí Azure Site Recovery služby.
Definování strategie BCDR
V rámci strategie pro kontinuitu podnikových aplikací a zotavení po havárii (BCDR) definujete cíle bodů obnovení (RPO) a cíle doby obnovení (RPO) pro vaše obchodní aplikace a úlohy. RTO měří dobu trvání a úroveň služeb, ve které je nutné obnovit a dostupnou obchodní aplikaci nebo proces, aby se předešlo problémům s kontinuitou.
- Site Recovery poskytuje průběžnou replikaci pro fyzické servery a virtuální počítače VMware a sla pro RTO.
- Při plánování rozsáhlého zotavení po havárii pro virtuální počítače VMware a určování prostředků Azure, které potřebujete, můžete zadat hodnotu RTO, která se použije pro výpočty kapacity.
Osvědčené postupy
Některé obecné osvědčené postupy pro zotavení po havárii ve velkém měřítku. Tyto osvědčené postupy jsou podrobněji popsány v dalších částech dokumentu.
- Určení cílových požadavků: Odhadněte potřeby kapacity a prostředků v Azure před tím, než nastavíte zotavení po havárii.
- Plánování Site Recovery komponent: Zjistíte, jaké Site Recovery (konfigurační server, procesové servery), které potřebujete ke splnění odhadované kapacity.
- Nastavte jeden nebo více procesových serverů se škálování na více systémů: Nepoužívejte procesový server, který je na konfiguračním serveru spuštěný ve výchozím nastavení.
- Spusťte nejnovější aktualizace: Tým Site Recovery pravidelně vydává nové verze komponent Site Recovery a měli byste se ujistit, že používáte nejnovější verze. Abyste s tím mohli pomoct, sledujte, co je nového v aktualizacích, a povolte a nainstalujte aktualizace při jejich vydání.
- Proaktivně monitorujte: Jakmile budete mít zotavení po havárii v provozu, měli byste proaktivně monitorovat stav a stav replikovaných počítačů a prostředků infrastruktury.
- Postup zotavení po havárii: V pravidelných intervalech byste měli spouštět postup zotavení po havárii. Tyto změny neo vliv na produkční prostředí, ale pomáhají zajistit, aby převzetí služeb při selhání do Azure fungovalo podle očekávání v případě potřeby.
Shromáždění informací o plánování kapacity
Shromážděte informace o místním prostředí, které vám pomůžou vyhodnotit a odhadnout potřeby cílové kapacity (Azure).
- V případě VMware spusťte Plánovač nasazení pro virtuální počítače VMware.
- U fyzických serverů shromážděte tyto informace ručně.
Spuštění Plánovač nasazení pro virtuální počítače VMware
Tento Plánovač nasazení pomáhá shromažďovat informace o místním prostředí VMware.
- Spusťte Plánovač nasazení dobu, která představuje typickou četnost změn vašich virtuálních počítače. Tím se vygenerují přesnější odhady a doporučení.
- Doporučujeme spustit nástroj Plánovač nasazení na počítači s konfiguračním serverem, protože Planner vypočítá propustnost ze serveru, na kterém je spuštěný. Přečtěte si další informace o měření propustnosti.
- Pokud ještě nemáte nastavený konfigurační server:
- Získejte přehled o Site Recovery komponentách.
- Nastavte konfigurační server, abyste na něj mohli Plánovač nasazení spustit.
Pak spusťte Planner následujícím způsobem:
- Přečtěte si o Plánovač nasazení. Nejnovější verzi si můžete stáhnout z portálu nebo si ji můžete stáhnout přímo.
- Zkontrolujte požadavky a nejnovější aktualizace pro Plánovač nasazení a stáhněte a extrahujte nástroj.
- Spusťte Plánovač nasazení na konfiguračním serveru.
- Vygenerování sestavy pro shrnutí odhadů a doporučení
- Analyzujte doporučení sestav a odhady nákladů.
Poznámka
Ve výchozím nastavení je nástroj nakonfigurovaný tak, aby profiloval a generoval sestavu až pro 1 000 virtuálních počítače. Tento limit můžete změnit zvýšením hodnoty klíče MaxVMsSupported v ASRDeploymentPlanner.exe.config souboru.
Plánování požadavků na cíl (Azure) a kapacity
Pomocí shromážděných odhadů a doporučení můžete naplánovat cílové prostředky a kapacitu. Pokud jste spustili Plánovač nasazení pro virtuální počítače VMware, můžete použít řadu doporučení pro sestavy, které vám pomůžou.
- Kompatibilní virtuální počítače: Toto číslo použijte k identifikaci počtu virtuálních počítače, které jsou připravené k zotavení po havárii do Azure. Recommendations informace o šířce pásma sítě a jádrech Azure jsou založené na tomto počtu.
- Požadovaná šířka pásma sítě: Poznamenejte si šířku pásma, kterou potřebujete pro rozdílovou replikaci kompatibilních virtuálních počítače.
- Při spuštění Plánovače zadáte požadovaný RPO během několika minut. Doporučení ukazují šířku pásma potřebnou ke splnění tohoto RPO 100 % a 90 % času.
- Doporučení šířky pásma sítě vezměte v úvahu šířku pásma potřebnou pro celkový počet konfiguračních serverů a procesových serverů doporučených v Planneru.
- Požadovaná jádra Azure: Poznamenejte si počet jader, která potřebujete v cílové oblasti Azure, podle počtu kompatibilních virtuálních počítače. Pokud nemáte dostatek jader, při převzetí služeb při Site Recovery nebudete moct vytvořit požadované virtuální počítače Azure.
- Doporučená velikost dávky virtuálního počítače: Doporučená velikost dávky je založená na možnosti dokončit počáteční replikaci dávky ve výchozím nastavení během 72 hodin a současně s 100% splněním cíle RPO. Hodnotu v hodině je možné upravit.
Tato doporučení můžete použít k plánování prostředků Azure, šířky pásma sítě a dávkování virtuálních počítače.
Plánování předplatných a kvót Azure
Chceme zajistit, aby dostupné kvóty v cílovém předplatném byly dostatečné pro zpracování převzetí služeb při selhání.
| Úkol | Podrobnosti | Akce |
|---|---|---|
| Kontrola jader | Pokud se počet jader v dostupné kvótě v době převzetí služeb při selhání nerovná nebo nepřekročí celkový cílový počet, převzetí služeb při selhání selže. | V případě virtuálních počítačů VMware zkontrolujte, že máte v cílovém předplatném dostatek jader, aby splňovala Plánovač nasazení doporučení. U fyzických serverů zkontrolujte, že jádra Azure splňují vaše ruční odhady. Pokud chcete zkontrolovat kvóty, klikněte v Azure Portal > Předplatné na Využití a kvóty. Přečtěte si další informace o zvýšení kvót. |
| Kontrola limitů převzetí služeb při selhání | Počet převzetí služeb při selhání nesmí překročit limity Site Recovery převzetí služeb při selhání. | Pokud převzetí služeb při selhání překročí limity, můžete přidat předplatná a provést převzetí služeb při selhání několika předplatným nebo zvýšit kvótu předplatného. |
Limity převzetí služeb při selhání
Limity značí počet převzetí služeb při selhání podporovaných Site Recovery do jedné hodiny za předpokladu, že na jeden počítač jsou tři disky.
Co znamená dodržování? Pokud chcete spustit virtuální počítač Azure, Azure vyžaduje, aby některé ovladače měly spouštěcí stav a aby se služby, jako je DHCP, nastavily na automatické spouštění.
- U počítačů, které dodržují předpisy, už tato nastavení máte.
- U počítačů se systémem Windows můžete proaktivně kontrolovat dodržování předpisů a v případě potřeby zajistit jejich dodržování předpisů. Přečtěte si další informace.
- Počítače s Linuxem se převedou do souladu pouze v době převzetí služeb při selhání.
| Počítač je v souladu s Azure? | Omezení virtuálního počítače Azure (převzetí služeb při selhání spravovaného disku) |
|---|---|
| Yes | 2000 |
| No | 1000 |
- Omezení předpokládají, že v cílové oblasti pro předplatné probíhá minimální počet dalších úloh.
- Některé oblasti Azure jsou menší a můžou mít mírně nižší limity.
Plánování infrastruktury a připojení virtuálního počítače
Po převzetí služeb při selhání do Azure potřebujete, aby vaše úlohy běžely stejně jako místně a aby uživatelům umožnily přístup k úlohám spuštěných na virtuálních počítačůch Azure.
- Přečtěte si další informace o tom, jak služby při selhání místní infrastruktury Active Directory nebo DNS přenecháte do Azure.
- Přečtěte si další informace o přípravě připojení k virtuálním počítači Azure po převzetí služeb při selhání.
Plánování zdrojové kapacity a požadavků
Je důležité, abyste měli dostatek konfiguračních serverů a procesových serverů s horizontálním navýšením kapacity, aby splňovaly požadavky na kapacitu. Při zahájení nasazení ve velkém měřítku začněte s jedním konfiguračním serverem a jedním procesový serverem se škálování na více systémů. Až dosáhnete předepsaných limitů, přidejte další servery.
Poznámka
U virtuálních počítačů VMware Plánovač nasazení doporučení ohledně konfiguračních a procesových serverů, které potřebujete. Tabulky zahrnuté v následujících postupech doporučujeme používat místo toho, abyste postupují podle Plánovač nasazení doporučení.
Nastavení konfiguračního serveru
Kapacitu konfiguračního serveru ovlivňuje počet replikovaných počítačů, nikoli četnost změn dat. Pokud chcete zjistit, jestli potřebujete další konfigurační servery, použijte tato definovaná omezení virtuálního počítače.
| Procesor | Memory (Paměť) | Disk mezipaměti | Limit replikovaného počítače |
|---|---|---|---|
| 8 vCPU 2 sokety × 4 jádra @ 2,5 GHz |
16 GB | 600 GB | Až 550 počítačů Předpokládá, že každý počítač má tři disky o velikosti 100 GB. |
- Tato omezení vycházejí z konfiguračního serveru nastaveného pomocí šablony OVF.
- Omezení předpokládají, že nepoužíváte procesový Server, který je ve výchozím nastavení spuštěn na konfiguračním serveru.
Pokud potřebujete přidat nový konfigurační server, postupujte podle těchto pokynů:
- Nastavení konfiguračního serveru pro zotavení po havárii virtuálního počítače VMware pomocí šablony OVF
- Ruční nastavení konfiguračního serveru pro fyzické servery nebo pro nasazení VMware, která nemůžou používat šablonu OVF
Při nastavování konfiguračního serveru mějte na paměti, že:
- Při nastavování konfiguračního serveru je důležité zvážit předplatné a trezor, ve kterém se nachází, protože by se neměly po instalaci změnit. Pokud potřebujete změnit trezor, musíte zrušit přidružení konfiguračního serveru od trezoru a znovu ho zaregistrovat. Tím se zastaví replikace virtuálních počítačů v trezoru.
- Pokud chcete nastavit konfigurační server s více síťovými adaptéry, měli byste to provést během nastavování. Nemůžete to provést po registraci konfiguračního serveru v trezoru.
Nastavení procesového serveru
Kapacita procesového serveru je ovlivněná mírami četnosti změn dat, nikoli počtem počítačů povolených pro replikaci.
- U rozsáhlých nasazení byste měli mít vždycky aspoň jeden procesový Server se škálováním na více instancí.
- Pokud chcete zjistit, jestli potřebujete další servery, použijte následující tabulku.
- Doporučujeme přidat server s nejvyšší specifikací.
| Procesor | Memory (Paměť) | Disk mezipaměti | Míra četnosti změn |
|---|---|---|---|
| 12 vCPU 2 sokety × 6 jader @ 2,5 GHz |
24 GB | 1 GB | Až 2 TB za den |
Procesový Server nastavte následujícím způsobem:
- Zkontrolujte požadavky.
- Nainstalujte server na portálnebo z příkazového řádku.
- Nakonfigurujte replikované počítače tak, aby používaly nový server. Pokud už máte počítače, které se replikují:
Povolit velkou škálu replikace
Po naplánování kapacity a nasazení požadovaných komponent a infrastruktury Povolte replikaci pro velký počet virtuálních počítačů.
Seřadí počítače do dávek. Povolíte replikaci pro virtuální počítače v rámci dávky a pak přejdete k další dávce.
- U virtuálních počítačů VMware můžete použít doporučenou velikost dávky virtuálního počítače v sestavě Plánovač nasazení.
- U fyzických počítačů doporučujeme identifikovat dávky založené na počítačích, které mají podobnou velikost a množství dat, a na dostupné propustnosti sítě. Cílem je dávkování počítačů, které mohou během stejné doby dokončit počáteční replikaci.
Pokud je velikost disku v počítači vysoká nebo překročí omezení v thePlanner nasazení, můžete nepostradatelné soubory přesunout (například výpisy protokolů nebo dočasné soubory) mimo počítač. Pro virtuální počítače VMware můžete tyto soubory přesunout na samostatný disk a pak Tento disk vyloučit z replikace.
Než povolíte replikaci, ověřte, jestli počítače splňují požadavky na replikaci.
Nakonfigurujte zásady replikace pro virtuální počítače VMware nebo fyzické servery.
Povolte replikaci pro virtuální počítače VMware nebo fyzické servery. Tím se aktivuje počáteční replikace pro vybrané počítače.
Monitorování nasazení
Po zahájení replikace pro první dávku virtuálních počítačů spusťte monitorování nasazení následujícím způsobem:
- Přiřaďte správce zotavení po havárii pro monitorování stavu replikovaných počítačů.
- Monitoruje události pro replikované položky a infrastrukturu.
- Monitorujte stav serverových serverů se škálováním na více instancí.
- Zaregistrujte se a získejte e-mailová oznámení pro události, abyste mohli snadněji sledovat.
- Provádějte pravidelná cvičení zotavení po havárii, abyste zajistili, že všechno funguje podle očekávání.
Plán pro převzetí služeb při selhání ve velkém měřítku
V případě havárie možná budete muset převzít služby při selhání velkého počtu počítačů nebo úloh do Azure. Připravte se na tento typ události následujícím způsobem.
Pro převzetí služeb při selhání se můžete připravit předem následujícím způsobem:
- Připravte svoji infrastrukturu a virtuální počítače tak, aby vaše úlohy byly dostupné po převzetí služeb při selhání, takže uživatelé budou mít přístup k virtuálním počítačům Azure.
- Poznamenejte si omezení převzetí služeb při selhání výše v tomto dokumentu. Ujistěte se, že převzetí služeb při selhání spadá do těchto limitů.
- Spusťte běžné cvičení zotavení po havárii. Podrobnější informace k podrobnostem:
- Před převzetím služeb při selhání Najděte ve svém nasazení mezery.
- Odhadněte kompletní RTO pro vaše aplikace.
- Odhad kompletních RPO pro vaše úlohy.
- Identifikujte konflikty rozsahu IP adres.
- Při spouštění podrobností doporučujeme, abyste nepoužívali provozní sítě pro procházení a po každém přechodu provedli vyčištění testovacího převzetí služeb při selhání.
Pro spuštění rozsáhlého převzetí služeb při selhání doporučujeme následující:
- Vytvořte plány obnovení pro převzetí služeb při selhání pro úlohu.
- Každý plán obnovení může aktivovat převzetí služeb při selhání až 100 počítačů.
- Přečtěte si další informace o plánech obnovení.
- Přidejte Azure Automation skripty Runbook do plánů obnovení, abyste mohli automatizovat ruční úlohy v Azure. Mezi obvyklé úlohy patří konfigurace nástrojů pro vyrovnávání zatížení, aktualizace DNS atd. Další informace
- před převzetím služeb při selhání připravte Windows počítače tak, aby splňovaly prostředí Azure. Limity převzetí služeb při selhání jsou pro počítače, které vyhovují, vyšší. Přečtěte si další informace o sadách Runbook.
- Aktivujte převzetí služeb při selhání pomocí rutiny Start-AzRecoveryServicesAsrPlannedFailoverJob prostředí PowerShell společně s plánem obnovení.