Postupy údržby clusteru s podporou převzetí služeb při selhání
Platí pro: Azure Stack HCI, verze 21H2 a 20H2; Windows Server 2022, Windows Server 2019, Windows Server 2016
Tento článek předpokládá, že k provedení údržby musíte vypnout fyzický server nebo ho z nějakého jiného důvodu restartovat. Informace o instalaci aktualizací do clusteru Azure Stack HCI bez nutnosti offline serverů najdete v tématu Aktualizace Azure Stack HCI clusterů.
Přepnutí serveru do offline režimu kvůli údržbě vyžaduje přepnutí částí úložiště do režimu offline, které jsou sdílené mezi všemi servery v clusteru s podporou převzetí služeb při selhání. To vyžaduje pozastavení serveru, který chcete pře offline, uvedení disků serveru do režimu údržby, přesun clusterových rolí a virtuálních počítačů na jiné servery v clusteru a ověření, že všechna data jsou dostupná na ostatních serverech v clusteru. Tento proces zajišťuje, aby data zůstala v bezpečí a přístupná po celou dobu údržby.
Server můžete kvůli údržbě Windows pomocí centra pro správu nebo PowerShellu. Toto téma se věnuje oběma metodám.
Offline režim serveru s využitím centra Windows pro správu
Nejjednodušší způsob, jak se připravit na offline režim serveru, je pomocí centra Windows pro správu.
Ověřte, že je bezpečné pře offline režim serveru.
Pomocí Windows Admin Center se připojte k serveru, který chcete pře offline. V Storage Nástroje vyberte Disky a ověřte, že ve sloupci Stav pro každý virtuální disk je online.
Potom vyberte Možnost Storage svazků a ověřte, že ve sloupci Stav pro každý svazek je stav V pořádku a že ve sloupci Stav u každého svazku se zobrazuje OK.
Pozastavení a vyprázdnování serveru
Před vypnutím nebo restartováním serveru byste měli server pozastavit a vyprázdnit (přesunout) všechny clusterované role, jako jsou virtuální počítače, které na serveru běží. Clusterované servery vždy pozastavte a vyprázdněte, než je přerušíte kvůli údržbě.
Pomocí Windows Admin Center se připojte ke clusteru a pak v nabídce Nástroje ve Správci clusteru vyberte Výpočetní servery.
Vyberte Inventory. Klikněte na název serveru, který chcete pozastavit a vyprázdníte, a vyberte Pozastavit. Měla by se zobrazit následující výzva:
Pozastavení serverů kvůli údržbě: Opravdu chcete pozastavit server(y)? Tím se úlohy, jako jsou virtuální počítače, přesunou na jiné servery v clusteru.
Vyberte ano, pokud chcete server pozastavit a zahájit proces vyprázdnování. Stav serveru se zobrazí jako Probíhá údržba,Vyprázdnění a role, jako je Hyper-V a virtuální počítače, okamžitě zahájí migraci za provozu na jiné servery v clusteru. Může to trvat několik minut. Dokud nebude obnovený, není možné na server přidávat žádné role. Po dokončení procesu vyprázdnění se stav serveru zobrazí jako V údržbě, Vyprázdnění dokončeno. Operační systém provádí automatickou bezpečnostní kontrolu, aby se zajistilo jeho bezpečné pokračování. Pokud svazky nejsou v pořádku, zastaví se a upozorní vás, že není bezpečné pokračovat.
Vypnutí serveru
Jakmile se server vyprazdní, můžete ho bezpečně vypnout kvůli údržbě nebo restartování.
Upozornění
Pokud na serveru běží Azure Stack HCI verze 20H2, Windows Server 2019 nebo Windows Server 2016, musíte disky před vypnutím serveru umístit do režimu údržby a před obnovením serveru do clusteru je vysadit z režimu údržby.
Obnovení serveru
Až budete připraveni, aby server začal znovu hostovat clusterové role a virtuální počítače, jednoduše server zapněte, počkejte na jeho spuštění a obnovte jeho činnost pomocí následujících kroků.
Ve Správci clusteru v nabídce Nástroje na levé straně vyberte Výpočetní servery.
Vyberte Inventory. Klikněte na název serveru, který chcete obnovit, a pak klikněte na Pokračovat.
Clusterové role a virtuální počítače okamžitě zahájí migraci za živého přenosu zpět na server. Může to trvat několik minut.
Počkejte na opětovnou synchronizaci úložiště.
Po obnovení serveru se všechny nové zápisy, ke které došlo v době, kdy byl nedostupný, musí znovu synchronizovat. K tomu dochází automaticky s využitím inteligentního sledování změn. Není nutné, aby se všechna data skenovala nebo synchronizovala. pouze změny. Tento proces se omeští, aby se zmírnil dopad na produkční úlohy. V závislosti na tom, jak dlouho byl server pozastavený a kolik nových dat bylo zapsáno, může dokončení trvat mnoho minut.
Důležité
Před tím, než všechny ostatní servery v clusteru převezme do režimu offline, musíte počkat na dokončení opětovné synchronizace.
Pokud chcete zkontrolovat, jestli se opětovná synchronizace dokončila, připojte se k serveru pomocí Centra pro správu Windows, v nabídce Nástroje vlevo vyberte Svazky Storage a pak v horní části stránky vyberte Svazky. Pokud se ve sloupci Stav pro každý svazek zobrazí V pořádku a ve sloupci Stav pro každý svazek se zobrazí OK,pak se dokončila znovu synchronizace a ostatní servery v clusteru je teď bezpečné pře offline.
Offline režim serveru pomocí PowerShellu
Následující postupy použijte ke správnému pozastavení, vyprazdnění a obnovení serveru v clusteru s podporou převzetí služeb při selhání pomocí PowerShellu.
Ověřte, že je bezpečné pře offline režim serveru.
Pokud chcete ověřit, jestli jsou všechny svazky v pořádku, spusťte jako správce následující rutinu:
Get-VirtualDisk
Tady je příklad, jak může výstup vypadat:
FriendlyName ResiliencySettingName FaultDomainRedundancy OperationalStatus HealthStatus Size FootprintOnPool StorageEfficiency
------------ --------------------- --------------------- ----------------- ------------ ---- --------------- -----------------
Mirror II Mirror 1 OK Healthy 4 TB 8.01 TB 49.99%
Mirror-accelerated parity OK Healthy 1002 GB 1.96 TB 49.98%
Mirror Mirror 1 OK Healthy 1 TB 2 TB 49.98%
ClusterPerformanceHistory Mirror 1 OK Healthy 24 GB 49 GB 48.98%
Ověřte, že vlastnost HealthStatus pro každý svazek je V pořádku a stav OperationalStatus zobrazuje OK.
Pokud to chcete provést pomocí Správce clusteru s podporou převzetí služeb při selhání, přejděte na StorageDisky.
Pozastavení a vyprázdnování serveru
Spuštěním následující rutiny jako správce server pozastavte a vyprázdnte:
Suspend-ClusterNode -Drain
Pokud to chcete udělat Správce clusteru s podporou převzetí služeb při selhání, přejděte naUzly, klikněte pravým tlačítkem na uzel a vyberte Pozastavit vyprázdněnérole.
Pokud na serveru běží Azure Stack HCI verze 21H2 nebo Windows Server 2022, po pozastavení a vyprázdnění serveru se disky serveru převedou do režimu údržby. Pokud na serveru běží Azure Stack HCI verze 20H2, Windows Server 2019 nebo Windows Server 2016, budete to muset udělat ručně (viz další krok).
Dejte disky do režimu údržby.
V Azure Stack HCI verze 20H2, Windows Server 2019 a Windows Server 2016 dává uvedení disků serveru do režimu údržby možnost přímého vyprázdnění Prostory úložiště a potvrzení dat, aby se zajistilo, že vypnutí serveru nebude mít vliv na stav aplikace. Jakmile disk přejde do režimu údržby, už nebude umožnovat zápisy. Pokud chcete minimalizovat dobu opětovné synchronizace úložiště, doporučujeme, abyste disky přetáhnou do režimu údržby přímo před restartováním a ihned po zálohování systému je vypadnou z režimu údržby.
Poznámka
Pokud na serveru běží Azure Stack HCI, verze 21H2 nebo Windows Server 2022, můžete tento krok přeskočit, protože disky se automaticky převedou do režimu údržby, když je server pozastavený a vyprázdněný. Tyto operační systémy mají členitou funkci opravy, která zrychluje a má menší dopad na systémové a síťové prostředky. Díky tomu je možné provést údržbu serveru a úložiště společně.
Pokud na serveru běží Windows Server 2019 nebo Azure Stack HCI verze 20H2, spusťte následující rutinu jako správce:
Get-StorageScaleUnit -FriendlyName "Server1" | Enable-StorageMaintenanceMode
Pokud na serveru běží Windows Server 2016, použijte místo toho následující syntaxi:
Get-StorageFaultDomain -Type StorageScaleUnit | Where-Object {$_.FriendlyName -eq "Server1"} | Enable-StorageMaintenanceMode
Vypnutí serveru
Jakmile se server vyprazdní, zobrazí se v PowerShellu jako Pozastaveno a Správce clusteru s podporou převzetí služeb při selhání.
Server teď můžete bezpečně vypnout nebo restartovat pomocí rutin PowerShellu nebo nebo pomocí Stop-ComputerRestart-Computer Správce clusteru s podporou převzetí služeb při selhání.
Poznámka
Při spuštění příkazu na serverech, které se vypnou nebo spouští nebo zastavují clusterovou službu, může být provozní stav serveru hlášený jako neúplný nebo snížený a ve sloupci Stav může být vypsána Get-VirtualDisk upozornění. To je normální a nemělo by to způsobovat obavy. Všechny vaše svazky zůstanou online a přístupné.
Vyvezměte disky z režimu údržby.
Pokud na serveru běží Azure Stack HCI verze 20H2, Windows Server 2019 nebo Windows Server 2016, musíte na discích zakázat režim údržby úložiště, než server znovu přepošlete do clusteru. Pokud chcete minimalizovat dobu opětovné synchronizace úložiště, doporučujeme, abyste je ihned po zálohování systému přetáhli z režimu údržby.
Poznámka
Pokud na serveru běží Azure Stack HCI, verze 21H2 nebo Windows Server 2022, můžete tento krok přeskočit, protože po obnovení serveru se disky automaticky vymknou z režimu údržby.
Pokud na serveru běží Windows Server 2019 nebo Azure Stack HCI verze 20H2, zakažte režim údržby úložiště spuštěním následující rutiny jako správce:
Get-StorageScaleUnit -FriendlyName "Server1" | Disable-StorageMaintenanceMode
Pokud na serveru běží Windows Server 2016, použijte místo toho následující syntaxi:
Get-StorageFaultDomain -Type StorageScaleUnit | Where-Object {$_.FriendlyName -eq "Server1"} | Disable-StorageMaintenanceMode
Obnovení serveru
Obnovte server v clusteru. Pokud chcete vrátit clusterové role a virtuální počítače, které byly dříve spuštěné na serveru, použijte volitelný příznak -Failback:
Resume-ClusterNode –Failback Immediate
Pokud to chcete udělat Správce clusteru s podporou převzetí služeb při selhání, přejděte naUzly, klikněte pravým tlačítkem na uzel a pak vyberte Obnovitnavrácení služeb po obnovení rolí zpět.
Po obnovení se server v PowerShellu zobrazí jako Up (V powershellu) a Správce clusteru s podporou převzetí služeb při selhání.
Počkejte na opětovnou synchronizaci úložiště.
Po obnovení serveru je nutné počkat na dokončení opětovné synchronizace, než se všechny ostatní servery v clusteru přetápou do režimu offline.
Pokud chcete sledovat průběh, spusťte následující rutinu jako správce:
Get-StorageJob
Pokud se synchronizace už dokončila, nezískacíte žádný výstup.
Tady je příklad výstupu, který ukazuje, že úlohy opětovné synchronizace (opravy) stále běží:
Name IsBackgroundTask ElapsedTime JobState PercentComplete BytesProcessed BytesTotal
---- ---------------- ----------- -------- --------------- -------------- ----------
Repair True 00:06:23 Running 65 11477975040 17448304640
Repair True 00:06:40 Running 66 15987900416 23890755584
Repair True 00:06:52 Running 68 20104802841 22104819713
Sloupec BytesTotal ukazuje, kolik úložiště je potřeba znovu synchronizovat. Ve sloupci PercentComplete se zobrazuje průběh.
Upozornění
Není bezpečné přebírat jiný server offline, dokud nebudou dokončeny tyto úlohy opravy.
Během této doby se v části funkčnostibudou vaše svazky dál zobrazovat jako Upozornění, což je normální.
Pokud například použijete Get-VirtualDisk rutinu při opětovné synchronizaci úložiště, může se zobrazit následující výstup:
FriendlyName ResiliencySettingName OperationalStatus HealthStatus IsManualAttach Size
------------ --------------------- ----------------- ------------ -------------- ----
MyVolume1 Mirror InService Warning True 1 TB
MyVolume2 Mirror InService Warning True 1 TB
MyVolume3 Mirror InService Warning True 1 TB
Až se úlohy dokončí, ověřte, že svazky znovu zobrazují v pořádku pomocí rutiny. Tady je příklad výstupu:
FriendlyName ResiliencySettingName OperationalStatus HealthStatus IsManualAttach Size
------------ --------------------- ----------------- ------------ -------------- ----
MyVolume1 Mirror OK Healthy True 1 TB
MyVolume2 Mirror OK Healthy True 1 TB
MyVolume3 Mirror OK Healthy True 1 TB
Nyní je bezpečné pozastavit a restartovat další servery v clusteru.
Další kroky
Související informace najdete v tématu také: