Procedury údržby clusteru s podporou převzetí služeb při selhání

Platí pro: Azure Stack HCI, verze 21H2 a 20H2; Windows server 2022, Windows server 2019 Windows Server 2016

V tomto článku se předpokládá, že k provedení údržby potřebujete vypnout fyzický server nebo ho restartovat z nějakého jiného důvodu. Informace o instalaci aktualizací do clusteru Azure Stack HCI bez nutnosti přebírání serverů v režimu offline najdete v tématu aktualizace Azure Stackch clusterů HCI.

Přepnutí serveru do režimu offline kvůli údržbě vyžaduje pořizování částí úložiště offline, které jsou sdíleny napříč všemi servery v clusteru s podporou převzetí služeb při selhání. To vyžaduje pozastavení serveru, který chcete převést do režimu offline, vložení disků serveru do režimu údržby, přesunutí clusterových rolí a virtuálních počítačů do jiných serverů v clusteru a ověření, zda jsou všechna data k dispozici na ostatních serverech v clusteru. Tento proces zajistí, aby data zůstala bezpečná a přístupná po celou dobu údržby.

k převedení serveru do offline režimu můžete použít buď centrum pro správu Windows, nebo PowerShell. V tomto tématu jsou popsány obě metody.

převedení serveru do režimu offline pomocí centra pro správu Windows

nejjednodušším způsobem, jak provést přípravu serveru do režimu offline, je použití centra pro správu Windows.

Ověřte, že je možné převést Server do offline režimu.

  1. pomocí centra pro správu Windows se připojte k serveru, který chcete převést do režimu offline. v nabídce nástroje vyberte Storage disky a ověřte, že se ve sloupci stav u všech virtuálních disků zobrazuje Online.

  2. pak vyberte Storage svazky a ověřte, zda se ve sloupci stav pro každý svazek zobrazuje v pořádku a zda se ve sloupci stav pro každý svazek zobrazuje OK.

Pozastavení a vyprázdnění serveru

Před vypnutím nebo restartováním serveru byste měli pozastavit Server a vyprázdnit (přesunout) jakékoli clusterové role, jako jsou třeba virtuální počítače, které jsou v něm spuštěné. Servery s clustery vždy pozastavte a vyprázdnte, než je budete mít offline kvůli údržbě.

  1. pomocí centra pro správu Windows se připojte ke clusteru a pak vyberte compute servers z nabídky nástroje ve správci clusteru.

  2. Vyberte inventář. Klikněte na název serveru, který chcete pozastavit a vyprázdnit, a vyberte pozastavit. Měla by se zobrazit následující výzva:

    Pozastavit servery k údržbě: opravdu chcete pozastavit servery? Tím se přesunou úlohy, jako jsou virtuální počítače, na ostatní servery v clusteru.

  3. Vyberte Ano , pokud chcete server pozastavit a zahájit proces vyprázdnění. Stav serveru se bude zobrazovat jako při údržbě, vyprazdňovánía rolích, jako je například Hyper-V, a virtuální počítače se okamžitě začnou migrovat na ostatní servery v clusteru. Může to trvat několik minut. Na server se nedají přidat žádné role, dokud nebude obnovený. Po dokončení procesu vyprázdnění se stav serveru bude zobrazovat jako při údržbě, vyprázdnit dokončeno. Operační systém provádí automatickou kontrolu bezpečnosti, aby bylo zajištěno, že bude bezpečné pokračovat. Pokud se vyskytnou chybné svazky, zastaví se a upozorní vás, že není bezpečné pokračovat.

Vypnout server

Až se server dokončí, můžete ho bezpečně vypnout kvůli údržbě nebo ho restartovat.

Upozornění

pokud na serveru běží Azure Stack HCI, verze 20H2, Windows server 2019 nebo Windows Server 2016, musíte disky před vypnutím serveru a před obnovením serveru do clusteru převzítdo režimu údržby .

Obnovit server

Až budete připraveni na server, aby znovu spustil hostování clusterových rolí a virtuálních počítačů, jednoduše ho zapněte, počkejte, až se spustí, a pak obnovte server pomocí následujících kroků.

  1. Ve Správci clusteru vyberte v nabídce nástroje na levé straně výpočetní servery .

  2. Vyberte inventář. Klikněte na název serveru, který chcete obnovit, a potom klikněte na tlačítko obnovit.

Clusterové role a virtuální počítače začnou hned migrovat za provozu zpátky na server. Může to trvat několik minut.

Počkejte, až se úložiště znovu synchronizuje.

Po obnovení serveru se musí znovu synchronizovat všechny nové zápisy, k nimž došlo v době, kdy byla nedostupná. K tomu dochází automaticky pomocí inteligentního sledování změn. Není nutné, aby byla všechna data prohledávána nebo synchronizována; pouze změny. Tento proces se omezuje, aby se zmírnil dopad na produkční úlohy. V závislosti na tom, jak dlouho byl server pozastaven a kolik nových dat bylo zapsáno, může trvat několik minut, než se dokončí.

Důležité

Než budete přebírat jakékoli jiné servery v clusteru offline, musíte počkat na dokončení opětovné synchronizace.

pokud chcete zjistit, jestli se synchronizace dokončila, připojte se k serveru pomocí centra pro správu Windows a v nabídce nástroje na levé straně vyberte svazky Storage a pak vyberte svazky v horní části stránky. Pokud se ve sloupci Stav u každého svazku zobrazuje stav v pořádkua sloupecstav pro každý svazek zobrazuje OK, pak se synchronizace znovu dokončila a teď je bezpečně přebírat ostatní servery v clusteru offline.

Použití prostředí PowerShell k převedení serveru do offline režimu

Pomocí následujících postupů můžete správně pozastavit, vyprázdnit a obnovit server v clusteru s podporou převzetí služeb při selhání pomocí PowerShellu.

Ověřte, že je možné převést Server do offline režimu.

Pokud chcete ověřit, jestli jsou všechny vaše svazky v pořádku, spusťte následující rutinu jako správce:

Get-VirtualDisk

Tady je příklad toho, co může vypadat jako výstup:

FriendlyName              ResiliencySettingName FaultDomainRedundancy OperationalStatus HealthStatus    Size FootprintOnPool StorageEfficiency
------------              --------------------- --------------------- ----------------- ------------    ---- --------------- -----------------
Mirror II                 Mirror                1                     OK                Healthy         4 TB         8.01 TB            49.99%
Mirror-accelerated parity                                             OK                Healthy      1002 GB         1.96 TB            49.98%
Mirror                    Mirror                1                     OK                Healthy         1 TB            2 TB            49.98%
ClusterPerformanceHistory Mirror                1                     OK                Healthy        24 GB           49 GB            48.98%

Ověřte, zda je vlastnost funkčnosti pro každý svazek v pořádku a provozním zobrazí OK.

pokud to chcete provést pomocí Správce clusteru s podporou převzetí služeb při selhání, navštivte Storagedisky.

Pozastavení a vyprázdnění serveru

Spusťte následující rutinu jako správce pro pozastavení a vyprázdnění serveru:

Suspend-ClusterNode -Drain

Pokud to chcete provést v Správce clusteru s podporou převzetí služeb při selhání, přejděte na uzly, klikněte pravým tlačítkem myši na uzel a pak vyberte pozastavitvyprazdňování rolí.

pokud je na serveru spuštěný Azure Stack hcl, verze 21H2 nebo Windows server 2022, disky serveru se také přestanou do režimu údržby. pokud na serveru běží Azure Stack HCI, verze 20H2, Windows server 2019 nebo Windows Server 2016, budete to muset udělat ručně (viz další krok).

Vložení disků do režimu údržby

v Azure Stack HCI, verze 20H2, Windows Server 2019 a Windows Server 2016, že disky serveru v režimu údržby poskytují Prostory úložiště k řádnému vyprázdnění a potvrzení dat, aby se zajistilo, že vypnutí serveru nemá vliv na stav aplikace. Jakmile se disk přepne do režimu údržby, již nebude moci zapisovat. Aby se minimalizovala doba obnovení úložiště, doporučujeme před restartováním umístit disky do režimu údržby a až do okamžiku, kdy se systém zálohuje, do režimu údržby.

Poznámka

pokud je na serveru spuštěný Azure Stack HCI, verze 21H2 nebo Windows server 2022, můžete tento krok přeskočit, protože disky se při pozastavení a vyprázdnění serveru automaticky převedou do režimu údržby. Tyto operační systémy mají podrobnou funkci opravy, která umožňuje rychlejší a méně dopad na systémové a síťové prostředky, což umožňuje provádět údržbu serveru a úložiště společně.

pokud na serveru běží Windows server 2019 nebo Azure Stack HCI, 20H2 verze, spusťte následující rutinu jako správce:

Get-StorageScaleUnit -FriendlyName "Server1" | Enable-StorageMaintenanceMode

pokud na serveru běží Windows Server 2016, použijte místo toho následující syntaxi:

Get-StorageFaultDomain -Type StorageScaleUnit | Where-Object {$_.FriendlyName -eq "Server1"} | Enable-StorageMaintenanceMode

Vypnout server

Až se server dokončí, bude se v PowerShellu zobrazovat jako pozastavený a Správce clusteru s podporou převzetí služeb při selhání.

Server teď můžete bezpečně vypnout nebo restartovat pomocí Stop-ComputerRestart-Computer rutin PowerShellu nebo pomocí Správce clusteru s podporou převzetí služeb při selhání.

Poznámka

Při spuštění Get-VirtualDisk příkazu na serverech, které vypíná nebo spouští nebo zastavuje Clusterovou službu, může být provozní stav serveru hlášen jako neúplný nebo snížený a sloupec stavu může obsahovat upozornění. To je normální a nemělo by to mít obavy. Všechny vaše svazky zůstávají online a přístupné.

Odvádět disky z režimu údržby

pokud na serveru běží Azure Stack HCI, verze 20H2, Windows server 2019 nebo Windows Server 2016, musíte před obnovením serveru do clusteru zakázat režim údržby úložiště na discích. K minimalizaci doby opětovné synchronizace úložiště doporučujeme, abyste je z režimu údržby nastavili ihned po zálohování systému.

Poznámka

pokud na serveru běží Azure Stack HCI, verze 21H2 nebo Windows server 2022, můžete tento krok přeskočit, protože disky se při obnovení serveru automaticky odeberou z režimu údržby.

pokud na serveru běží Windows server 2019 nebo Azure Stack HCI, 20H2 verze, spusťte následující rutinu jako správce a zakažte režim údržby úložiště:

Get-StorageScaleUnit -FriendlyName "Server1" | Disable-StorageMaintenanceMode

pokud na serveru běží Windows Server 2016, použijte místo toho následující syntaxi:

Get-StorageFaultDomain -Type StorageScaleUnit | Where-Object {$_.FriendlyName -eq "Server1"} | Disable-StorageMaintenanceMode

Obnovit server

Obnovte Server do clusteru. Chcete-li vrátit clusterové role a virtuální počítače, které byly dříve spuštěny na serveru, použijte příznak -navrácení služeb po obnovení :

Resume-ClusterNode –Failback Immediate

Provedete Správce clusteru s podporou převzetí služeb při selhání to tak, že přejdete na uzly, kliknete pravým tlačítkem na uzel a pak vyberete obnovitneúspěšné role zpět.

Po obnovení serveru se zobrazí v PowerShellu a Správce clusteru s podporou převzetí služeb při selhání.

Počkejte, až se úložiště znovu synchronizuje.

Po obnovení serveru je nutné počkat na opětovnou synchronizaci, aby bylo možné provést další servery v clusteru offline.

Spusťte následující rutinu jako správce a sledujte průběh:

Get-StorageJob

Pokud se opětovná synchronizace už dokončila, nebudete mít žádný výstup.

Tady je příklad výstupu ukazujícího, že stále běží úlohy opětovné synchronizace (opravy):

Name   IsBackgroundTask ElapsedTime JobState  PercentComplete BytesProcessed BytesTotal
----   ---------------- ----------- --------  --------------- -------------- ----------
Repair True             00:06:23    Running   65              11477975040    17448304640
Repair True             00:06:40    Running   66              15987900416    23890755584
Repair True             00:06:52    Running   68              20104802841    22104819713

Ve sloupci bytesTotal se zobrazuje, kolik úložného prostoru se musí znovu synchronizovat. Ve sloupci PercentComplete se zobrazuje průběh.

Upozornění

Není bezpečné přebírat jiný server offline, dokud nebudou dokončeny tyto úlohy opravy.

Během této doby se v části funkčnostibudou vaše svazky dál zobrazovat jako Upozornění, což je normální.

Pokud například použijete Get-VirtualDisk rutinu při opětovné synchronizaci úložiště, může se zobrazit následující výstup:

FriendlyName ResiliencySettingName OperationalStatus HealthStatus IsManualAttach Size
------------ --------------------- ----------------- ------------ -------------- ----
MyVolume1    Mirror                InService         Warning      True           1 TB
MyVolume2    Mirror                InService         Warning      True           1 TB
MyVolume3    Mirror                InService         Warning      True           1 TB

Až se úlohy dokončí, ověřte, že svazky znovu zobrazují v pořádku pomocí rutiny. Tady je příklad výstupu:

FriendlyName ResiliencySettingName OperationalStatus HealthStatus IsManualAttach Size
------------ --------------------- ----------------- ------------ -------------- ----
MyVolume1    Mirror                OK                Healthy      True           1 TB
MyVolume2    Mirror                OK                Healthy      True           1 TB
MyVolume3    Mirror                OK                Healthy      True           1 TB

Nyní je bezpečné pozastavit a restartovat další servery v clusteru.

Další kroky

Související informace najdete v tématu také: