Procedury konserwacji klastra trybu failover

Dotyczy: Azure Stack HCI, wersje 22H2 i 21H2; Windows Server 2022, Windows Server 2019, Windows Server 2016

W tym artykule przyjęto założenie, że konieczne jest wyłączenie serwera fizycznego w celu przeprowadzenia konserwacji lub ponowne uruchomienie go z innego powodu. Aby zainstalować aktualizacje w klastrze rozwiązania Azure Stack HCI bez przełączeń serwerów w tryb offline, zobacz Aktualizowanie klastrów rozwiązania Azure Stack HCI.

Przełącz serwer w tryb offline na potrzeby konserwacji wymaga przełączenia części magazynu w tryb offline, które są współużytkowane przez wszystkie serwery w klastrze trybu failover. Wymaga to wstrzymania serwera, który chcesz przełączyć w tryb offline, przełączenie dysków serwera w tryb konserwacji, przeniesienie ról klastrowanych i maszyn wirtualnych do innych serwerów w klastrze oraz sprawdzenie, czy wszystkie dane są dostępne na innych serwerach w klastrze. Ten proces gwarantuje, że dane pozostaną bezpieczne i dostępne przez cały okres konserwacji.

Możesz użyć Windows Admin Center lub programu PowerShell, aby przejąć serwer w tryb offline na potrzeby konserwacji. W tym temacie omówiono obie metody.

Przełącz serwer w tryb offline przy użyciu Windows Admin Center

Najprostszym sposobem przygotowania do przełączenie serwera w tryb offline jest użycie Windows Admin Center.

Sprawdź, czy przełączenie serwera w tryb offline jest bezpieczne

  1. Za pomocą Windows Admin Center nawiąż połączenie z serwerem, który chcesz przełączyć w tryb offline. Wybierz pozycję Dyski magazynu > z menu Narzędzia i sprawdź, czy w kolumnie Stan dla każdego dysku wirtualnego jest wyświetlana wartość Online.

  2. Następnie wybierz pozycję Woluminy magazynu > i sprawdź, czy kolumna Kondycja dla każdego woluminu ma wartość W dobrej kondycji i czy kolumna Stan dla każdego woluminu ma wartość OK.

Wstrzymywanie i opróżnianie serwera

Przed zamknięciem lub ponownym uruchomieniem serwera należy wstrzymać serwer i opróżnić (przenieść) wszystkie role klastrowane, takie jak maszyny wirtualne uruchomione na nim. Zawsze wstrzymywanie i opróżnianie klastrowanych serwerów przed przełączenie ich do trybu offline w celu przeprowadzenia konserwacji.

  1. Korzystając z Windows Admin Center, połącz się z klastrem, a następnie wybierz pozycję Serwery obliczeniowe > z menu Narzędzia w Menedżerze klastra.

  2. Wybierz pozycję Spis. Kliknij nazwę serwera, który chcesz wstrzymać i opróżnić, a następnie wybierz pozycję Wstrzymaj. Powinien zostać wyświetlony następujący monit:

    Wstrzymywanie serwerów pod kątem konserwacji: Czy na pewno chcesz wstrzymać serwery? Spowoduje to przeniesienie obciążeń, takich jak maszyny wirtualne, do innych serwerów w klastrze.

  3. Wybierz pozycję Tak , aby wstrzymać serwer i zainicjować proces opróżniania. Stan serwera będzie wyświetlany jako W konserwacji, Opróżnianie i role, takie jak Funkcja Hyper-V i maszyny wirtualne, natychmiast rozpoczną migrację na żywo do innych serwerów w klastrze. Może to potrwać kilka minut. Do momentu wznowienia nie można dodać żadnych ról do serwera. Po zakończeniu procesu opróżniania stan serwera będzie wyświetlany jako W konserwacji, Opróżnianie ukończone. System operacyjny przeprowadza automatyczną kontrolę bezpieczeństwa, aby upewnić się, że można kontynuować. Jeśli istnieją woluminy w złej kondycji, zostanie zatrzymany i zostanie wyświetlony alert informujący o tym, że kontynuowanie nie jest bezpieczne.

Zamykanie serwera

Po zakończeniu opróżniania serwera można bezpiecznie zamknąć go w celu konserwacji lub ponownego uruchomienia.

Ostrzeżenie

Jeśli na serwerze działa usługa Azure Stack HCI, wersja 20H2, Windows Server 2019 lub Windows Server 2016, przed zamknięciem serwera należy umieścić dyski w trybie konserwacji i wyłączyć tryb konserwacji dysków przed wznowieniem serwera w klastrze.

Wznawianie działania serwera

Gdy serwer będzie gotowy do ponownego rozpoczęcia hostowania ról klastrowanych i maszyn wirtualnych, po prostu włącz serwer, zaczekaj na jego uruchomienie i wznów działanie serwera, wykonując poniższe kroki.

  1. W Menedżerze klastra wybierz pozycję Serwery obliczeniowe > z menu Narzędzia po lewej stronie.

  2. Wybierz pozycję Spis. Kliknij nazwę serwera, który chcesz wznowić, a następnie kliknij przycisk Wznów.

Role klastrowane i maszyny wirtualne natychmiast rozpoczną migrację na żywo z powrotem do serwera. Może to potrwać kilka minut.

Oczekiwanie na ponowną synchronizację magazynu

Po wznowieniu działania serwera wszystkie nowe zapisy, które wystąpiły, gdy była niedostępna, muszą być ponownie zsynchronizowane. Dzieje się to automatycznie przy użyciu inteligentnego śledzenia zmian. Nie jest konieczne, aby wszystkie dane zostały przeskanowane ani zsynchronizowane; tylko zmiany. Ten proces jest ograniczany w celu ograniczenia wpływu na obciążenia produkcyjne. W zależności od tego, jak długo serwer został wstrzymany i ile nowych danych zostało zapisanych, ukończenie może potrwać wiele minut.

Ważne

Przed przełączenie innych serwerów w klastrze w tryb offline należy poczekać na ukończenie ponownej synchronizacji.

Aby sprawdzić, czy ponowna synchronizacja magazynu została ukończona:

  1. Połącz się z klastrem przy użyciu Windows Admin Center i wybierz pozycję Woluminy magazynu>.
  2. Wybierz pozycję Spis.
  3. Sprawdź kolumnę Stan dla każdego woluminu. Jeśli jest wyświetlany komunikat OK, ponowna synchronizacja magazynu zostanie ukończona. Teraz można bezpiecznie przejąć inne serwery w klastrze w tryb offline.

Przełącz serwer w tryb offline przy użyciu programu PowerShell

Poniższe procedury umożliwiają prawidłowe wstrzymywanie, opróżnianie i wznawianie serwera w klastrze trybu failover przy użyciu programu PowerShell.

Sprawdź, czy przełączenie serwera w tryb offline jest bezpieczne

Aby sprawdzić, czy wszystkie woluminy są w dobrej kondycji, uruchom następujące polecenie cmdlet jako administrator:

Get-VirtualDisk

Oto przykład tego, jak mogą wyglądać dane wyjściowe:

FriendlyName              ResiliencySettingName FaultDomainRedundancy OperationalStatus HealthStatus    Size FootprintOnPool StorageEfficiency
------------              --------------------- --------------------- ----------------- ------------    ---- --------------- -----------------
Mirror II                 Mirror                1                     OK                Healthy         4 TB         8.01 TB            49.99%
Mirror-accelerated parity                                             OK                Healthy      1002 GB         1.96 TB            49.98%
Mirror                    Mirror                1                     OK                Healthy         1 TB            2 TB            49.98%
ClusterPerformanceHistory Mirror                1                     OK                Healthy        24 GB           49 GB            48.98%

Sprawdź, czy właściwość HealthStatus dla każdego woluminu ma wartość W dobrej kondycji, a właściwość OperationalStatus ma wartość OK.

Aby to zrobić przy użyciu Menedżera klastra trybu failover, przejdź do pozycjiDyskimagazynu>.

Wstrzymywanie i opróżnianie serwera

Uruchom następujące polecenie cmdlet jako administrator, aby wstrzymać i opróżnić serwer:

Suspend-ClusterNode -Drain

Aby to zrobić w Menedżerze klastra trybu failover, przejdź do węzłów, kliknij prawym przyciskiem myszy węzeł, a następnie wybierz polecenie Wstrzymaj>role opróżniania.

Jeśli na serwerze działa usługa Azure Stack HCI, wersja 21H2 lub Windows Server 2022, wstrzymanie i opróżnienie serwera spowoduje również przełączenie dysków serwera w tryb konserwacji. Jeśli na serwerze działa rozwiązanie Azure Stack HCI, wersja 20H2, Windows Server 2019 lub Windows Server 2016, należy to zrobić ręcznie (zobacz następny krok).

Umieszczanie dysków w trybie konserwacji

W usłudze Azure Stack HCI w wersji 20H2, Windows Server 2019 i Windows Server 2016 umieszczenie dysków serwera w trybie konserwacji daje Bezpośrednie miejsca do magazynowania możliwość bezproblemowego opróżniania i zatwierdzania danych w celu zapewnienia, że zamknięcie serwera nie ma wpływu na stan aplikacji. Gdy tylko dysk przejdzie w tryb konserwacji, nie będzie już zezwalać na zapisy. Aby zminimalizować czas ponownej synchronizacji magazynu, zalecamy umieszczenie dysków w trybie konserwacji bezpośrednio przed ponownym uruchomieniem i wyprowadzenie ich z trybu konserwacji natychmiast po utworzeniu kopii zapasowej systemu.

Uwaga

Jeśli na serwerze działa usługa Azure Stack HCI, wersja 21H2 lub Windows Server 2022, możesz pominąć ten krok, ponieważ dyski są automatycznie umieszczane w trybie konserwacji po wstrzymaniu i opróżnieniu serwera. Te systemy operacyjne mają szczegółową funkcję naprawy, która sprawia, że ponowna synchronizacja jest szybsza i mniej wpływa na zasoby systemowe i sieciowe, dzięki czemu możliwe jest wykonanie razem konserwacji serwera i magazynu.

Jeśli na serwerze działa system Windows Server 2019 lub Azure Stack HCI w wersji 20H2, uruchom następujące polecenie cmdlet jako administrator:

Get-StorageScaleUnit -FriendlyName "Server1" | Enable-StorageMaintenanceMode

Jeśli na serwerze działa Windows Server 2016, użyj następującej składni:

Get-StorageFaultDomain -Type StorageScaleUnit | Where-Object {$_.FriendlyName -eq "Server1"} | Enable-StorageMaintenanceMode

Zamykanie serwera

Po zakończeniu opróżniania serwera będzie on wyświetlany jako Wstrzymany w programie PowerShell i Menedżerze klastra trybu failover.

Teraz można bezpiecznie zamknąć serwer lub uruchomić go ponownie za pomocą Stop-Computer poleceń cmdlet programu PowerShell lub Restart-Computer przy użyciu Menedżera klastra trybu failover.

Uwaga

Podczas uruchamiania Get-VirtualDisk polecenia na serwerach, które zamykają lub uruchamiają/zatrzymują usługę klastra, stan operacyjny serwera może być zgłaszany jako niekompletny lub obniżony poziom wydajności, a kolumna Stan kondycji może wyświetlić ostrzeżenie. Jest to normalne i nie powinno powodować obaw. Wszystkie woluminy pozostają w trybie online i dostępne.

Wyjmij dyski z trybu konserwacji

Jeśli na serwerze działa usługa Azure Stack HCI, wersja 20H2, Windows Server 2019 lub Windows Server 2016, należy wyłączyć tryb konserwacji magazynu na dyskach przed wznowieniem serwera w klastrze. Aby zminimalizować czas ponownego synchronizacji magazynu, zalecamy wyprowadzenie ich z trybu konserwacji natychmiast po utworzeniu kopii zapasowej systemu.

Uwaga

Jeśli na serwerze działa usługa Azure Stack HCI w wersji 21H2 lub Windows Server 2022, możesz pominąć ten krok, ponieważ dyski zostaną automatycznie wyjęte z trybu konserwacji po wznowieniu serwera.

Jeśli na serwerze działa system Windows Server 2019 lub Azure Stack HCI w wersji 20H2, uruchom następujące polecenie cmdlet jako administrator, aby wyłączyć tryb konserwacji magazynu:

Get-StorageScaleUnit -FriendlyName "Server1" | Disable-StorageMaintenanceMode

Jeśli na serwerze działa Windows Server 2016, użyj następującej składni:

Get-StorageFaultDomain -Type StorageScaleUnit | Where-Object {$_.FriendlyName -eq "Server1"} | Disable-StorageMaintenanceMode

Wznawianie działania serwera

Wznów serwer w klastrze. Aby zwrócić role klastrowane i maszyny wirtualne, które były wcześniej uruchomione na serwerze, użyj opcjonalnej flagi -Failback :

Resume-ClusterNode –Failback Immediate

Aby to zrobić w Menedżerze klastra trybu failover, przejdź do węzłów, kliknij prawym przyciskiem myszy węzeł, a następnie wybierz polecenie Wznów>role po awarii.

Po wznowieniu działania serwera będzie on wyświetlany jako Up w programie PowerShell i Menedżerze klastra trybu failover.

Oczekiwanie na ponowną synchronizację magazynu

Po wznowieniu działania serwera należy poczekać na ukończenie ponownej synchronizacji przed przełączenie innych serwerów w klastrze w tryb offline.

Uruchom następujące polecenie cmdlet jako administrator, aby monitorować postęp:

Get-StorageJob

Jeśli ponowna synchronizacja została już ukończona, nie otrzymasz żadnych danych wyjściowych.

Oto kilka przykładowych danych wyjściowych przedstawiających nadal uruchomione zadania ponownej synchronizacji (naprawy):

Name   IsBackgroundTask ElapsedTime JobState  PercentComplete BytesProcessed BytesTotal
----   ---------------- ----------- --------  --------------- -------------- ----------
Repair True             00:06:23    Running   65              11477975040    17448304640
Repair True             00:06:40    Running   66              15987900416    23890755584
Repair True             00:06:52    Running   68              20104802841    22104819713

Kolumna BytesTotal pokazuje, ile miejsca do magazynowania wymaga ponownej synchronizacji. W kolumnie PercentComplete jest wyświetlany postęp.

Ostrzeżenie

Nie można bezpiecznie przejąć innego serwera w tryb offline, dopóki te zadania naprawy nie zakończą się.

W tym czasie w obszarze HealthStatus woluminy będą nadal wyświetlane jako Ostrzeżenie, co jest normalne.

Jeśli na przykład używasz polecenia cmdlet podczas ponownej Get-VirtualDisk synchronizacji magazynu, mogą zostać wyświetlone następujące dane wyjściowe:

FriendlyName ResiliencySettingName OperationalStatus HealthStatus IsManualAttach Size
------------ --------------------- ----------------- ------------ -------------- ----
MyVolume1    Mirror                InService         Warning      True           1 TB
MyVolume2    Mirror                InService         Warning      True           1 TB
MyVolume3    Mirror                InService         Warning      True           1 TB

Po zakończeniu zadań sprawdź, czy woluminy są ponownie wyświetlane w dobrej kondycjiGet-VirtualDisk przy użyciu polecenia cmdlet . Oto kilka przykładowych danych wyjściowych:

FriendlyName ResiliencySettingName OperationalStatus HealthStatus IsManualAttach Size
------------ --------------------- ----------------- ------------ -------------- ----
MyVolume1    Mirror                OK                Healthy      True           1 TB
MyVolume2    Mirror                OK                Healthy      True           1 TB
MyVolume3    Mirror                OK                Healthy      True           1 TB

Teraz można bezpiecznie wstrzymać i ponownie uruchomić inne serwery w klastrze.

Następne kroki

Aby uzyskać powiązane informacje, zobacz również: