Underhållsprocedurer för redundanskluster
Gäller för: Azure Stack HCI, versionerna 21H2 och 20H2; Windows Server 2022, Windows Server 2019, Windows Server 2016
Den här artikeln förutsätter att du behöver stänga av en fysisk server för att utföra underhåll eller starta om den av någon annan anledning. Information om hur du installerar uppdateringar Azure Stack HCI ett kluster utan att ta servrar offline finns i Uppdatera Azure Stack HCI kluster.
Att ta en server offline för underhåll kräver att delar av lagringsutrymmet är offline och delas mellan alla servrar i ett redundanskluster. Detta kräver att du pausar den server som du vill ta offline, försätter serverns diskar i underhållsläge, flyttar klustrade roller och virtuella datorer (VM) till andra servrar i klustret och kontrollerar att alla data är tillgängliga på de andra servrarna i klustret. Den här processen säkerställer att data förblir säkra och tillgängliga under underhållsperioden.
Du kan använda antingen Windows Administrationscenter eller PowerShell för att ta en server offline för underhåll. Det här avsnittet beskriver båda metoderna.
Ta en server offline med hjälp Windows Administrationscenter
Det enklaste sättet att förbereda för att ta en server offline är att använda Windows Administrationscenter.
Kontrollera att det är säkert att ta servern offline
Använd Windows Administrationscenter och anslut till den server som du vill koppla från. Välj Storage diskar på menyn Verktyg och kontrollera att kolumnen Status för varje virtuell disk visar Online.
Välj sedan Storage Volymer och kontrollera att kolumnen Hälsa för varje volym visar Felfri och att kolumnen Status för varje volym visar OK.
Pausa och tömma servern
Innan du stänger av eller startar om en server bör du pausa servern och tömma (flytta bort) alla klustrade roller, till exempel virtuella datorer som körs på den. Pausa och töm alltid klustrade servrar innan du tar dem offline för underhåll.
Använd Windows Administrationscenter, anslut till klustret och välj sedan Beräkningsservrar på menyn Verktyg i Klusterhanteraren.
Välj Inventering. Klicka på namnet på den server som du vill pausa och tömma och välj Pausa. Du bör se följande meddelande:
Pausa servrar för underhåll: Är du säker på att du vill pausa servrar? Detta flyttar arbetsbelastningar, till exempel virtuella datorer, till andra servrar i klustret.
Välj Ja för att pausa servern och starta tömningsprocessen. Serverstatusen visas som I underhåll,Tömning och roller som Hyper-V och virtuella datorer börjar direktmigrering till andra servrar i klustret. Det kan ta några minuter. Inga roller kan läggas till på servern förrän den återupptas. När tömningsprocessen är klar visas serverstatusen som I underhåll, Töm slutförd. Operativsystemet utför en automatisk säkerhetskontroll för att säkerställa att det är säkert att fortsätta. Om det finns volymer med feltillstånd stoppas den och varnar dig om att det inte är säkert att fortsätta.
Stäng av servern
När servern har tömts kan du stänga av den för underhåll eller starta om den på ett säkert sätt.
Varning
Om servern kör Azure Stack HCI, version 20H2, Windows Server 2019 eller Windows Server 2016 måste du föra diskarna i underhållsläge innan du stänger av servern och tar bort diskarna från underhållsläget innan du återupptar servern i klustret.
Återuppta servern
När du är redo att servern ska börja vara värd för klustrade roller och virtuella datorer igen aktiverar du bara servern, väntar tills den startas och återupptar servern med hjälp av följande steg.
I Klusterhanteraren väljer du Beräkningsservrarpå menyn Verktyg till vänster.
Välj Inventering. Klicka på namnet på den server som du vill återuppta och klicka sedan på Återuppta.
Klustrade roller och virtuella datorer börjar direktmigrera tillbaka till servern. Det kan ta några minuter.
Vänta tills lagringen synkroniseras om
När servern återupptas måste alla nya skrivningar som inträffade när den inte var tillgänglig synkroniseras om. Detta sker automatiskt med hjälp av intelligent ändringsspårning. Det är inte nödvändigt att alla data genomsöks eller synkroniseras. endast ändringarna. Den här processen begränsas för att minska påverkan på produktionsarbetsbelastningar. Beroende på hur länge servern pausades och hur mycket nya data som skrevs kan det ta många minuter att slutföra.
Viktigt
Du måste vänta tills omsynkronisering har slutförts innan du tar några andra servrar i klustret offline.
Om du vill kontrollera om omsynkronisering har slutförts ansluter du till servern med hjälp av administrationscentret för Windows och väljer Storage-volymer på menyn Verktyg till vänster och väljer sedan Volymer längst upp på sidan. Om kolumnen Hälsa för varje volym visar Felfri och kolumnen Status för varje volym visar OKhar omsynkronisering slutförts och det är nu säkert att ta andra servrar i klustret offline.
Ta en server offline med PowerShell
Använd följande procedurer för att pausa, tömma och återuppta en server i ett redundanskluster med PowerShell.
Kontrollera att det är säkert att ta servern offline
Kontrollera att alla volymer är felfria genom att köra följande cmdlet som administratör:
Get-VirtualDisk
Här är ett exempel på hur utdata kan se ut:
FriendlyName ResiliencySettingName FaultDomainRedundancy OperationalStatus HealthStatus Size FootprintOnPool StorageEfficiency
------------ --------------------- --------------------- ----------------- ------------ ---- --------------- -----------------
Mirror II Mirror 1 OK Healthy 4 TB 8.01 TB 49.99%
Mirror-accelerated parity OK Healthy 1002 GB 1.96 TB 49.98%
Mirror Mirror 1 OK Healthy 1 TB 2 TB 49.98%
ClusterPerformanceHistory Mirror 1 OK Healthy 24 GB 49 GB 48.98%
Kontrollera att egenskapen HealthStatus för varje volym är Felfri och att OperationalStatus visar OK.
Om du vill göra detta Klusterhanteraren för växling vid fel du till StorageDisks.
Pausa och tömma servern
Kör följande cmdlet som administratör för att pausa och tömma servern:
Suspend-ClusterNode -Drain
Det gör du Klusterhanteraren för växling vid fel genom att gå till Noder,högerklicka på noden och sedan välja Pausatömningsroller.
Om servern kör Azure Stack HCI, version 21H2 eller Windows Server 2022, kommer pausning och tömning av servern också att föra serverns diskar i underhållsläge. Om servern kör Azure Stack HCI version 20H2, Windows Server 2019 eller Windows Server 2016 måste du göra detta manuellt (se nästa steg).
Placera diskar i underhållsläge
I Azure Stack HCI version 20H2, Windows Server 2019 och Windows Server 2016 ger omsätt serverns diskar i underhållsläge Lagringsutrymmen Direct en möjlighet att rensa och genomföra data på ett smidigt sätt för att säkerställa att serveravstängningen inte påverkar programtillståndet. Så snart en disk förs i underhållsläge kommer den inte längre att tillåta skrivningar. För att minimera omsynktiden för lagring rekommenderar vi att du försätter diskarna i underhållsläge precis före omstarten och tar bort dem från underhållsläget så fort systemet är tillbaka.
Anteckning
Om servern kör Azure Stack HCI, version 21H2 eller Windows Server 2022 kan du hoppa över det här steget eftersom diskarna automatiskt förs i underhållsläge när servern pausas och töms. Dessa operativsystem har en detaljerad reparationsfunktion som gör omsynkronisering snabbare och mindre påverkan på system- och nätverksresurser, vilket gör det möjligt att utföra server- och lagringsunderhåll tillsammans.
Om servern kör Windows Server 2019 eller Azure Stack HCI version 20H2 kör du följande cmdlet som administratör:
Get-StorageScaleUnit -FriendlyName "Server1" | Enable-StorageMaintenanceMode
Om servern kör en Windows Server 2016 använder du följande syntax i stället:
Get-StorageFaultDomain -Type StorageScaleUnit | Where-Object {$_.FriendlyName -eq "Server1"} | Enable-StorageMaintenanceMode
Stäng av servern
När servern har tömts visas den som Pausad i PowerShell och Klusterhanteraren för växling vid fel.
Nu kan du stänga av servern på ett säkert sätt eller starta om den med hjälp av Stop-ComputerRestart-Computer PowerShell-cmdletarna eller med hjälp av Klusterhanteraren för växling vid fel.
Anteckning
När du kör ett kommando på servrar som stänger av eller startar/stoppar klustertjänsten kan serverns driftstatus rapporteras som ofullständig eller försämrad, och kolumnen Hälsostatus kan visa en Get-VirtualDisk varning. Detta är normalt och bör inte orsaka problem. Alla dina volymer förblir online och tillgängliga.
Ta bort diskar från underhållsläge
Om servern kör Azure Stack HCI, version 20H2, Windows Server 2019 eller Windows Server 2016 måste du inaktivera lagringsunderhållsläget på diskarna innan du återupptar servern i klustret. För att minimera omsynktiden för lagring rekommenderar vi att du tar bort dem från underhållsläget så fort systemet är i drift igen.
Anteckning
Om servern kör Azure Stack HCI, version 21H2 eller Windows Server 2022 kan du hoppa över det här steget eftersom diskarna automatiskt tas bort från underhållsläget när servern återupptas.
Om servern kör Windows Server 2019 eller Azure Stack HCI, version 20H2, kör du följande cmdlet som administratör för att inaktivera lagringsunderhållsläge:
Get-StorageScaleUnit -FriendlyName "Server1" | Disable-StorageMaintenanceMode
Om servern kör en Windows Server 2016 använder du följande syntax i stället:
Get-StorageFaultDomain -Type StorageScaleUnit | Where-Object {$_.FriendlyName -eq "Server1"} | Disable-StorageMaintenanceMode
Återuppta servern
Återuppta servern till klustret. Om du vill returnera klustrade roller och virtuella datorer som tidigare kördes på servern använder du den valfria flaggan -Failback:
Resume-ClusterNode –Failback Immediate
Om du vill göra Klusterhanteraren för växling vid fel går du till Noder,högerklickar på noden och väljer sedan Återupptaredundansroller tillbaka.
När servern har återupptagits visas den som Upp i PowerShell och Klusterhanteraren för växling vid fel.
Vänta tills lagringen synkroniseras om
När servern återupptas måste du vänta tills omsynkronisering har slutförts innan du tar några andra servrar i klustret offline.
Kör följande cmdlet som administratör för att övervaka förloppet:
Get-StorageJob
Om omsynkronisering redan har slutförts får du inga utdata.
Här är några exempel på utdata som visar att omsynkroniseringsjobb (reparation) fortfarande körs:
Name IsBackgroundTask ElapsedTime JobState PercentComplete BytesProcessed BytesTotal
---- ---------------- ----------- -------- --------------- -------------- ----------
Repair True 00:06:23 Running 65 11477975040 17448304640
Repair True 00:06:40 Running 66 15987900416 23890755584
Repair True 00:06:52 Running 68 20104802841 22104819713
Kolumnen BytesTotal visar hur mycket lagringsutrymme som behöver synkroniseras om. Kolumnen PercentComplete visar förloppet.
Varning
Det är inte säkert att ta en annan server offline förrän reparationsjobben har avslutats.
Under HealthStatusunder den här tiden fortsätter volymerna att visas som Varning, vilket är normalt.
Om du till exempel använder Get-VirtualDisk cmdleten när lagringen synkroniseras om kan följande utdata visas:
FriendlyName ResiliencySettingName OperationalStatus HealthStatus IsManualAttach Size
------------ --------------------- ----------------- ------------ -------------- ----
MyVolume1 Mirror InService Warning True 1 TB
MyVolume2 Mirror InService Warning True 1 TB
MyVolume3 Mirror InService Warning True 1 TB
När jobben har slutförts kontrollerar du att volymerna visar Felfri igen med hjälp av cmdleten . Här är några exempel på utdata:
FriendlyName ResiliencySettingName OperationalStatus HealthStatus IsManualAttach Size
------------ --------------------- ----------------- ------------ -------------- ----
MyVolume1 Mirror OK Healthy True 1 TB
MyVolume2 Mirror OK Healthy True 1 TB
MyVolume3 Mirror OK Healthy True 1 TB
Nu är det säkert att pausa och starta om andra servrar i klustret.
Nästa steg
Mer information finns i: