Verifiera ett Azure Stack HCI-kluster

Gäller för: Azure Stack HCI, versionerna 21H2 och 20H2; Windows Server 2022, Windows Server 2019

Även om guiden Skapa kluster i administrationscentret för Windows utför vissa verifieringar för att skapa ett fungerande kluster med den valda maskinvaran, utför klusterverifieringen ytterligare kontroller för att se till att klustret fungerar i en produktionsmiljö. Den här artikeln fokuserar på varför klustervalidering är viktigt och när du ska köra det på ett Azure Stack HCI kluster.

Vi rekommenderar att du utför klustervalidering för följande primära scenarier:

  • När du har distribuerat ett serverkluster kör du verktyget Validate-DCB för att testa nätverket.
  • När du har uppdaterat ett serverkluster kan du, beroende på ditt scenario, köra båda verifieringsalternativen för att felsöka klusterproblem.
  • När du har Storage replikering med en replik kontrollerar du att replikeringen fortsätter normalt genom att kontrollera vissa specifika händelser och köra några kommandon.
  • När du har skapat ett serverkluster kör du verktyget Validate-DCB innan du placerar det i produktion.

Vad är klusterverifiering?

Klustervalidering är avsedd att fånga upp maskinvaru- eller konfigurationsproblem innan ett kluster går in i produktion. Klustervalidering säkerställer att Azure Stack HCI lösning som du håller på att distribuera är helt tillförlitlig. Du kan också använda klustervalidering på konfigurerade redundanskluster som ett diagnostikverktyg.

Specifika valideringsscenarier

I det här avsnittet beskrivs scenarier där verifiering också behövs eller är användbart.

  • Verifiering innan klustret konfigureras:

    • En uppsättning servrar som är redo att bli ett redundanskluster: Det här är det enklaste valideringsscenariot. Maskinvarukomponenterna (system, nätverk och lagring) är anslutna, men systemen fungerar ännu inte som ett kluster. Att köra tester i den här situationen påverkar inte tillgängligheten.

    • Virtuella server-datorer: För virtualiserade servrar i ett kluster kör du klustervalidering på samma sätt som på andra nya kluster. Kravet på att köra funktionen är detsamma oavsett om du har:

      • Ett "värdkluster" där redundans sker mellan två fysiska datorer.
      • Ett "gästkluster" där redundans sker mellan gästoperativsystemet på samma fysiska dator.
  • Validering när klustret har konfigurerats och används:

    • Innan du lägger till en server i klustret: När du lägger till en server i ett kluster rekommenderar vi starkt att du verifierar klustret. Ange både befintliga klustermedlemmar och den nya servern när du kör klustervalidering.

    • När du lägger till enheter: När du lägger till ytterligare enheter i klustret, vilket skiljer sig från att ersätta misslyckade enheter eller skapa virtuella diskar eller volymer som förlitar sig på befintliga enheter, kör du klusterverifiering för att bekräfta att den nya lagringen kommer att fungera korrekt.

    • När du gör ändringar som påverkar inbyggd programvara eller drivrutiner: Om du uppgraderar eller gör ändringar i klustret som påverkar inbyggd programvara eller drivrutiner, måste du köra klusterverifiering för att bekräfta att den nya kombinationen av maskinvara, inbyggd programvara, drivrutiner och programvara stöder funktioner för redundanskluster.

    • När du har återställt ett system från en säkerhetskopia: När du har återställt ett system från en säkerhetskopia kör du klustervalidering för att bekräfta att systemet fungerar som en del av ett kluster.

Verifiera nätverk

Verktyget Microsoft Validate-DCB är utformat för att verifiera konfigurationen Data Center Bridging (DCB) i klustret. För att göra detta tar verktyget en förväntad konfiguration som indata och testar sedan varje server i klustret. Det här avsnittet beskriver hur du installerar och kör verktyget Validate-DCB, granskar resultat och löser nätverksfel som verktyget identifierar.

Anteckning

Microsoft rekommenderar att du distribuerar och hanterar din konfiguration med Network ATC, vilket eliminerar de flesta konfigurationsutmaningar som verktyget Validate-DCB söker efter. Mer information om Network ATC, som tillhandahåller en avsiktsbaserad metod för distribution av värdnätverk, finns i Förenkla värdnätverk med Network ATC.

I nätverket kräver DIREKTåtkomst till fjärrminne (RDMA) över konvergerat Ethernet (RoCE) DCB-teknik för att göra nätverkets infrastrukturer förlustfria. Med iWARP är DCB valfritt. Det kan dock vara komplicerat att konfigurera DCB, med exakt konfiguration som krävs för:

  • Varje server i klustret
  • Varje nätverksport som RDMA-trafik passerar via infrastrukturnätet

Förutsättningar

  • Information om nätverksinstallation för det serverkluster som du vill verifiera, inklusive:
    • Värd- eller serverklusternamn
    • Namn på virtuell växel
    • Namn på nätverkskort
    • Inställningar Flow Prioritetskontroll (PFC) och Förbättrad överföringsval (ETS)
  • En Internetanslutning för att ladda ned verktygsmodulen i Windows PowerShell från Microsoft.

Installera och köra verktyget Validate-DCB

Så här installerar och kör du verktyget Validate-DCB:

  1. På hanteringsdatorn öppnar du en Windows PowerShell som administratör och använder sedan följande kommando för att installera verktyget.

    Install-Module Validate-DCB
    
  2. Godkänn begäranden om att använda NuGet-providern och få åtkomst till lagringsplatsen för att installera verktyget.

  3. När PowerShell ansluter till Microsoft-nätverket för att ladda ned verktyget skriver du Validate-DCB och trycker på Validate-DCB för att starta verktygsguiden.

    Anteckning

    Om du inte kan köra verktyget Validate-DCB kan du behöva justera powershell-körningsprinciperna. Använd cmdleten Get-ExecutionPolicy för att visa de aktuella inställningarna för skriptkörningsprincipen. Information om hur du anger körningsprinciper i PowerShell finns i Om körningsprinciper.

  4. På sidan Välkommen till konfigurationsguiden för Validate-DCB väljer du Nästa.

  5. På sidan Kluster och noder skriver du namnet på det serverkluster som du vill verifiera, väljer Lös för att visa den på sidan och väljer sedan Nästa.

    Sidan Kluster och noder i konfigurationsguiden för Validate-DCB

  6. På sidan Nätverkskort:

    1. Markera kryssrutan vSwitch attached (ansluten vSwitch) och skriv namnet på vSwitch.
    2. Under Nätverkskort angerdu namnet på varje fysiskt nätverkskort, under Host vNIC Name(Namn på virtuellt nätverkskort), namnet på varje virtuellt nätverkskort (vNIC) och under VLAN, det VLAN-ID som används för varje nätverkskort.
    3. Expandera listrutan RDMA-typ och välj lämpligt protokoll: RoCE eller iWARP. Ställ även in Nätverkskortramar på lämpligt värde för nätverket och välj sedan Nästa.

    Sidan Nätverkskort i konfigurationsguiden för Validate-DCB

    Anteckning

  7. På Data Center Bridging ändrar du värdena så att de matchar organisationens inställningar för Prioritet,Principnamnoch Bandbreddsreservation och väljer sedan Nästa.

    Sidan Data Center Bridging i konfigurationsguiden för Validate-DCB

    Anteckning

    Om du väljer RDMA över RoCE på föregående guidesida krävs DCB för nätverkstillförlitlighet på alla nätverkskort och switchportar.

  8. På sidan Spara och distribuera i rutan Konfigurationsfilsökväg sparar du konfigurationsfilen med hjälp av ett .ps1-tillägg till en plats där du kan använda den igen vid behov och väljer sedan Exportera för att börja köra verktyget Validate-DCB.

    • Om du vill kan du distribuera konfigurationsfilen genom att slutföra avsnittet Distribuera konfiguration till noder på sidan, vilket innefattar möjligheten att använda ett Azure Automation-konto för att distribuera konfigurationen och sedan verifiera den. Se Skapa ett Azure Automation-konto för att komma igång med Azure Automation.

    Sidan Spara och distribuera i konfigurationsguiden för Validate-DCB

Granska resultat och åtgärda fel

Verktyget Validate-DCB ger resultat i två enheter:

  1. [Global enhet] visar en lista över förutsättningar och krav för att köra modala tester.
  2. [Modal Unit] ger feedback om varje klustervärdkonfiguration och bästa praxis.

Det här exemplet visar lyckade genomsökningsresultat för en enskild server för alla krav och modala enhetstester genom att ange antalet misslyckades på 0.

Testresultat för Validate-DCB Global-enhet och Modal-enhet

Följande steg visar hur du identifierar ett Packet-paketfel från vNIC SMB02 och åtgärdar det:

  1. Resultatet av Validate-DCB-verktygets genomsökningar visar felet Antal misslyckades på 1.

    Validate-DCB-verktygets genomsökningsresultat som visar felet Antal misslyckades på 1

  2. Om du bläddrar tillbaka genom resultaten visas ett fel i rött som anger att Packet-paketet för vNIC SMB02 på värd S046036 har angetts till standardstorleken 1514, men ska vara inställt på 9014.

    Validate-DCB-verktygets genomsökningsresultat som visar ett fel i inställningen för paketstorlek

  3. Om du granskar avancerade egenskaper för vNIC SMB02 på värd S046036 ser du att Packet-paketet är inställt på standardvärdet Inaktiverat.

    Servervärdens inställning hyper-V avancerade egenskaper För Paket

  4. Om du åtgärdar felet måste du aktivera funktionen Packet och ändra dess storlek till 9 014 byte. Genom att köra genomsökningen igen på värden S046036 bekräftas ändringen genom att ett antal misslyckades på 0 returneras.

    Verifiera DCB-genomsökningsresultat som bekräftar att servervärdens Inställning för Packet har åtgärdats

Mer information om hur du löser fel som verktyget Validate-DCB identifierar finns i följande video.

Du kan också installera verktyget offline. För frånkopplade system använder Save-Module -Name Validate-DCB -Path c:\temp\Validate-DCB du och flyttar sedan modulerna i c:\temp\Validate-DCB till det frånkopplade systemet. Mer information finns i följande video.

Verifiera klustret

Använd följande steg för att verifiera servrarna i ett befintligt kluster i Windows Administrationscenter.

  1. I Windows Administrationscenter under Allaanslutningar väljer du det Azure Stack HCI kluster som du vill verifiera och väljer sedan Anslut.

    Klusterhanterarens instrumentpanel visar översiktsinformation om klustret.

  2. På Cluster Manager-instrumentpanelengår du till Verktygoch väljer Servrar.

  3. På sidan Inventering väljer du servrarna i klustret och expanderar sedan undermenyn Mer och väljer Verifiera kluster.

  4. I popup-fönstret Verifiera kluster väljer du Ja.

    Popup-fönstret Verifiera kluster

  5. I popup-fönstret CredSSP (Credential Security Service Provider) väljer du Ja.

  6. Ange dina autentiseringsuppgifter för att aktivera CredSSP och välj sedan Fortsätt.
    Klustervalidering körs i bakgrunden och ger dig ett meddelande när det är klart. Då kan du visa valideringsrapporten enligt beskrivningen i nästa avsnitt.

Anteckning

När klusterservrarna har verifierats måste du inaktivera CredSSP av säkerhetsskäl.

Inaktivera CredSSP

När serverklustret har verifierats måste du inaktivera credSSP-protokollet (CredSSP) för autentiseringsuppgifter på varje server av säkerhetsskäl. Mer information finns i CVE-2018-0886.

  1. I Windows Administrationscenter under Allaanslutningar väljer du den första servern i klustret och väljer sedan Anslut.

  2. På sidan Översikt väljer du Inaktivera CredSSPoch sedan Ja i popup-fönstret Inaktivera CredSSP.

    Resultatet av steg 2 tar bort den röda CredSSP ENABLED-banderollen överst på serverns översiktssida och inaktiverar CredSSP på de andra servrarna.

Visa valideringsrapporter

Nu är du redo att visa klustervalideringsrapporten.

Det finns ett par sätt att komma åt valideringsrapporter:

  • På sidan Inventering expanderar du undermenyn Mer och väljer sedan Visa verifieringsrapporter.

  • Längst upp till höger i Windows Administrationscenterväljer du klockikonen Meddelanden för att visa fönstret Meddelanden. Välj meddelandet Verifierat kluster och välj sedan Gå till verifieringsrapport för redundanskluster.

Anteckning

Verifieringsprocessen för serverklustret kan ta lite tid att slutföra. Växla inte till ett annat verktyg Windows administrationscentret medan processen körs. I fönstret Meddelanden visas ett statusfält under meddelandet Verifiera kluster när processen är klar.

Verifiera klustret med Hjälp av PowerShell

Du kan också använda Windows PowerShell för att köra valideringstester på serverklustret och visa resultatet. Du kan köra tester både före och efter att ett kluster har ställts in.

Om du vill köra ett valideringstest på ett serverkluster utfärdar du PowerShell-cmdletarna Get-Cluster and Test-Clusterserver clustername från hanteringsdatorn eller kör endast cmdleten Test-Cluster direkt i klustret:

$Cluster = Get-Cluster -Name 'server-cluster1'
Test-Cluster -InputObject $Cluster -Verbose

Fler exempel och användningsinformation finns i referensdokumentationen testkluster.

Validera replikering för Storage replikering

Om du använder Storage Replica för att replikera volymer i ett stretchkluster eller kluster-till-kluster finns det flera händelser och cmdlets som du kan använda för att hämta replikeringens tillstånd.

I följande scenario konfigurerade vi Storage Replica genom att skapa replikeringsgrupper (RGs) för två platser och angav sedan datavolymerna och loggvolymerna för både källservernoderna i Site1 (Server1, Server2) och målservernoderna (replikerade) i Site2 (Server3, Server4).

Kör kommandot Get-WinEvent för att fastställa replikeringsförloppet för Server1 på Plats1 och granska händelserna 5015, 5002, 5004, 1237, 5001 och 2200:

Get-WinEvent -ComputerName Server1 -ProviderName Microsoft-Windows-StorageReplica -max 20

För Server3 i Site2 kör du följande kommando för att se Get-WinEvent Storage Replica-händelser som visar skapandet av partnerskap. Den här händelsen anger antalet kopierade byte och hur lång tid det tog. Exempel:

Get-WinEvent -ComputerName Server3 -ProviderName Microsoft-Windows-StorageReplica | Where-Object {$_.ID -eq "1215"} | FL

För Server3 i Site2 kör du kommandot och granskar händelserna Get-WinEvent 5009, 1237, 5001, 5015, 5005 och 2200 för att förstå bearbetningsförloppet. Det ska inte finnas några varningar om fel i sekvensen. Det kommer att finnas många 1237-händelser – dessa indikerar förloppet.

Get-WinEvent -ComputerName Server3 -ProviderName Microsoft-Windows-StorageReplica | FL

Alternativt anger målservergruppen för repliken hur många byte som ska kopieras hela tiden och kan efterfrågas via PowerShell med Get-SRGroup . Exempel:

(Get-SRGroup).Replicas | Select-Object numofbytesremaining

För noden Server3 i Site2 kör du följande kommando och granskar händelserna 5009, 1237, 5001, 5015, 5005 och 2200 för att förstå replikeringsförloppet. Det får inte finnas några varningar om fel. Det kommer dock att finnas många "1237"-händelser – dessa indikerar bara förloppet.

Get-WinEvent -ComputerName Server3 -ProviderName Microsoft-Windows-StorageReplica | FL

Som ett förloppsskript som inte avslutas:

while($true) {
$v = (Get-SRGroup -Name "Replication2").replicas | Select-Object numofbytesremaining
[System.Console]::Write("Number of bytes remaining: {0}`r", $v.numofbytesremaining)
Start-Sleep -s 5
}

Om du vill hämta replikeringstillståndet inom det utsträckta klustret använder Get-SRGroup du och Get-SRPartnership :

Get-SRGroup -Cluster ClusterS1
Get-SRPartnership -Cluster ClusterS1
(Get-SRGroup).replicas -Cluster ClusterS1

När lyckad datareplikering har bekräftats mellan platser kan du skapa dina virtuella datorer och andra arbetsbelastningar.

Se även