Een Azure Stack HCI-cluster valideren

Van toepassing op: Azure Stack HCI, versies 21H2 en 20H2; Windows Server 2022, Windows Server 2019

Hoewel de wizard Cluster maken in Windows-beheercentrum bepaalde validaties uitvoert om een werkend cluster te maken met de geselecteerde hardware, voert clustervalidatie extra controles uit om ervoor te zorgen dat het cluster in een productieomgeving werkt. Dit artikel is gericht op waarom clustervalidatie belangrijk is en wanneer het moet worden uitgevoerd op een Azure Stack HCI cluster.

We raden u aan om clustervalidatie uit te voeren voor de volgende primaire scenario's:

  • Voer na het implementeren van een servercluster het hulpprogramma Validate-DCB uit om netwerken te testen.
  • Voer na het bijwerken van een servercluster, afhankelijk van uw scenario, beide validatieopties uit om clusterproblemen op te lossen.
  • Nadat u replicatie hebt Storage Replica, controleert u of de replicatie normaal wordt uitgevoerd door een aantal specifieke gebeurtenissen te controleren en een paar opdrachten uit te voeren.
  • Voer na het maken van een servercluster het hulpprogramma Validate-DCB uit voordat u het in productie plaatst.

Wat is clustervalidatie?

Clustervalidatie is bedoeld om hardware- of configuratieproblemen op te lossen voordat een cluster in productie gaat. Clustervalidatie helpt ervoor te zorgen dat Azure Stack HCI oplossing die u gaat implementeren, werkelijk betrouwbaar is. U kunt clustervalidatie ook gebruiken voor geconfigureerde failoverclusters als diagnostisch hulpprogramma.

Specifieke validatiescenario's

In deze sectie worden scenario's beschreven waarin validatie ook nodig of nuttig is.

  • Validatie voordat het cluster is geconfigureerd:

    • Een set servers die gereed zijn om een failovercluster te worden: Dit is het meest eenvoudige validatiescenario. De hardwareonderdelen (systemen, netwerken en opslag) zijn verbonden, maar de systemen functioneren nog niet als een cluster. Het uitvoeren van tests in deze situatie heeft geen invloed op de beschikbaarheid.

    • Server-VM's: Voer voor gevirtualiseerde servers in een cluster clustervalidatie uit zoals u zou doen op elk ander nieuw cluster. De vereiste om de functie uit te voeren is hetzelfde, ongeacht of u het volgende hebt:

      • Een 'hostcluster' waarbij failover plaatsvindt tussen twee fysieke computers.
      • Een 'gastcluster' waarbij failover plaatsvindt tussen gastbesturingssystemen op dezelfde fysieke computer.
  • Validatie nadat het cluster is geconfigureerd en in gebruik is:

    • Voordat u een server aan het cluster toevoegt: Wanneer u een server aan een cluster toevoegt, raden we u ten zeerste aan het cluster te valideren. Geef zowel de bestaande clusterleden als de nieuwe server op bij het uitvoeren van clustervalidatie.

    • Bij het toevoegen van stations: Wanneer u extra stations toevoegt aan het cluster, wat verschilt van het vervangen van mislukte stations of het maken van virtuele schijven of volumes die afhankelijk zijn van de bestaande stations, moet u clustervalidatie uitvoeren om te bevestigen dat de nieuwe opslag correct werkt.

    • Bij het aanbrengen van wijzigingen die van invloed zijn op firmware of stuurprogramma's: Als u een upgrade of wijzigingen aan het cluster aan het cluster aanbied die van invloed zijn op firmware of stuurprogramma's, moet u clustervalidatie uitvoeren om te bevestigen dat de nieuwe combinatie van hardware, firmware, stuurprogramma's en software failoverclusterfunctionaliteit ondersteunt.

    • Na het herstellen van een systeem vanuit een back-up: Nadat u een systeem vanuit een back-up hebt hersteld, moet u clustervalidatie uitvoeren om te bevestigen dat het systeem correct werkt als onderdeel van een cluster.

Netwerken valideren

Het hulpprogramma Microsoft Validate-DCB is ontworpen om de configuratie van Data Center Bridging (DCB) op het cluster te valideren. Hiervoor gebruikt het hulpprogramma een verwachte configuratie als invoer en test vervolgens elke server in het cluster. Deze sectie gaat over het installeren en uitvoeren van het hulpprogramma Validate-DCB, het controleren van resultaten en het oplossen van netwerkfouten die het hulpprogramma identificeert.

Notitie

Microsoft raadt aan om uw configuratie met Network ATC te implementeren en te beheren, waardoor de meeste configuratie-uitdagingen die het hulpprogramma Validate-DCB controleert, worden geëlimineerd. Zie Hostnetwerken vereenvoudigen met Network ATC voor meer informatie over Network ATC, dat een op intentie gebaseerde benadering biedt voor het hosten van netwerkimplementatie.

Op het netwerk vereist RDMA (Remote Direct Memory Access) via Converged Ethernet (RoCE) DCB-technologieën om de netwerk-fabric verliesloos te maken. Met iWARP is DCB optioneel. Het configureren van DCB kan echter complex zijn, met exacte configuratie vereist voor:

  • Elke server in het cluster
  • Elke netwerkpoort die RDMA-verkeer passeert op de fabric

Vereisten

  • Netwerkinstallatiegegevens van het servercluster dat u wilt valideren, waaronder:
    • Host- of serverclusternaam
    • Naam van virtuele switch
    • Namen van netwerkadapters
    • Instellingen Flow (Priority Flow Control) en Enhanced Transmission Selection (ETS)
  • Een internetverbinding voor het downloaden van de hulpprogrammamodule in Windows PowerShell van Microsoft.

Het hulpprogramma Validate-DCB installeren en uitvoeren

Het hulpprogramma Validate-DCB installeren en uitvoeren:

  1. Open op uw beheer-pc een Windows PowerShell als beheerder en gebruik vervolgens de volgende opdracht om het hulpprogramma te installeren.

    Install-Module Validate-DCB
    
  2. Accepteer de aanvragen voor het gebruik van de NuGet-provider en ga naar de opslagplaats om het hulpprogramma te installeren.

  3. Nadat PowerShell verbinding heeft gemaakt met het Microsoft-netwerk om het hulpprogramma te downloaden, typt u en drukt u Validate-DCB op Validate-DCB om de wizard voor het hulpprogramma te starten.

    Notitie

    Als u het script van het hulpprogramma Validate-DCB niet kunt uitvoeren, moet u mogelijk uw PowerShell-uitvoeringsbeleid aanpassen. Gebruik de Get-ExecutionPolicy cmdlet om uw huidige beleidsinstellingen voor scriptuitvoering te bekijken. Zie Over uitvoeringsbeleid voor meer informatie over het instellen van uitvoeringsbeleid in PowerShell.

  4. Selecteer op de pagina Welkom bij de wizard Valideren dcb-configuratie de optie Volgende.

  5. Typ op de pagina Clusters en knooppunten de naam van het servercluster dat u wilt valideren, selecteer Oplossen om dit weer te geven op de pagina en selecteer vervolgens Volgende.

    De pagina Clusters en knooppunten van de wizard Valideren-DCB-configuratie

  6. Op de pagina Adapters:

    1. Schakel het selectievakje vSwitch attached in en typ de naam van de vSwitch.
    2. Typ onder Adapternaamde naam van elke fysieke NIC, onder Host vNIC-naam,de naam van elke virtuele NIC (vNIC) en onder VLAN, de VLAN-ID die wordt gebruikt voor elke adapter.
    3. Vouw de vervolgkeuzelijst RDMA-type uit en selecteer het juiste protocol: RoCE of iWARP. Stel ookFrames in op de juiste waarde voor uw netwerk en selecteer vervolgens Volgende.

    De pagina Adapters van de wizard Valideren-DCB-configuratie

    Notitie

  7. Wijzig op Data Center Bridging pagina de waarden die overeenkomen met de instellingen van uw organisatie voor Prioriteit,Beleidsnaam enBandbreedtereservering en selecteer volgende.

    De Data Center Bridging van de wizard Valideren dcb-configuratie

    Notitie

    Voor het selecteren van RDMA via RoCE op de vorige wizardpagina is DCB vereist voor netwerkbetrouwbaarheid op alle NIC's en switchports.

  8. Sla op de pagina Opslaan en implementeren in het vak Pad naar configuratiebestand het configuratiebestand op met behulp van een .ps1-extensie op een locatie waar u het later opnieuw kunt gebruiken, indien nodig, en selecteer vervolgens Exporteren om het hulpprogramma Validate-DCB uit te voeren.

    • U kunt eventueel uw configuratiebestand implementeren door de sectie Configuratie implementeren op knooppunten van de pagina in te vullen. Deze sectie bevat de mogelijkheid om een Azure Automation-account te gebruiken om de configuratie te implementeren en deze vervolgens te valideren. Zie Een account Azure Automation maken om aan de slag te gaan met Azure Automation.

    De pagina Opslaan en implementeren van de configuratiewizard Validate-DCB

Resultaten bekijken en fouten oplossen

Het hulpprogramma Validate-DCB produceert twee eenheden:

  1. [Global Unit] resultaten lijst met vereisten en vereisten voor het uitvoeren van de modale tests.
  2. [Modale eenheid] resultaten geven feedback over elke configuratie van de clusterhost en best practices.

In dit voorbeeld ziet u geslaagde scanresultaten van één server voor alle vereisten en modale eenheidstests door een mislukt aantal van 0 aan te geven.

Testresultaten van globale eenheid en modale eenheid validate-DCB

De volgende stappen laten zien hoe u een Fout in een Pakket met pakketten van vNIC SMB02 kunt identificeren en oplossen:

  1. In de resultaten van de scans van het hulpprogramma Validate-DCB wordt fout aantal mislukte pogingen weergegeven van 1.

    Scanresultaten van het hulpprogramma Validate-DCB met de fout Aantal mislukte pogingen van 1

  2. Als u terug scrolt door de resultaten ziet u een fout in het rood die aangeeft dat het Pakket voor de vNIC SMB02 op host S046036 is ingesteld op de standaardgrootte van 1514, maar moet worden ingesteld op 9014.

    Het scanresultaat van het hulpprogramma Validate-DCB toont een fout met de instelling van een pakketgrootte

  3. Als u de geavanceerde eigenschappen van vNIC SMB02 op Host S046036 bekijkt, ziet u dat het Pakket met pakketten is ingesteld op de standaardwaarde Uitgeschakeld.

    De hyper-V geavanceerde eigenschappen van de serverhost Packet instelling

  4. Voor het oplossen van de fout moet de functie Pakket pakket inschakelen en de grootte wijzigen in 9014 bytes. Als de scan opnieuw wordt uitgevoerd op host S046036, wordt deze wijziging bevestigd door het aantal mislukte pogingen van 0 te retourneren.

    Validate-DCB scan results confirming that the Server host's Packet setting is fixed

Zie de volgende video voor meer informatie over het oplossen van fouten die het hulpprogramma Validate-DCB identificeert.

U kunt het hulpprogramma ook offline installeren. Voor niet-verbonden systemen gebruikt Save-Module -Name Validate-DCB -Path c:\temp\Validate-DCB u de modules in c:\temp\Validate-DCB en verplaatst u deze naar uw niet-verbonden systeem. Zie de volgende video voor meer informatie.

Het cluster valideren

Gebruik de volgende stappen om de servers in een bestaand cluster in Windows-beheercentrum te valideren.

  1. Selecteer in Windows-beheercentrum onder Alle verbindingen het Azure Stack HCI-cluster dat u wilt valideren en selecteer vervolgens Verbinding maken.

    Het clusterbeheerdashboard geeft overzichtsinformatie weer over het cluster.

  2. Selecteer op het Clusterbeheerdashboardonder Extrade optie Servers.

  3. Selecteer op de pagina Inventaris de servers in het cluster, vouw vervolgens het submenu Meer uit en selecteer Cluster valideren.

  4. Selecteer ja in het pop-upvenster Cluster valideren.

    Pop-upvenster Cluster valideren

  5. Selecteer ja in het pop-upvenster Credential Security Service Provider (CredSSP).

  6. Geef uw referenties op om CredSSP in teschakelen en selecteer vervolgens Doorgaan.
    Clustervalidatie wordt op de achtergrond uitgevoerd en geeft u een melding wanneer het is voltooid. Op dat moment kunt u het validatierapport bekijken, zoals beschreven in de volgende sectie.

Notitie

Nadat uw clusterservers zijn gevalideerd, moet u CredSSP uitschakelen om veiligheidsredenen.

CredSSP uitschakelen

Nadat uw servercluster is gevalideerd, moet u het CredSSP-protocol (Credential Security Support Provider) op elke server uitschakelen voor beveiligingsdoeleinden. Zie CVE-2018-0886 voor meer informatie.

  1. Selecteer in Windows-beheercentrum onder Alle verbindingen de eerste server in uw cluster en selecteer vervolgens Verbinding maken.

  2. Selecteer credSSPuitschakelen op de pagina Overzicht en selecteer vervolgens ja in het pop-upvenster CredSSPuitschakelen.

    Het resultaat van stap 2 verwijdert de rode banner CredSSP ENABLED bovenaan de pagina Overzicht van de server en schakelt CredSSP uit op de andere servers.

Validatierapporten weergeven

U bent nu klaar om het clustervalidatierapport weer te geven.

Er zijn een aantal manieren om toegang te krijgen tot validatierapporten:

  • Vouw op de pagina Inventaris het submenu Meer uit en selecteer validatierapporten weergeven.

  • Selecteer rechtsboven in Windows Beheercentrumhet belpictogram Meldingen om het deelvenster Meldingen weer te geven. Selecteer de kennisgeving Cluster is gevalideerd en selecteer vervolgens Naar failoverclustervalidatierapport gaan.

Notitie

Het validatieproces van het servercluster kan enige tijd in beslag nemen. Schakel niet over naar een ander hulpprogramma in Windows beheercentrum terwijl het proces wordt uitgevoerd. In het deelvenster Meldingen geeft een statusbalk onder de melding Cluster valideren aan wanneer het proces is uitgevoerd.

Het cluster valideren met Behulp van PowerShell

U kunt ook een Windows PowerShell om validatietests uit te voeren op uw servercluster en de resultaten weer te geven. U kunt tests uitvoeren zowel vóór als nadat een cluster is ingesteld.

Als u een validatietest wilt uitvoeren op een servercluster, moet u de PowerShell-cmdlets PowerShell-cmdlets voor de Get-Cluster- en Test-Cluster-servervanaf uw beheer-pc uitgeven of alleen de cmdlet Test-Cluster rechtstreeks op het cluster uitvoeren:

$Cluster = Get-Cluster -Name 'server-cluster1'
Test-Cluster -InputObject $Cluster -Verbose

Zie de referentiedocumentatie testcluster voor meer voorbeelden en gebruiksinformatie.

Replicatie valideren voor Storage Replica

Als u Storage Replica gebruikt om volumes te repliceren in een stretched cluster of cluster-naar-cluster, zijn er verschillende gebeurtenissen en cmdlets die u kunt gebruiken om de status van de replicatie op te halen.

In het volgende scenario hebben we Storage Replica geconfigureerd door replicatiegroepen (RG's) voor twee sites te maken en vervolgens de gegevensvolumes en logboekvolumes opgegeven voor zowel de bronserverknooppunten in Site1 (Server1, Server2) als de doelserverknooppunten (gerepliceerd) in Site2 (Server3, Server4).

Als u de voortgang van de replicatie voor Server1 in Site1 wilt bepalen, moet u de opdracht Get-WinEvent uitvoeren en de gebeurtenissen 5015, 5002, 5004, 1237, 5001 en 2200 onderzoeken:

Get-WinEvent -ComputerName Server1 -ProviderName Microsoft-Windows-StorageReplica -max 20

Voer voor Server3 in Site2 de volgende opdracht uit om de Storage replicagebeurtenissen te zien die het maken Get-WinEvent van de samenwerking tonen. In deze gebeurtenis wordt vermeld hoeveel bytes zijn gekopieerd en hoe lang dat heeft geduurd. Bijvoorbeeld:

Get-WinEvent -ComputerName Server3 -ProviderName Microsoft-Windows-StorageReplica | Where-Object {$_.ID -eq "1215"} | FL

Voer voor Server3 in Site2 de opdracht uit en bekijk gebeurtenissen Get-WinEvent 5009, 1237, 5001, 5015, 5005 en 2200 om inzicht te krijgen in de voortgang van de verwerking. Er mogen in deze reeks geen fouten worden gemeld. Er zullen veel 1237 gebeurtenissen zijn. Deze geven de voortgang aan.

Get-WinEvent -ComputerName Server3 -ProviderName Microsoft-Windows-StorageReplica | FL

De doelservergroep voor de replica geeft ook het aantal byte op dat te allen tijde moet worden kopieerd en kan worden opgevraagd via PowerShell met Get-SRGroup . Bijvoorbeeld:

(Get-SRGroup).Replicas | Select-Object numofbytesremaining

Voer voor knooppunt Server3 in Site2 de volgende opdracht uit en bekijk gebeurtenissen 5009, 1237, 5001, 5015, 5005 en 2200 om inzicht te krijgen in de voortgang van de replicatie. Er mogen geen waarschuwingen over fouten worden gegeven. Er zijn echter veel '1237'-gebeurtenissen. Deze geven gewoon de voortgang aan.

Get-WinEvent -ComputerName Server3 -ProviderName Microsoft-Windows-StorageReplica | FL

Als een voortgangsscript dat niet wordt beëindigd:

while($true) {
$v = (Get-SRGroup -Name "Replication2").replicas | Select-Object numofbytesremaining
[System.Console]::Write("Number of bytes remaining: {0}`r", $v.numofbytesremaining)
Start-Sleep -s 5
}

Als u de replicatietoestand binnen de stretched cluster, gebruikt u Get-SRGroup en Get-SRPartnership :

Get-SRGroup -Cluster ClusterS1
Get-SRPartnership -Cluster ClusterS1
(Get-SRGroup).replicas -Cluster ClusterS1

Zodra de replicatie van gegevens tussen sites is bevestigd, kunt u uw VM's en andere workloads maken.

Zie ook