Validar um cluster HCI da Pilha de AzureValidate an Azure Stack HCI cluster

Aplica-se a: Azure Stack HCI, versão v20H2; Windows Server 2019Applies to: Azure Stack HCI, version v20H2; Windows Server 2019

Este artigo de como fazer centra-se no porquê da validação do cluster ser importante, e quando executá-lo em um cluster HCI Azure Stack existente.This how-to article focuses on why cluster validation is important, and when to run it on an existing Azure Stack HCI cluster. Recomendamos a realização da validação do cluster para os seguintes cenários primários:We recommend performing cluster validation for the following primary scenarios:

  • Depois de implementar um cluster de servidor, execute a ferramenta Validate-DCB para testar a rede.After deploying a server cluster, run the Validate-DCB tool to test networking.

  • Depois de atualizar um cluster de servidor, dependendo do seu cenário, execute ambas as opções de validação para resolver problemas de cluster.After updating a server cluster, depending on your scenario, run both validation options to troubleshoot cluster issues.

  • Depois de configurar a replicação com a Réplica de Armazenamento, valide que a replicação está a decorrer normalmente, verificando alguns eventos específicos e executando alguns comandos.After setting up replication with Storage Replica, validate that the replication is proceeding normally by checking some specific events and running a couple commands.

  • Depois de criar um cluster de servidor, executar a ferramenta Validate-DCB antes de colocá-la em produção.After creating a server cluster, run the Validate-DCB tool before placing it into production.

    Para saber mais sobre como implementar um cluster HCI Azure Stack, consulte a visão geralda Implementação .To learn more about how to deploy an Azure Stack HCI cluster, see the Deployment overview.

O que é validação de clusters?What is cluster validation?

A validação do cluster destina-se a capturar problemas de hardware ou de configuração antes de um cluster entrar em produção.Cluster validation is intended to catch hardware or configuration problems before a cluster goes into production. A validação do cluster ajuda a garantir que a solução HCI Azure Stack que está prestes a implementar é verdadeiramente fiável.Cluster validation helps to ensure that the Azure Stack HCI solution that you're about to deploy is truly dependable. Também pode utilizar a validação do cluster em clusters de falha configurados como uma ferramenta de diagnóstico.You can also use cluster validation on configured failover clusters as a diagnostic tool.

Cenários de validação específicosSpecific validation scenarios

Esta secção descreve cenários em que a validação também é necessária ou útil.This section describes scenarios in which validation is also needed or useful.

  • Validação antes de o cluster ser configurado:Validation before the cluster is configured:

    • Um conjunto de servidores prontos para se tornar um cluster de falha: Este é o cenário de validação mais simples.A set of servers ready to become a failover cluster: This is the most straightforward validation scenario. Os componentes de hardware (sistemas, redes e armazenamento) estão ligados, mas os sistemas ainda não funcionam como um cluster.The hardware components (systems, networks, and storage) are connected, but the systems aren't yet functioning as a cluster. A realização de testes nesta situação não afeta a disponibilidade.Running tests in this situation has no affect on availability.

    • VMs do servidor: Para servidores virtualizados num cluster, executar a validação do cluster como faria em qualquer outro novo cluster.Server VMs: For virtualized servers in a cluster, run cluster validation as you would on any other new cluster. A exigência de executar a funcionalidade é a mesma se tiver:The requirement to run the feature is the same whether you have:

      • Um "cluster hospedeiro" onde o failover ocorre entre dois computadores físicos.A "host cluster" where failover occurs between two physical computers.
      • Um "cluster de hóspedes" onde ocorre falha entre os sistemas operativos dos hóspedes no mesmo computador físico.A "guest cluster" where failover occurs between guest operating systems on the same physical computer.
  • Validação após configuração do cluster e utilização:Validation after the cluster is configured and in use:

    • Antes de adicionar um servidor ao cluster: Quando adiciona um servidor a um cluster, recomendamos fortemente a validação do cluster.Before adding a server to the cluster: When you add a server to a cluster, we strongly recommend validating the cluster. Especifique tanto os membros do cluster existentes como o novo servidor quando executar a validação do cluster.Specify both the existing cluster members and the new server when you run cluster validation.

    • Ao adicionar unidades: Quando adicionar unidades adicionais ao cluster, que é diferente de substituir unidades falhadas ou criar discos virtuais ou volumes que dependem das unidades existentes, executar a validação do cluster para confirmar que o novo armazenamento funcionará corretamente.When adding drives: When you add additional drives to the cluster, which is different from replacing failed drives or creating virtual disks or volumes that rely on the existing drives, run cluster validation to confirm that the new storage will function correctly.

    • Ao efe assim fazer alterações que afetem o firmware ou os condutores: Se atualizar ou fazer alterações no cluster que afetem o firmware ou os controladores, tem de executar a validação do cluster para confirmar que a nova combinação de hardware, firmware, controladores e software suporta a funcionalidade do cluster failover.When making changes that affect firmware or drivers: If you upgrade or make changes to the cluster that affect firmware or drivers, you must run cluster validation to confirm that the new combination of hardware, firmware, drivers, and software supports failover cluster functionality.

    • Depois de restaurar um sistema de cópia de segurança: Depois de restaurar um sistema de backup, executar a validação do cluster para confirmar que o sistema funciona corretamente como parte de um cluster.After restoring a system from backup: After you restore a system from backup, run cluster validation to confirm that the system functions correctly as part of a cluster.

Validar a redeValidate networking

A ferramenta Microsoft Validate-DCB foi concebida para validar a configuração de Ponte do Data Center (DCB) no cluster.The Microsoft Validate-DCB tool is designed to validate the Data Center Bridging (DCB) configuration on the cluster. Para isso, a ferramenta requer uma configuração esperada como entrada e, em seguida, testa cada servidor no cluster.To do this, the tool takes an expected configuration as input, and then tests each server in the cluster. Esta secção abrange como instalar e executar a ferramenta Validate-DCB, rever os resultados e resolver erros de rede que a ferramenta identifica.This section covers how to install and run the Validate-DCB tool, review results, and resolve networking errors that the tool identifies.

Na rede, o acesso remoto à memória direta (RDMA) sobre o Converged Ethernet (RoCE) requer tecnologias DCB para tornar o tecido de rede sem perdas.On the network, remote direct memory access (RDMA) over Converged Ethernet (RoCE) requires DCB technologies to make the network fabric lossless. Com o iWARP, o DCB é opcional.With iWARP, DCB is optional. No entanto, configurar o DCB pode ser complexo, com uma configuração exata necessária em toda:However, configuring DCB can be complex, with exact configuration required across:

  • Cada servidor no clusterEach server in the cluster
  • Cada porta de rede que o tráfego RDMA passa no tecidoEach network port that RDMA traffic passes through on the fabric

Pré-requisitosPrerequisites

  • Informações de configuração da rede do cluster do servidor que pretende validar, incluindo:Network setup information of the server cluster that you want to validate, including:
    • Nome do cluster do anfitrião ou do servidorHost or server cluster name
    • Nome do interruptor virtualVirtual switch name
    • Nomes do adaptador de redeNetwork adapter names
    • Definições de Controlo de Fluxo Prioritário (PFC) e Seleção de Transmissão Melhorada (ETS)Priority Flow Control (PFC) and Enhanced Transmission Selection (ETS) settings
  • Uma ligação à Internet para descarregar o módulo de ferramentas no Windows PowerShell da Microsoft.An internet connection to download the tool module in Windows PowerShell from Microsoft.

Instale e execute a ferramenta Validate-DCBInstall and run the Validate-DCB tool

Para instalar e executar a ferramenta Validate-DCB:To install and run the Validate-DCB tool:

  1. No seu PC de gestão, abra uma sessão Windows PowerShell como Administrador e, em seguida, utilize o seguinte comando para instalar a ferramenta.On your management PC, open a Windows PowerShell session as an Administrator, and then use the following command to install the tool.

    Install-Module Validate-DCB
    
  2. Aceite os pedidos para utilizar o fornecedor NuGet e aceda ao repositório para instalar a ferramenta.Accept the requests to use the NuGet provider and access the repository to install the tool.

  3. Depois de o PowerShell ligar-se à rede Microsoft para descarregar a ferramenta, digite Validate-DCB e prima Enter para iniciar o assistente de ferramentas.After PowerShell connects to the Microsoft network to download the tool, type Validate-DCB and press Enter to start the tool wizard.

    Nota

    Se não conseguir executar o script da ferramenta Validate-DCB, poderá ter de ajustar as suas políticas de execução PowerShell.If you cannot run the Validate-DCB tool script, you might need to adjust your PowerShell execution policies. Utilize o Get-ExecutionPolicy cmdlet para ver as definições atuais da política de execução do script.Use the Get-ExecutionPolicy cmdlet to view your current script execution policy settings. Para obter informações sobre a definição de políticas de execução no PowerShell, consulte Sobre as Políticas de Execução.For information on setting execution policies in PowerShell, see About Execution Policies.

  4. Na página de assistente de configuração Valide-DCB, selecione Seguinte.On the Welcome to the Validate-DCB configuration wizard page, select Next.

  5. Na página Clusters e Nodes, digite o nome do cluster do servidor que pretende validar, selecione Resolver para listá-lo na página e, em seguida, selecione Seguinte.On the Clusters and Nodes page, type the name of the server cluster that you want to validate, select Resolve to list it on the page, and then select Next.

    A página clusters e nó do assistente de configuração Validate-DCB

  6. Na página dos Adaptadores:On the Adapters page:

    1. Selecione a caixa de verificação anexa vSwitch e digite o nome do vSwitch.Select the vSwitch attached checkbox and type the name of the vSwitch.
    2. Em Nome adaptador, digite o nome de cada NIC físico, em Nome do Anfitrião vNIC, o nome de cada NIC virtual (vNIC), e em VLAN, o ID VLAN em uso para cada adaptador.Under Adapter Name, type the name of each physical NIC, under Host vNIC Name, the name of each virtual NIC (vNIC), and under VLAN, the VLAN ID in use for each adapter.
    3. Expandir a caixa de lista de drop-down do tipo RDMA e selecionar o protocolo apropriado: RoCE ou iWARP.Expand the RDMA Type drop-down list box and select the appropriate protocol: RoCE or iWARP. Também desagram quadros jumbo para o valor apropriado para a sua rede e, em seguida, selecione Next.Also set Jumbo Frames to the appropriate value for your network, and then select Next.

    A página clusters e nó do assistente de configuração Validate-DCB

    Nota

  7. Na página de ponte do Data Center, modifique os valores para corresponder às definições da sua organização para Prioridade, Nome de Políticae Reserva de Largura de Banda, e, em seguida, selecione Seguinte.On the Data Center Bridging page, modify the values to match your organization's settings for Priority, Policy Name, and Bandwidth Reservation, and then select Next.

    A página clusters e nó do assistente de configuração Validate-DCB

    Nota

    A seleção de RDMA sobre o RoCE na página de assistente anterior requer DCB para a fiabilidade da rede em todos os NICs e switchports.Selecting RDMA over RoCE on the previous wizard page requires DCB for network reliability on all NICs and switchports.

  8. Na página 'Guardar e Implementar', na caixa 'Caminho do Ficheiro de Configuração', guarde o ficheiro de configuração utilizando uma extensão .ps1 para um local onde poderá utilizá-lo novamente mais tarde, se necessário, e, em seguida, selecione Export para começar a executar a ferramenta Validate-DCB.On the Save and Deploy page, in the Configuration File Path box, save the configuration file using a .ps1 extension to a location where you can use it again later if needed, and then select Export to start running the Validate-DCB tool.

    • Pode implantar opcionalmente o seu ficheiro de configuração preenchendo a secção de Configuração de Implantação para Nós da página, que inclui a capacidade de utilizar uma conta Azure Automation para implementar a configuração e, em seguida, validá-la.You can optionally deploy your configuration file by completing the Deploy Configuration to Nodes section of the page, which includes the ability to use an Azure Automation account to deploy the configuration and then validate it. Consulte Criar uma conta Azure Automation para começar com a Azure Automation.See Create an Azure Automation account to get started with Azure Automation.

    A página clusters e nó do assistente de configuração Validate-DCB

Rever resultados e corrigir errosReview results and fix errors

A ferramenta Validate-DCB produz resultados em duas unidades:The Validate-DCB tool produces results in two units:

  1. Os resultados [Da Unidade Global] listam pré-requisitos e requisitos para a execução dos testes modais.[Global Unit] results list prerequisites and requirements to run the modal tests.
  2. Os resultados [Da Unidade Modal] fornecem feedback sobre cada configuração de hospedeiro de cluster e as melhores práticas.[Modal Unit] results provide feedback on each cluster host configuration and best practices.

Este exemplo mostra resultados de digitalização bem sucedidos de um único servidor para todos os pré-requisitos e testes de unidade modal indicando uma Contagem Falhada de 0.This example shows successful scan results of a single server for all prerequisites and modal unit tests by indicating a Failed Count of 0.

A página clusters e nó do assistente de configuração Validate-DCB

Os seguintes passos mostram como identificar um erro do Jumbo Packet do vNIC SMB02 e corrigi-lo:The following steps show how to identify a Jumbo Packet error from vNIC SMB02 and fix it:

  1. Os resultados das verificações da ferramenta Validate-DCB mostram um erro de contagem falhada de 1.The results of the Validate-DCB tool scans show a Failed Count error of 1.

    A página clusters e nó do assistente de configuração Validate-DCB

  2. A reposição dos resultados mostra um erro a vermelho indicando que o Pacote Jumbo para vNIC SMB02 no Host S046036 é definido no tamanho padrão de 1514, mas deve ser definido para 9014.Scrolling back through the results shows an error in red indicating that the Jumbo Packet for vNIC SMB02 on Host S046036 is set at the default size of 1514, but should be set to 9014.

    A página clusters e nó do assistente de configuração Validate-DCB

  3. A revisão das propriedades avançadas do vNIC SMB02 no Host S046036 mostra que o Pacote Jumbo está definido para o padrão de Desativado.Reviewing the Advanced properties of vNIC SMB02 on Host S046036 shows that the Jumbo Packet is set to the default of Disabled.

    A página clusters e nó do assistente de configuração Validate-DCB

  4. A correção do erro requer ativar a função Jumbo Packet e alterar o seu tamanho para bytes 9014.Fixing the error requires enabling the Jumbo Packet feature and changing its size to 9014 bytes. Executar novamente a verificação no anfitrião S046036 confirma esta alteração devolvendo uma Contagem Falhada de 0.Running the scan again on host S046036 confirms this change by returning a Failed Count of 0.

    A página clusters e nó do assistente de configuração Validate-DCB

Para saber mais sobre a resolução de erros que a ferramenta Validate-DCB identifica, consulte o seguinte vídeo.To learn more about resolving errors that the Validate-DCB tool identifies, see the following video.

Validar o clusterValidate the cluster

Utilize os seguintes passos para validar os servidores num cluster existente no Windows Admin Center.Use the following steps to validate the servers in an existing cluster in Windows Admin Center.

  1. No Windows Admin Center, em todas as ligações, selecione o cluster HCI Azure Stack que pretende validar e, em seguida, selecione Connect.In Windows Admin Center, under All connections, select the Azure Stack HCI cluster that you want to validate, and then select Connect.

    O Painel de Controlo do Cluster apresenta informações gerais sobre o cluster.The Cluster Manager Dashboard displays overview information about the cluster.

  2. No painel de instrumentos do Cluster Manager, em Ferramentas, selecione Servidores.On the Cluster Manager Dashboard, under Tools, select Servers.

  3. Na página 'Inventário', selecione os servidores do cluster e, em seguida, expanda o submenu Mais e selecione o cluster Validate.On the Inventory page, select the servers in the cluster, then expand the More submenu and select Validate cluster.

  4. Na janela pop-up do Cluster Validado, selecione Sim.On the Validate Cluster pop-up window, select Yes.

    A página clusters e nó do assistente de configuração Validate-DCB

  5. Na janela pop-up do Fornecedor de Serviços de Segurança Credencial (CredSSP), selecione Sim.On the Credential Security Service Provider (CredSSP) pop-up window, select Yes.

  6. Forneça as suas credenciais para ativar o CredSSP e, em seguida, selecione Continue.Provide your credentials to enable CredSSP and then select Continue.
    A validação do cluster é em segundo plano e dá-lhe uma notificação quando estiver concluída, altura em que pode ver o relatório de validação, como descrito na secção seguinte.Cluster validation runs in the background and gives you a notification when it's complete, at which point you can view the validation report, as described in the next section.

Nota

Depois de os seus servidores de cluster terem sido validados, terá de desativar o CredSSP por razões de segurança.After your cluster servers have been validated, you will need to disable CredSSP for security reasons.

Desativar o CredSSPDisable CredSSP

Depois de o seu cluster de servidor ser validado com sucesso, terá de desativar o protocolo Do Fornecedor de Suporte de Segurança Credencial (CredSSP) em cada servidor para fins de segurança.After your server cluster is successfully validated, you'll need to disable the Credential Security Support Provider (CredSSP) protocol on each server for security purposes. Para mais informações, consulte O CVE-2018-0886.For more information, see CVE-2018-0886.

  1. No Windows Admin Center, em todas as ligações, selecione o primeiro servidor no seu cluster e, em seguida, selecione Connect.In Windows Admin Center, under All connections, select the first server in your cluster, and then select Connect.

  2. Na página 'Visão Geral', selecione Disable CredSSPe, em seguida, na janela pop-up Desativada CredSSP, selecione Sim.On the Overview page, select Disable CredSSP, and then on the Disable CredSSP pop-up window, select Yes.

    O resultado do Passo 2 remove o banner vermelho CRedSSP ENABLED na parte superior da página geral do servidor e desativa o CredSSP nos outros servidores.The result of Step 2 removes the red CredSSP ENABLED banner at the top of the server's Overview page, and disables CredSSP on the other servers.

Ver relatórios de validaçãoView validation reports

Agora está pronto para ver o seu relatório de validação do agrupamento.Now you're ready to view your cluster validation report.

Existem algumas formas de aceder aos relatórios de validação:There are a couple ways to access validation reports:

  • Na página De Inventário, expanda o submenu Mais e, em seguida, selecione Ver relatórios de validação.On the Inventory page, expand the More submenu, and then select View validation reports.

  • No superior direito do Windows Admin Center, selecione o ícone da campainha de Notificações para exibir o painel de Notificações.At the top right of Windows Admin Center, select the Notifications bell icon to display the Notifications pane. Selecione o aviso de cluster validado com sucesso e, em seguida, selecione Ir para relatório de validação do Cluster Failover.Select the Successfully validated cluster notice, and then select Go to Failover Cluster validation report.

Nota

O processo de validação do cluster do servidor pode demorar algum tempo a ser concluído.The server cluster validation process may take some time to complete. Não mude para outra ferramenta no Windows Admin Center enquanto o processo estiver em curso.Don't switch to another tool in Windows Admin Center while the process is running. No painel de Notificações, uma barra de estado abaixo do aviso de cluster Valide indica quando o processo está feito.In the Notifications pane, a status bar below your Validate cluster notice indicates when the process is done.

Validar o cluster utilizando o PowerShellValidate the cluster using PowerShell

Também pode utilizar o Windows PowerShell para executar testes de validação no seu cluster de servidor e ver os resultados.You can also use Windows PowerShell to run validation tests on your server cluster and view the results. Pode fazer testes antes e depois de configurar um aglomerado.You can run tests both before and after a cluster is set up.

Para realizar um teste de validação num cluster de servidor, emita os cmdlets Get-Cluster e Test-Cluster PowerShell do seu PC de gestão ou execute apenas o cmdlet test-Cluster diretamente no cluster:To run a validation test on a server cluster, issue the Get-Cluster and Test-Cluster PowerShell cmdlets from your management PC, or run only the Test-Cluster cmdlet directly on the cluster:

$Cluster = Get-Cluster -Name 'server-cluster1'
Test-Cluster -InputObject $Cluster -Verbose

Para obter mais exemplos e informações de utilização, consulte a documentação de referência do Test-Cluster.For more examples and usage information, see the Test-Cluster reference documentation.

Validar a replicação para a réplica de armazenamentoValidate replication for Storage Replica

Se estiver a usar a Réplica de Armazenamento para replicar volumes num cluster esticado ou cluster-a-cluster, existem vários eventos e cmdlets que pode usar para obter o estado de replicação.If you're using Storage Replica to replicate volumes in a stretched cluster or cluster-to-cluster, there are there are several events and cmdlets that you can use to get the state of replication.

No cenário seguinte, configuramos a Réplica de Armazenamento criando grupos de replicação (RGs) para dois sites, e depois especificámos os volumes de dados e volumes de registo para os nós do servidor de origem no Site1 (Server1, Server2) e os nós de servidor de destino (replicados) no Site2 (Server3, Server4).In the following scenario, we configured Storage Replica by creating replication groups (RGs) for two sites, and then specified the data volumes and log volumes for both the source server nodes in Site1 (Server1, Server2), and the destination (replicated) server nodes in Site2 (Server3, Server4).

Para determinar o progresso da replicação do Server1 no Site1, executar o comando Get-WinEvent e examinar os eventos 5015, 5002, 5004, 1237, 5001 e 2200:To determine the replication progress for Server1 in Site1, run the Get-WinEvent command and examine events 5015, 5002, 5004, 1237, 5001, and 2200:

Get-WinEvent -ComputerName Server1 -ProviderName Microsoft-Windows-StorageReplica -max 20

Para o Server3 no Site2, executar o seguinte Get-WinEvent comando para ver os eventos de Replica de Armazenamento que mostram a criação da parceria.For Server3 in Site2, run the following Get-WinEvent command to see the Storage Replica events that show creation of the partnership. Este evento indica o número de bytes copiados e o tempo decorrido.This event states the number of copied bytes and the time taken. Por exemplo:For example:

Get-WinEvent -ComputerName Server3 -ProviderName Microsoft-Windows-StorageReplica | Where-Object {$_.ID -eq "1215"} | FL

Para o Server3 no Site2, executar o comando e examinar os Get-WinEvent eventos 5009, 1237, 5001, 5015, 5005 e 2200 para entender o progresso do processamento.For Server3 in Site2, run the Get-WinEvent command and examine events 5009, 1237, 5001, 5015, 5005, and 2200 to understand the processing progress. Não deverá ser apresentado nenhum aviso de erro nesta sequência.There should be no warnings of errors in this sequence. Haverá muitos 1237 eventos - estes indicam progressos.There will be many 1237 events - these indicate progress.

Get-WinEvent -ComputerName Server3 -ProviderName Microsoft-Windows-StorageReplica | FL

Alternadamente, o grupo de servidores de destino para a réplica indica o número de byte restantes para copiar em todos os momentos, e pode ser consultado através do PowerShell com Get-SRGroup .Alternately, the destination server group for the replica states the number of byte remaining to copy at all times, and can be queried through PowerShell with Get-SRGroup. Por exemplo:For example:

(Get-SRGroup).Replicas | Select-Object numofbytesremaining

Para o nó Server3 no Site2, executar o seguinte comando e examinar os eventos 5009, 1237, 5001, 5015, 5005 e 2200 para entender o progresso da replicação.For node Server3 in Site2, run the following command and examine events 5009, 1237, 5001, 5015, 5005, and 2200 to understand the replication progress. Não deve haver avisos de erros.There should be no warnings of errors. No entanto, haverá muitos eventos "1237" - estes apenas indicam progressos.However, there will be many "1237" events - these simply indicate progress.

Get-WinEvent -ComputerName Server3 -ProviderName Microsoft-Windows-StorageReplica | FL

Como um roteiro de progresso que não terminará:As a progress script that will not terminate:

while($true) {
$v = (Get-SRGroup -Name "Replication2").replicas | Select-Object numofbytesremaining
[System.Console]::Write("Number of bytes remaining: {0}`r", $v.numofbytesremaining)
Start-Sleep -s 5
}

Para obter o estado de replicação dentro do aglomerado esticado, use Get-SRGroup e Get-SRPartnership :To get replication state within the stretched cluster, use Get-SRGroup and Get-SRPartnership:

Get-SRGroup -Cluster ClusterS1
Get-SRPartnership -Cluster ClusterS1
(Get-SRGroup).replicas -Cluster ClusterS1

Uma vez confirmada a replicação de dados bem sucedida entre sites, pode criar os seus VMs e outras cargas de trabalho.Once successful data replication is confirmed between sites, you can create your VMs and other workloads.

Consulte tambémSee also