Convalidare un cluster Azure Stack HCI

Si applica a: Azure Stack HCI, versioni 22H2 e 21H2; Windows Server 2022, Windows Server 2019.

Avviso

Le istruzioni di distribuzione fornite in questo articolo si applicano a una versione precedente, Azure Stack HCI, versione 22H2. Per le nuove distribuzioni, è consigliabile usare la versione più recente disponibile a livello generale, Azure Stack HCI, versione 23H2. Per istruzioni sulla distribuzione, vedere Informazioni sulla distribuzione di Azure Stack HCI versione 23H2.

Verificare che DCB non sia più lo strumento consigliato per configurare o testare la configurazione della rete host in Azure Stack HCI. È consigliabile usare Network ATC per configurare la configurazione della rete host per Azure Stack HCI. Network ATC sostituisce sempre Convalida DCB in Azure Stack HCI.

Anche se la Creazione guidata cluster in Windows Admin Center esegue determinate convalida per creare un cluster funzionante con l'hardware selezionato, la convalida del cluster esegue controlli aggiuntivi per assicurarsi che il cluster funzioni in un ambiente di produzione. Questo articolo di procedura è incentrato sul motivo per cui la convalida del cluster è importante e quando eseguirla in un cluster Azure Stack HCI.

È consigliabile eseguire la convalida del cluster per gli scenari primari seguenti:

  • Dopo la distribuzione di un cluster server, eseguire lo strumento Validate-DCB per testare la rete.
  • Dopo l'aggiornamento di un cluster server, a seconda dello scenario, eseguire entrambe le opzioni di convalida per risolvere i problemi del cluster.
  • Dopo aver configurato la replica con Replica di archiviazione, verificare che la replica venga eseguita normalmente controllando alcuni eventi specifici ed eseguendo un paio di comandi.
  • Dopo aver creato un cluster server, eseguire lo strumento Validate-DCB prima di inserirlo nell'ambiente di produzione.

Informazioni sulla convalida del cluster

La convalida del cluster è destinata a rilevare problemi hardware o di configurazione prima che un cluster entri in produzione. La convalida del cluster consente di assicurarsi che la soluzione Azure Stack HCI che si sta per distribuire sia veramente affidabile. È anche possibile usare la convalida del cluster nei cluster di failover configurati come strumento di diagnostica.

Scenari di convalida specifici

Questa sezione descrive gli scenari in cui è necessaria o utile anche la convalida.

  • Convalida prima della configurazione del cluster:

    • Set di server pronti per diventare un cluster di failover: Si tratta dello scenario di convalida più semplice. I componenti hardware (sistemi, reti e archiviazione) sono connessi, ma i sistemi non funzionano ancora come cluster. L'esecuzione di test in questa situazione non ha alcun effetto sulla disponibilità.

    • Macchine virtuali server: Per i server virtualizzati in un cluster, eseguire la convalida del cluster come si farebbe in qualsiasi altro cluster. Il requisito di eseguire la funzionalità è lo stesso se si dispone di:

      • Un "cluster host" in cui si verifica il failover tra due computer fisici.
      • Un "cluster guest" in cui si verifica il failover tra sistemi operativi guest nello stesso computer fisico.
  • Convalida dopo la configurazione e l'uso del cluster:

    • Prima di aggiungere un server al cluster: Quando si aggiunge un server a un cluster, è consigliabile convalidare il cluster. Specificare sia i membri del cluster esistenti che il nuovo server quando si esegue la convalida del cluster.

    • Quando si aggiungono unità: Quando si aggiungono unità aggiuntive al cluster, diverse dalla sostituzione di unità non riuscite o dalla creazione di dischi virtuali o volumi che si basano sulle unità esistenti, eseguire la convalida del cluster per confermare che la nuova risorsa di archiviazione funzionerà correttamente.

    • Quando si apportano modifiche che influiscono sul firmware o sui driver: Se si aggiornano o apportano modifiche al cluster che influiscono sul firmware o sui driver, è necessario eseguire la convalida del cluster per confermare che la nuova combinazione di hardware, firmware, driver e software supporta la funzionalità del cluster di failover.

    • Dopo il ripristino di un sistema dal backup: Dopo aver ripristinato un sistema dal backup, eseguire la convalida del cluster per verificare che le funzioni di sistema correttamente come parte di un cluster.

Convalidare la rete

Lo strumento Microsoft Validate-DCB è progettato per convalidare la configurazione del Data Center Bridging (DCB) nel cluster. A tale scopo, lo strumento accetta una configurazione prevista come input e quindi testa ogni server nel cluster. Questa sezione illustra come installare ed eseguire lo strumento Validate-DCB, esaminare i risultati e risolvere gli errori di rete identificati dallo strumento.

Nota

Microsoft consiglia di distribuire e gestire la configurazione con Network ATC, che elimina la maggior parte delle sfide di configurazione che lo strumento Validate-DCB controlla. Per altre informazioni su Network ATC, che fornisce un approccio basato sulle finalità per la distribuzione della rete host, vedere Semplificare la rete host con Network ATC.

Nella rete, l'accesso diretto diretto remoto (RDMA) su Ethernet convergente richiede tecnologie DCB per rendere l'infrastruttura di rete senza perdita. Con iWARP, DCB è facoltativo. Tuttavia, la configurazione di DCB può essere complessa, con configurazione esatta richiesta in:

  • Ogni server nel cluster
  • Ogni porta di rete che il traffico RDMA passa attraverso l'infrastruttura

Prerequisiti

  • Informazioni sulla configurazione di rete del cluster server che si desidera convalidare, tra cui:
    • Nome del cluster host o server
    • Nome del commutatore virtuale
    • Nomi delle schede di rete
    • Impostazioni di controllo del flusso di priorità (PFC) e selezione avanzata della trasmissione (ETS)
  • Connessione Internet per scaricare il modulo dello strumento in Windows PowerShell da Microsoft.

Installare ed eseguire lo strumento Validate-DCB

Per installare ed eseguire lo strumento Validate-DCB:

  1. Nel PC di gestione aprire una sessione di Windows PowerShell come amministratore e quindi usare il comando seguente per installare lo strumento.

    Install-Module Validate-DCB
    
  2. Accettare le richieste per usare il provider NuGet e accedere al repository per installare lo strumento.

  3. Dopo che PowerShell si connette alla rete Microsoft per scaricare lo strumento, digitare Validate-DCB e premere INVIO per avviare la procedura guidata dello strumento.

    Nota

    Se non è possibile eseguire lo script dello strumento Validate-DCB, potrebbe essere necessario modificare i criteri di esecuzione di PowerShell. Usare il cmdlet Get-ExecutionPolicy per visualizzare le impostazioni dei criteri di esecuzione dello script correnti. Per informazioni sull'impostazione dei criteri di esecuzione in PowerShell, vedere Informazioni sui criteri di esecuzione.

  4. Nella pagina Configurazione guidata Convalida-DCB selezionare Avanti.

  5. Nella pagina Cluster e nodi digitare il nome del cluster server che si vuole convalidare, selezionare Risolvi per elencarlo nella pagina e quindi selezionare Avanti.

    Pagina Cluster e nodi della configurazione convalida-DCB

  6. Nella pagina Adapters:

    1. Selezionare la casella di controllo associata vSwitch e digitare il nome della vSwitch.
    2. In Nome scheda digitare il nome di ogni scheda di interfaccia di rete fisica, in Nome della scheda di interfaccia di rete host, il nome di ogni scheda di interfaccia di rete virtuale (vNIC) e in VLAN l'ID VLAN in uso per ogni scheda.
    3. Espandere la casella di riepilogo a discesa Tipo RDMA e selezionare il protocollo appropriato: RoCE o iWARP. Impostare anche Jumbo Frame sul valore appropriato per la rete e quindi selezionare Avanti.

    Pagina Adattatori della procedura guidata di configurazione Validate-DCB

    Nota

  7. Nella pagina Bridging del Data Center modificare i valori in modo che corrispondano alle impostazioni dell'organizzazione per Priorità, Nome criteri e Prenotazione della larghezza di banda e quindi selezionare Avanti.

    Pagina Bridging del Data Center della configurazione convalida-DCB

    Nota

    La selezione di RDMA su RoCE nella pagina precedente della procedura guidata richiede DCB per l'affidabilità di rete in tutte le schede di interfaccia di rete e i commutatori.

  8. Nella casella Percorso file di configurazione della pagina Salva e distribuisci salvare il file di configurazione usando .ps1'estensione in un percorso in cui è possibile usarlo di nuovo in un secondo momento, quindi selezionare Esporta per avviare l'esecuzione dello strumento Validate-DCB.

    • Facoltativamente, è possibile distribuire il file di configurazione completando la sezione Distribuisci configurazione nei nodi della pagina, che include la possibilità di usare un account Automazione di Azure per distribuire la configurazione e quindi convalidarla. Per iniziare a usare Automazione di Azure, vedere Creare un account Automazione di Azure.

    Pagina Salva e distribuisci della procedura guidata convalida-DCB

Esaminare i risultati e correggere gli errori

Lo strumento Validate-DCB produce risultati in due unità:

  1. [Unità globale] elenca i prerequisiti e i requisiti per eseguire i test modali.
  2. [Unità modale] i risultati forniscono commenti e suggerimenti su ogni configurazione host del cluster e sulle procedure consigliate.

In questo esempio vengono visualizzati i risultati dell'analisi riuscita di un singolo server per tutti i prerequisiti e gli unit test modali indicando un conteggio non riuscito di 0.

Convalidare i risultati dell'unità globale DCB e dei risultati degli unit test modali

I passaggi seguenti illustrano come identificare un errore del pacchetto Jumbo dalla scheda di rete virtuale SMB02 e risolverlo:

  1. I risultati dello strumento Validate-DCB mostrano un errore Di conteggio non riuscito pari a 1.

    Risultati dell'analisi dello strumento Validate-DCB che mostra un errore di conteggio non riuscito pari a 1

  2. Scorrere di nuovo i risultati mostra un errore in rosso che indica che il pacchetto Jumbo per vNIC SMB02 nell'host S046036 è impostato sulle dimensioni predefinite di 1514, ma deve essere impostato su 9014.

    Risultato dell'analisi dello strumento Validate-DCB che mostra un errore di impostazione delle dimensioni del pacchetto jumbo

  3. Esaminare le proprietà avanzate di VNIC SMB02 nell'host S046036 mostra che il pacchetto Jumbo è impostato sul valore predefinito disabilitato.

    Impostazione del pacchetto Jumbo advanced di Hyper-V dell'host server

  4. La correzione dell'errore richiede l'abilitazione della funzionalità Pacchetto Jumbo e la modifica delle dimensioni in 9014 byte. L'esecuzione dell'analisi nell'host S046036 conferma questa modifica restituendo un conteggio non riuscito pari a 0.

    Convalidare i risultati dell'analisi DCB che confermano che l'impostazione del pacchetto Jumbo dell'host del server è fissa

Per altre informazioni sulla risoluzione degli errori identificati dallo strumento Validate-DCB, vedere il video seguente.

È anche possibile installare lo strumento offline. Per i sistemi disconnessi, usare Save-Module -Name Validate-DCB -Path c:\temp\Validate-DCB e quindi spostare i moduli in c:\temp\Validate-DCB nel sistema disconnesso. Per altre informazioni, vedere il video seguente.

Convalidare il cluster

Seguire questa procedura per convalidare i server in un cluster esistente in Windows Admin Center.

  1. In Windows Admin Center, in Tutte le connessioni selezionare il cluster Azure Stack HCI da convalidare e quindi selezionare Connetti.

    Il dashboard di Cluster Manager visualizza informazioni generali sul cluster.

  2. Nel dashboard di Gestione cluster selezionare Server in Strumenti.

  3. Nella pagina Inventario selezionare i server nel cluster, quindi espandere altri sottomenu e selezionare Convalida cluster.

  4. Nella finestra popup Convalida cluster selezionare .

    Finestra popup Convalida cluster

  5. Nella finestra popup Provider di servizi di sicurezza delle credenziali (CredSSP) selezionare .

  6. Specificare le credenziali per abilitare CredSSP e quindi selezionare Continua.
    La convalida del cluster viene eseguita in background e fornisce una notifica al termine, a questo punto è possibile visualizzare il report di convalida, come descritto nella sezione successiva.

Nota

Dopo aver convalidato i server del cluster, è necessario disabilitare CredSSP per motivi di sicurezza.

Disabilitare CredSSP

Dopo la convalida del cluster server, è necessario disabilitare il protocollo Del provider di supporto per la sicurezza delle credenziali (CredSSP) in ogni server a scopo di sicurezza. Per altre informazioni, vedere CVE-2018-0886.

  1. In Windows Admin Center, in Tutte le connessioni selezionare il primo server nel cluster e quindi selezionare Connetti.

  2. Nella pagina Panoramica selezionare Disabilita credSSP e quindi nella finestra popup Disabilita credSSP selezionare .

    Il risultato del passaggio 2 rimuove il banner abilitata per CredSSP rosso nella parte superiore della pagina Panoramica del server e disabilita CredSSP negli altri server.

Visualizzare i report di convalida

A questo momento è possibile visualizzare il report di convalida del cluster.

Esistono alcuni modi per accedere ai report di convalida:

  • Nella pagina Inventario espandere il sottomenu Altre sottomenu e quindi selezionare Visualizza report di convalida.

  • In alto a destra di Windows Admin Center selezionare l'icona Della campana notifiche per visualizzare il riquadro Notifiche. Selezionare l'avviso Del cluster convalidato correttamente e quindi selezionare Vai al report di convalida del cluster di failover.

Nota

Il processo di convalida del cluster server potrebbe richiedere tempo per completare. Non passare a un altro strumento in Windows Admin Center mentre il processo è in esecuzione. Nel riquadro Notifiche , una barra di stato sotto l'avviso Convalida cluster indica quando viene eseguito il processo.

Convalidare il cluster con PowerShell

È anche possibile usare Windows PowerShell per eseguire test di convalida nel cluster server e visualizzare i risultati. È possibile eseguire test sia prima che dopo la configurazione di un cluster.

Per eseguire un test di convalida in un cluster server, eseguire i cmdlet Get-Cluster e Test-Cluster server> PowerShell dal PC di gestione oppure eseguire solo il cmdlet Test-Cluster<direttamente nel cluster:

$Cluster = Get-Cluster -Name 'server-cluster1'
Test-Cluster -InputObject $Cluster -Verbose

Per altri esempi e informazioni sull'utilizzo, vedere la documentazione di riferimento di Test-Cluster .

Test-NetStack è uno strumento di test basato su PowerShell disponibile da GitHub che è possibile usare per eseguire i test di traffico ICMP, TCP e RDMA delle reti e identificare potenziali configurazioni di infrastruttura di rete e errori di configurazione o instabilità operativa. Usare Test-NetStack per convalidare i percorsi dei dati di rete testando percorsi di dati di rete nativi, sintetici e hardware caricati (RDMA) per problemi relativi alla connettività, alla frammentazione dei pacchetti, alla velocità effettiva ridotta e alla congestione.

Convalidare la replica per la replica di archiviazione

Se si usa Replica di archiviazione per replicare i volumi in un cluster o in un cluster esteso, sono disponibili diversi eventi e cmdlet che è possibile usare per ottenere lo stato di replica.

Nello scenario seguente è stata configurata replica di archiviazione creando gruppi di replica (RGS) per due siti e quindi sono stati specificati i volumi di dati e i volumi di log per entrambi i nodi del server di origine in Site1 (Server1, Server2) e i nodi server di destinazione (replicati) in Site2 (Server3, Server4).

Per determinare lo stato di avanzamento della replica per Server1 in Site1, eseguire il comando Get-WinEvent ed esaminare gli eventi 5015, 5002, 5004, 1237, 5001 e 2200:

Get-WinEvent -ComputerName Server1 -ProviderName Microsoft-Windows-StorageReplica -max 20

Per Server3 in Site2, eseguire il comando seguente Get-WinEvent per visualizzare gli eventi di replica di archiviazione che mostrano la creazione della partnership. Questo evento indica il numero di byte copiati e il tempo impiegato. Ad esempio:

Get-WinEvent -ComputerName Server3 -ProviderName Microsoft-Windows-StorageReplica | Where-Object {$_.ID -eq "1215"} | FL

Per Server3 in Site2, eseguire il Get-WinEvent comando ed esaminare gli eventi 5009, 1237, 5001, 5015, 5005 e 2200 per comprendere lo stato di avanzamento dell'elaborazione. Non dovrebbe essere presente alcun avviso di errori in questa sequenza. Ci saranno molti 1237 eventi: questi indicano lo stato di avanzamento.

Get-WinEvent -ComputerName Server3 -ProviderName Microsoft-Windows-StorageReplica | FL

In alternativa, il gruppo di server di destinazione per la replica indica il numero di byte rimanenti per la copia in ogni momento e può essere eseguito una query tramite PowerShell con Get-SRGroup. Ad esempio:

(Get-SRGroup).Replicas | Select-Object numofbytesremaining

Per node Server3 in Site2, eseguire il comando seguente ed esaminare gli eventi 5009, 1237, 5001, 5015, 5005 e 2200 per comprendere lo stato di avanzamento della replica. Non devono essere presenti avvisi di errori. Tuttavia, ci saranno molti eventi "1237" - questi indicano semplicemente lo stato di avanzamento.

Get-WinEvent -ComputerName Server3 -ProviderName Microsoft-Windows-StorageReplica | FL

Come script di stato che non termina:

while($true) {
$v = (Get-SRGroup -Name "Replication2").replicas | Select-Object numofbytesremaining
[System.Console]::Write("Number of bytes remaining: {0}`r", $v.numofbytesremaining)
Start-Sleep -s 5
}

Per ottenere lo stato di replica all'interno del cluster esteso, usare Get-SRGroup e Get-SRPartnership:

Get-SRGroup -Cluster ClusterS1
Get-SRPartnership -Cluster ClusterS1
(Get-SRGroup).replicas -Cluster ClusterS1

Dopo aver completato la replica dei dati, è possibile creare macchine virtuali e altri carichi di lavoro.

Vedi anche