Monitorare i cluster con il servizio integrità

Si applica a: Azure Stack HCI, versioni 23H2 e 22H2; Windows Server 2022, Windows Server 2019, Windows Server 2016

Il servizio integrità, rilasciato per la prima volta in Windows Server 2016, migliora il monitoraggio e l'esperienza operativa giornaliera per i cluster che eseguono Spazi di archiviazione diretta.

Prerequisiti

Servizio integrità è abilitato per impostazione predefinita con Spazi di archiviazione diretta. Non è necessario alcuna azione aggiuntiva per configurarlo o avviarlo. Per altre informazioni sulle Spazi di archiviazione diretta, vedere la panoramica Spazi di archiviazione diretta.

Cronologia delle prestazioni del cluster

Ottenere prestazioni live e informazioni sulla capacità dal cluster Spazi di archiviazione diretta. Vedere Ottenere la cronologia delle prestazioni del cluster.

Errori del servizio di integrità

Visualizzare eventuali errori correnti per verificare facilmente l'integrità della distribuzione. Vedere Visualizzare gli errori del servizio di integrità.

Azioni del servizio integrità

Tenere traccia dello stato di avanzamento delle azioni del servizio integrità eseguite autonomamente. Vedere Tenere traccia delle azioni del servizio integrità.

Automazione

La sezione seguente descrive i flussi di lavoro che vengono automatizzati da Servizio integrità nel ciclo di vita del disco.

Ciclo di vita del disco

Servizio integrità consente di automatizzare la maggior parte delle fasi del ciclo di vita del disco fisico. Si supponga che lo stato iniziale della distribuzione sia in stato perfetto, ovvero che tutti i dischi fisici funzionino correttamente.

Ritiro

I dischi fisici vengono disconnessi automaticamente quando non possono più essere usati e viene generato un errore corrispondente. Esistono diversi casi:

  • Errore dei supporti: il disco fisico è definitivamente guasto e non può più essere sostituito.
  • Perdita di comunicazione: il disco fisico ha perso la connettività per oltre 15 minuti consecutivi.
  • Mancata risposta: è stata rilevata una latenza per il disco fisico di oltre 5,0 secondi tre o più volte all'interno di un'ora.

Nota

Se si perde la connettività di diversi dischi fisici in una sola volta, o di un intero nodo o alloggiamento di archiviazione, Servizio integrità non disconnette tali dischi poiché è improbabile che costituiscano la causa radice del problema.

Se il disco disconnesso fungeva da cache per molti altri dischi fisici, questi verranno automaticamente riassegnati a un altro disco cache disponibile. Non è richiesta alcuna azione specifica da parte dell'utente.

Ripristino della resilienza

Una volta che un disco fisico è stato disattivato, Servizio integrità inizia immediatamente a copiarne i dati nei dischi fisici rimanenti, per ripristinare la resilienza completa. Una volta completata questa operazione, i dati sono totalmente protetti e a tolleranza d’errore.

Nota

Il ripristino immediato richiede una capacità sufficiente disponibile tra i dischi fisici rimanenti.

Lampeggiamento della spia

Se possibile, Servizio integrità inizierà a far lampeggiare la luce della spia del disco fisico disconnesso o dello slot corrispondente. La spia continuerà a lampeggiare per un tempo indefinito, finché il disco non verrà sostituito.

Nota

In alcuni casi il guasto del disco potrebbe precludere persino il lampeggiamento della spia, ad esempio in caso di mancanza totale di alimentazione elettrica.

Sostituzione disco fisico

È necessario sostituire il disco fisico disconnesso quando possibile. La maggior parte delle volte è costituita da uno scambio frequente, ovvero l'alimentazione del nodo o dell'chassis di archiviazione non è necessaria. Vedere i dettagli dell'errore per le informazioni sulla posizione e sulla parte.

Verifica

Quando il disco sostitutivo viene inserito, verrà verificato nel documento Componenti supportati (vedere la sezione successiva).

Pooling

Se autorizzato, il disco sostitutivo verrà sostituito automaticamente nel pool del disco precedente per iniziare a essere usato. A questo punto, il sistema è tornato allo stato iniziale di integrità perfetta e quindi l'errore scompare.

Documento componenti supportati

Il servizio integrità fornisce un meccanismo di imposizione per limitare i componenti usati da Spazi di archiviazione diretta a quelli in un documento componenti supportati fornito dall'amministratore o dal fornitore di soluzioni. In questo modo si evita che l’utente usi hardware non supportato e che insorgano problemi di garanzia o di conformità con il contratto di assistenza. Questa funzionalità è attualmente limitata ai dispositivi dischi fisici, inclusi dischi SSD, DISCHI RIGIDI e unità NVMe. Il documento Componenti supportati può limitare il modello, il produttore (facoltativo) e la versione del firmware (facoltativo).

Utilizzo

Il documento Componenti supportati usa una sintassi ispirata a XML. È consigliabile usare l'editor di testo preferito, ad esempio il blocco note o Visual Studio Code gratuito, per creare un documento XML che è possibile salvare e riutilizzare.

Sezioni

Il documento include due sezioni indipendenti: Disks e Cache.

Se viene fornita la Disks sezione, sono consentite solo le unità elencate (come Disk) per aggiungere pool. Tutte le unità non elencate non vengono impedite di unire i pool, che impediscono in modo efficace l'uso nell'ambiente di produzione. Se questa sezione è vuota, qualsiasi unità sarà consentita per aggiungere pool.

Se viene fornita la Cache sezione, vengono usate solo le unità elencate (come CacheDisk) per la memorizzazione nella cache. Se questa sezione è vuota, Spazi di archiviazione diretta tenta di indovinare in base al tipo di supporto e al tipo di bus. Le unità elencate qui devono essere elencate anche in Disks.

Importante

Il documento Componenti supportati non si applica retroattivamente alle unità già in pool e in uso.

Esempio

<Components>

  <Disks>
    <Disk>
      <Manufacturer>Contoso</Manufacturer>
      <Model>XYZ9000</Model>
      <AllowedFirmware>
        <Version>2.0</Version>
        <Version>2.1</Version>
        <Version>2.2</Version>
      </AllowedFirmware>
      <TargetFirmware>
        <Version>2.1</Version>
        <BinaryPath>C:\ClusterStorage\path\to\image.bin</BinaryPath>
      </TargetFirmware>
    </Disk>
    <Disk>
      <Manufacturer>Fabrikam</Manufacturer>
      <Model>QRSTUV</Model>
    </Disk>
  </Disks>

  <Cache>
    <CacheDisk>
      <Manufacturer>Fabrikam</Manufacturer>
      <Model>QRSTUV</Model>
    </CacheDisk>
  </Cache>

</Components>

Per elencare più unità, è sufficiente aggiungere tag o <CacheDisk> aggiuntivi<Disk>.

Per inserire questo XML durante la distribuzione di Spazi di archiviazione diretta, usare il -XML parametro:

$MyXML = Get-Content <Filepath> | Out-String
Enable-ClusterS2D -XML $MyXML

Per impostare o modificare il documento Componenti supportati una volta che Spazi di archiviazione diretta è stato distribuito:

$MyXML = Get-Content <Filepath> | Out-String
Get-StorageSubSystem Cluster* | Set-StorageHealthSetting -Name "System.Storage.SupportedComponents.Document" -Value $MyXML

Nota

Il modello, il produttore e le proprietà della versione del firmware devono corrispondere esattamente ai valori che si ottengano usando il cmdlet Get-PhysicalDisk. Il risultato può essere diverso da quanto ci si aspetterebbe ma dipende dall’implementazione del proprio fornitore. Ad esempio, il produttore potrebbe essere "CONTOSO LTD" invece di "Contoso", oppure il campo potrebbe essere vuoto mentre il modello è "Contoso-XZY9000".

Per verificare, usare il cmdlet PowerShell seguente:

Get-PhysicalDisk | Select Model, Manufacturer, FirmwareVersion

Impostazioni del servizio integrità

Modificare le impostazioni del servizio integrità per ottimizzare l'aggressività di errori o azioni, attivare o disattivare determinati comportamenti e altro ancora. Vedere Modificare le impostazioni del servizio integrità.

Riferimenti aggiuntivi