Entender e monitorar a ressincronização de armazenamento

Aplica-se a: Windows Server 2022, Windows Server 2019

Armazenamento alertas de ressincronização são um novo recurso do Espaços de Armazenamento Direct no Windows Server 2019 que permite ao Serviço de Integridade lançar uma falha quando o armazenamento é ressincronizado. O alerta é útil para notificá-lo quando a ressincronização estiver acontecendo, para que você não demore acidentalmente mais servidores (o que pode causar a falha de vários domínios de falhas, resultando no desligamento do seu cluster).

este tópico fornece o plano de fundo e as etapas para entender e ver a resincronização de armazenamento em um cluster de failover do Windows Server com o Espaços de Armazenamento Direct.

Compreendendo a ressincronização

Vamos começar com um exemplo simples para entender como o armazenamento fica fora de sincronia. Tenha em mente que nenhuma solução de armazenamento distribuído de nada compartilhado (somente unidades locais) exibe esse comportamento. Como você verá abaixo, se um nó de servidor ficar inativo, suas unidades não serão atualizadas até que ele volte a ficar online-isso é verdade para qualquer arquitetura hiperconvergente.

Suponha que desejamos armazenar a cadeia de caracteres "Olá".

ASCII of string

Asssuming que temos resiliência de espelho de três vias, temos três cópias dessa cadeia de caracteres. Agora, se levarmos o servidor #1 temporariamente (para manutenção), não será possível acessar a cópia #1.

Can't access copy #1

Suponha que nós atualizamos nossa cadeia de caracteres de "Olá" para "HELP!" no momento.

ASCII of string

Depois de atualizarmos a cadeia de caracteres, copie #2 e #3 serão atualizados com êxito. No entanto, a cópia #1 ainda não pode ser acessada porque o servidor #1 está inoperante temporariamente (para manutenção).

Gif of writing to copy #2 and #2

Agora, temos a cópia #1 que tem dados fora de sincronia. O sistema operacional usa o rastreamento de região suja granular para controlar os bits que estão fora de sincronia. Dessa forma, quando o servidor #1 volta a ficar online, podemos sincronizar as alterações lendo os dados da cópia #2 ou #3 e substituir os dados em #1 de cópia. As vantagens dessa abordagem são que precisamos apenas copiar os dados que estão obsoletos, em vez de sincronizar todos os dados do servidor #2 ou #3 do servidor.

Gif of overwriting to copy #1

Portanto, isso explica como os dados ficam fora de sincronia. Mas o que isso parece mais em um alto nível? Suponha que, neste exemplo, tenhamos um cluster hiperconvergente de três servidores. Quando o servidor #1 estiver em manutenção, você o verá como estando inativo. Quando você coloca o servidor #1 backup, ele começa a ressincronizar todo o seu armazenamento usando o controle de região sujo granular (explicado acima). Depois que os dados estiverem todos de volta na sincronização, todos os servidores serão mostrados como ativos.

Gif of admin view of resync

como monitorar a resincronização de armazenamento no Windows Server 2019

agora que você entende como o armazenamento de ressincronização funciona, vamos ver como isso é mostrado no Windows Server 2019. adicionamos uma nova falha à Serviço de Integridade que será exibida quando o armazenamento estiver sendo ressincronizado.

Para exibir essa falha no PowerShell, execute:

Get-HealthFault

essa é uma nova falha no Windows Server 2019 e aparecerá no PowerShell, no relatório de validação de cluster e em qualquer outro lugar que se baseie em falhas de integridade.

Para obter uma exibição mais profunda, você pode consultar o banco de dados de série temporal no PowerShell da seguinte maneira:

Get-ClusterNode | Get-ClusterPerf -ClusterNodeSeriesName ClusterNode.Storage.Degraded

Veja a seguir um exemplo de saída:

Object Description: ClusterNode Server1

Series                       Time                Value Unit
------                       ----                ----- ----
ClusterNode.Storage.Degraded 01/11/2019 16:26:48     214 GB

notavelmente, Windows centro de administração usa falhas de integridade para definir o status e a cor dos nós de cluster. Assim, essa nova falha fará com que os nós de cluster façam a transição de vermelho (para baixo) para amarelo (ressincronização) para verde (para cima), em vez de passar diretamente de vermelho para verde, no painel do HCI.

Image of 2016 vs 2019 view of resync

Ao mostrar o progresso geral da ressincronização do armazenamento, você pode saber com precisão a quantidade de dados fora de sincronia e se o seu sistema está progredindo para o futuro. quando você abrir Windows centro de administração e acessar o painel, verá o novo alerta da seguinte maneira:

Image of alert in Windows Admin Center

O alerta é útil para notificá-lo quando a ressincronização estiver acontecendo, para que você não demore acidentalmente mais servidores (o que pode causar a falha de vários domínios de falhas, resultando no desligamento do seu cluster).

se você navegar até a página servidores no centro de administração Windows, clicar em inventárioe, em seguida, escolher um servidor específico, poderá obter uma exibição mais detalhada de como essa ressincronização de armazenamento é procurada por servidor. se você navegar até o servidor e examinar o gráfico de Armazenamento , verá a quantidade de dados que precisa ser reparada em uma linha roxa com o número exato direito acima. Esse valor aumentará quando o servidor estiver inoperante (mais dados precisa ser ressincronizado) e diminuir gradualmente quando o servidor voltar a ficar online (os dados estão sendo sincronizados). Quando a quantidade de dados que precisa ser reparada for 0, seu armazenamento será feito com a ressincronização – agora você está livre para retirar um servidor se precisar. uma captura de tela dessa experiência no centro de administração Windows é mostrada abaixo:

Image of server view in Windows Admin Center

Como ver o armazenamento de ressincronização no Windows Server 2016

Como você pode ver, esse alerta é particularmente útil para obter uma visão holística do que está acontecendo na camada de armazenamento. ele resume efetivamente as informações que você pode obter do cmdlet Get-StorageJob, que retorna informações sobre trabalhos de módulo Armazenamento de longa execução, como uma operação de reparo em um espaço de armazenamento. Um exemplo é mostrado abaixo:

Get-StorageJob

Veja o exemplo de saída:

Name                  ElapsedTime           JobState              PercentComplete       IsBackgroundTask
----                  -----------           --------              ---------------       ----------------
Regeneration          00:01:19              Running               50                    True

Essa exibição é muito mais granular, já que os trabalhos de armazenamento listados são por volume, você pode ver a lista de trabalhos em execução e pode acompanhar o progresso individual. esse cmdlet funciona tanto no Windows Server 2016 quanto no 2019.

Referências adicionais