Monitorizar clusters com o Serviço de Estado de Funcionamento

Aplica-se a: Azure Stack HCI, versões 23H2 e 22H2; Windows Server 2022, Windows Server 2019, Windows Server 2016

O Serviço de Estado de Funcionamento, lançado pela primeira vez no Windows Server 2016, melhora a monitorização diária e a experiência operacional dos clusters em execução Espaços de Armazenamento Direto.

Pré-requisitos

Por predefinição, o Serviço de Estado de Funcionamento é ativado com Espaços de Armazenamento Direto. Não é necessária qualquer ação adicional para o configurar ou iniciar. Para saber mais sobre Espaços de Armazenamento Direto, consulte a descrição geral do Espaços de Armazenamento Direto.

Histórico de desempenho do cluster

Obtenha informações de desempenho e capacidade em direto a partir do cluster de Espaços de Armazenamento Direto. Veja Obter histórico de desempenho do cluster.

Falhas do Serviço de Estado de Funcionamento

Apresentar quaisquer falhas atuais para verificar facilmente o estado de funcionamento da implementação. Veja Ver falhas do Serviço de Estado de Funcionamento.

Ações do Serviço de Estado de Funcionamento

Controlar o progresso das ações do Serviço de Estado de Funcionamento que são executadas de forma autónoma. Veja Controlar as ações do Serviço de Estado de Funcionamento.

Automatização

Esta secção descreve os fluxos de trabalho que são automatizados pelo Serviço de Estado de Funcionamento no ciclo de vida do disco.

Ciclo de vida do disco

O Serviço de Estado de Funcionamento automatiza a maioria das fases do ciclo de vida do disco físico. Digamos que o estado inicial da sua implementação está num estado de funcionamento perfeito, isto é, todos os discos físicos estão a funcionar corretamente.

Extinção

Os discos físicos são automaticamente extinguidos quando já não podem ser mais utilizados e é acionado uma Falha correspondente. Existem vários casos:

  • Falha de Suporte de Dados: o disco físico está definitivamente com falha ou danificado e deve ser substituído.
  • Comunicação Perdida: o disco físico perdeu a conectividade durante mais de 15 minutos consecutivos.
  • Não responsivo: o disco físico apresentou uma latência de mais de 5,0 segundos, três ou mais vezes dentro de uma hora.

Nota

Se perder a conectividade em muitos discos físicos ao mesmo tempo ou num nó ou bastidor armazenamento inteiro, o Serviço de Estado de Funcionamento não extinguirá estes discos, uma vez que é pouco provável que sejam o problema principal.

Se o disco extinto estava a funcionar como a cache para muitos outros discos físicos, este será automaticamente reatribuído para outro disco em cache, se estiver disponível. Não é necessária qualquer ação especial do utilizador.

Restaurar a resiliência

Depois de um disco físico ter sido extinguido, o Serviço de Estado de Funcionamento começa imediatamente a copiar os dados para os restantes discos físicos, para restaurar a resiliência completa. Quando esta ação tiver sido concluída, os dados ficam novamente em completa segurança e com tolerância a falhas.

Nota

Este restauro imediato requer a capacidade disponível suficiente entre os discos físicos restantes.

Intermitência da luz indicadora

Se possível, o Serviço de Estado de Funcionamento deixará a luz indicadora intermitente no disco físico extinto ou na respetiva ranhura. A luz indicadora ficará intermitente indefinidamente, até que o disco extinto seja substituído.

Nota

Em alguns casos, o disco pode ter falhado de uma forma que interrompe mesmo o funcionamento do indicador, por exemplo, uma perda total de energia.

Substituição física

Deve substituir o disco físico extinto logo que possível. Na maioria das vezes, isto consiste numa troca frequente, ou seja, não é necessário desligar o nó ou o bastidor de armazenamento. Veja a Falha para uma localização útil e informações de peça.

Verificação

Quando o disco de substituição for inserido, este será verificado no Documento de Componentes Suportados (consulte a secção seguinte).

Agrupamento

Se permitido, o disco de substituição é automaticamente substituído para o agrupamento do seu antecessor para começar a utilização. Neste momento, o sistema é devolvido ao seu estado de funcionamento perfeito inicial e, em seguida, a Falha desaparece.

Documento de Componentes Suportados

O Serviço de Estado de Funcionamento fornece um mecanismo de imposição para restringir os componentes utilizados pelo Espaços de Armazenamento Direto aos de um Documento de Componentes Suportados fornecido pelo administrador ou fornecedor de soluções. Tal pode ser utilizado para impedir a utilização errada do hardware não suportado pelo utilizador ou outras pessoas, o que pode ajudar com a conformidade com a garantia ou o contrato de suporte. Esta funcionalidade está atualmente limitada a dispositivos de disco físico, incluindo SSDs, HDDs e unidades NVMe. O Documento de Componentes Suportados pode restringir o modelo, o fabricante (opcional) e a versão de firmware (opcional).

Utilização

O Documento de Componentes Suportados utiliza uma sintaxe inspirada em XML. Recomendamos que utilize o seu editor de texto favorito, como o Visual Studio Code ou o Bloco de Notas gratuito, para criar um documento XML que pode guardar e reutilizar.

Secções

O documento tem duas secções independentes: Disks e Cache.

Se a Disks secção for fornecida, apenas as unidades listadas (como Disk) têm permissão para associar conjuntos. Quaisquer unidades não listadas são impedidas de associar conjuntos, o que efetivamente impede a sua utilização na produção. Se esta secção ficar vazia, qualquer unidade será autorizada a associar conjuntos.

Se a Cache secção for fornecida, apenas as unidades listadas (como CacheDisk) são utilizadas para colocação em cache. Se esta secção ficar vazia, Espaços de Armazenamento Direto tenta adivinhar com base no tipo de suporte de dados e no tipo de barramento. As unidades listadas aqui também devem estar listadas em Disks.

Importante

O Documento de Componentes Suportados não se aplica retroativamente a unidades já agrupadas e em utilização.

Exemplo

<Components>

  <Disks>
    <Disk>
      <Manufacturer>Contoso</Manufacturer>
      <Model>XYZ9000</Model>
      <AllowedFirmware>
        <Version>2.0</Version>
        <Version>2.1</Version>
        <Version>2.2</Version>
      </AllowedFirmware>
      <TargetFirmware>
        <Version>2.1</Version>
        <BinaryPath>C:\ClusterStorage\path\to\image.bin</BinaryPath>
      </TargetFirmware>
    </Disk>
    <Disk>
      <Manufacturer>Fabrikam</Manufacturer>
      <Model>QRSTUV</Model>
    </Disk>
  </Disks>

  <Cache>
    <CacheDisk>
      <Manufacturer>Fabrikam</Manufacturer>
      <Model>QRSTUV</Model>
    </CacheDisk>
  </Cache>

</Components>

Para listar várias unidades, basta adicionar mais <Disk> ou <CacheDisk> etiquetas.

Para injetar este XML ao implementar Espaços de Armazenamento Direto, utilize o -XML parâmetro:

$MyXML = Get-Content <Filepath> | Out-String
Enable-ClusterS2D -XML $MyXML

Para definir ou modificar o Documento de Componentes Suportados assim que Espaços de Armazenamento Direto tiver sido implementado:

$MyXML = Get-Content <Filepath> | Out-String
Get-StorageSubSystem Cluster* | Set-StorageHealthSetting -Name "System.Storage.SupportedComponents.Document" -Value $MyXML

Nota

O modelo, o fabricante e as propriedades da versão de firmware devem corresponder exatamente aos valores que obtém ao utilizar o cmdlet Get-PhysicalDisk. Esses valores podem diferir com base na sua expetativa de “senso comum”, dependendo da implementação do seu fornecedor. Por exemplo, ao invés de “Contoso”, o fabricante poderá ser “CONTOSO Lda.” ou pode ficar em branco enquanto o modelo é “Contoso-XZY9000”.

Pode verificar com o cmdlet PowerShell seguinte:

Get-PhysicalDisk | Select Model, Manufacturer, FirmwareVersion

Definições do Serviço de Estado de Funcionamento

Modifique as definições do Serviço de Estado de Funcionamento para otimizar a agressividade de falhas ou ações, ativar ou desativar determinados comportamentos e muito mais. Veja Modificar as definições do Serviço de Estado de Funcionamento.

Referências Adicionais