Gerenciar a infraestrutura de armazenamento para Azure Stack Hub

Este artigo descreve a integridade e o status operacional dos recursos de infraestrutura de armazenamento de Azure Stack Hub. Esses recursos incluem unidades de armazenamento e volumes. As informações neste tópico ajudam a solucionar vários problemas, como quando uma unidade não pode ser adicionada a um pool.

Estados de volume

Para descobrir quais volumes de estado estão, use os seguintes comandos do PowerShell:

$scaleunit_name = (Get-AzsScaleUnit)[0].name

$subsystem_name = (Get-AzsStorageSubSystem -ScaleUnit $scaleunit_name)[0].name

Get-AzsVolume -ScaleUnit $scaleunit_name -StorageSubSystem $subsystem_name | Select-Object VolumeLabel, HealthStatus, OperationalStatus, RepairStatus, Description, Action, TotalCapacityGB, RemainingCapacityGB

Aqui está um exemplo de saída mostrando um volume desanexado e um volume degradado/incompleto:

VolumeLabel HealthStatus OperationalStatus
ObjStore_1 Unknown Desanexado
ObjStore_2 Aviso {Degradado, incompleto}

As seções a seguir listam os Estados de integridade e operacionais:

Estado de integridade do volume: íntegro

Estado operacional Description
OK O volume está íntegro.
Ideal Os dados não são gravados uniformemente entre as unidades.

Ação: Contate o suporte para otimizar o uso da unidade no pool de armazenamento. Antes de fazer isso, inicie o processo de coleta do arquivo de log usando as diretrizes de https://aka.ms/azurestacklogfiles . Talvez seja necessário restaurar a partir do backup depois que a conexão com falha for restaurada.

Estado de integridade do volume: aviso

Quando o volume está em um estado de integridade de aviso, isso significa que uma ou mais cópias de seus dados estão indisponíveis, mas Azure Stack Hub ainda pode ler pelo menos uma cópia dos dados.

Estado operacional Description
Em serviço Azure Stack Hub está reparando o volume, como depois de adicionar ou remover uma unidade. Quando o reparo for concluído, o volume deverá retornar ao estado de integridade OK.

Ação: Aguarde até que Azure Stack Hub termine de reparar o volume e verifique o status posteriormente.
Incompleto A resiliência do volume é reduzida porque uma ou mais unidades falharam ou estão ausentes. No entanto, as unidades ausentes contêm cópias atualizadas dos dados.

Ação: Reconecte todas as unidades ausentes, substitua todas as unidades com falha e coloque online todos os servidores que estiverem offline.
Degradado A resiliência do volume é reduzida devido a uma ou mais unidades com falha ou ausentes, bem como cópias desatualizadas dos dados nas unidades.

Ação: Reconecte todas as unidades ausentes, substitua todas as unidades com falha e coloque online todos os servidores que estiverem offline.

Estado de integridade do volume: não íntegro

Quando um volume está em um estado de integridade não íntegro, alguns ou todos os dados no volume estão inacessíveis no momento.

Estado operacional Description
Sem redundância O volume perdeu dados porque muitas unidades falharam.

Ação: Contate o suporte. Antes de fazer isso, inicie o processo de coleta do arquivo de log usando as diretrizes de https://aka.ms/azurestacklogfiles .

Estado de integridade do volume: desconhecido

O volume também pode estar no estado de integridade desconhecido se o disco virtual tiver sido desanexado.

Estado operacional Description
Desanexado Ocorreu uma falha de dispositivo de armazenamento que pode fazer com que o volume fique inacessível. Alguns dados podem ser perdidos.

Ação:
1. Verifique a conectividade física e de rede de todos os dispositivos de armazenamento.
2. se todos os dispositivos estiverem conectados corretamente, contate o suporte. Antes de fazer isso, inicie o processo de coleta do arquivo de log usando as diretrizes de https://aka.ms/azurestacklogfiles . Talvez seja necessário restaurar a partir do backup depois que a conexão com falha for restaurada.

Estados da unidade

Use os seguintes comandos do PowerShell para monitorar o estado das unidades:

$scaleunit_name = (Get-AzsScaleUnit)[0].name

$subsystem_name = (Get-AzsStorageSubSystem -ScaleUnit $scaleunit_name)[0].name

Get-AzsDrive -ScaleUnit $scaleunit_name -StorageSubSystem $subsystem_name | Select-Object StorageNode, PhysicalLocation, HealthStatus, OperationalStatus, Description, Action, Usage, CanPool, CannotPoolReason, SerialNumber, Model, MediaType, CapacityGB

As seções a seguir descrevem os Estados de integridade em que uma unidade pode estar:

Estado de integridade da unidade: íntegro

Estado operacional Description
OK O volume está íntegro.
Em serviço A unidade está fazendo algumas operações internas de manutenção. Quando a ação for concluída, a unidade deverá retornar ao estado de integridade OK.

Estado de integridade da unidade: aviso

Uma unidade no estado de aviso pode ler e gravar dados com êxito, mas tem um problema.

Estado operacional Description
Comunicação perdida A conectividade foi perdida na unidade.

Ação: Coloque todos os servidores online novamente. Se isso não corrigir, reconecte a unidade. Se esse estado persistir, substitua a unidade para garantir a resiliência completa.
Falha preditiva Uma falha da unidade é prevista para ocorrer em breve.

Ação: Substitua a unidade assim que possível para garantir a resiliência completa.
Erro de e/s Ocorreu um erro temporário ao acessar a unidade.

Ação: Se esse estado persistir, substitua a unidade para garantir a resiliência completa.
Erro transitório Ocorreu um erro temporário com a unidade. esse erro normalmente significa que a unidade não estava respondendo, mas também pode significar que a partição de proteção direta do Espaços de Armazenamento foi removida incorretamente da unidade.

Ação: Se esse estado persistir, substitua a unidade para garantir a resiliência completa.
Latência anormal Às vezes, a unidade não responde e está mostrando sinais de falha.

Ação: Se esse estado persistir, substitua a unidade para garantir a resiliência completa.
Removendo do pool Azure Stack Hub está no processo de remover a unidade de seu pool de armazenamento.

Ação: Aguarde até que Azure Stack Hub termine de remover a unidade e verifique o status posteriormente.
Se o status permanecer, contate o suporte. Antes de fazer isso, inicie o processo de coleta do arquivo de log usando as diretrizes de https://aka.ms/azurestacklogfiles .
Iniciando o modo de manutenção Azure Stack Hub está no processo de colocar a unidade no modo de manutenção. Esse estado é temporário--a unidade deve estar em breve no estado do modo de manutenção.

Ação: Aguarde até que Azure Stack Hub conclua o processo e verifique o status posteriormente.
No modo de manutenção A unidade está no modo de manutenção, interrompendo leituras e gravações da unidade. Esse estado geralmente significa Azure Stack tarefas de administração de Hub, como PNU ou FRU, estão operando a unidade. Mas o administrador também pode posicionar a unidade no modo de manutenção.

Ação: Aguarde até Hub Azure Stack Hub concluir a tarefa de administração e verifique o status posteriormente.
Se o status permanecer, contate o suporte. Antes de fazer isso, inicie o processo de coleta do arquivo de log usando as diretrizes de https://aka.ms/azurestacklogfiles .
Parando o modo de manutenção Azure Stack Hub está no processo de colocar a unidade novamente online. Esse estado é temporário-a unidade deve estar em breve em outro Estado, idealmente íntegro.

Ação: Aguarde até que Azure Stack Hub conclua o processo e verifique o status posteriormente.

Estado de integridade da unidade: não íntegro

Uma unidade no estado não íntegro não pode ser gravada ou acessada no momento.

Estado operacional Description
Divisão A unidade se tornou separada do pool.

Ação: Substitua a unidade por um novo disco. Se você precisar usar esse disco, remova o disco do sistema, verifique se não há dados úteis no disco, apague o disco e recoloque o disco.
Não utilizável O disco físico está em quarentena porque não tem suporte do fornecedor da solução. Somente os discos que são aprovados para a solução e têm o firmware de disco correto têm suporte.

Ação: Substitua a unidade por um disco que tenha um fabricante e um número de modelo aprovados para a solução.
Metadados obsoletos O disco de substituição foi usado anteriormente e pode conter dados de um sistema de armazenamento desconhecido. O disco está em quarentena.

Ação: Substitua a unidade por um novo disco. Se você precisar usar esse disco, remova o disco do sistema, verifique se não há dados úteis no disco, apague o disco e recoloque o disco.
Metadados não reconhecidos Metadados não reconhecidos encontrados na unidade, o que geralmente significa que a unidade tem metadados de um pool diferente.

Ação: Substitua a unidade por um novo disco. Se você precisar usar esse disco, remova o disco do sistema, verifique se não há dados úteis no disco, apague o disco e recoloque o disco.
Mídia com falha a unidade falhou e não será mais usada pelo Espaços de Armazenamento.

Ação: Substitua a unidade assim que possível para garantir a resiliência completa.
Falha de hardware do dispositivo Houve uma falha de hardware nesta unidade.

Ação: Substitua a unidade assim que possível para garantir a resiliência completa.
Atualização do firmware O Hub de Azure Stack está atualizando o firmware na unidade. Esse estado é temporário e geralmente dura menos de um minuto e, durante o qual o tempo em que outras unidades no pool lidam com todas as leituras e gravações.

Ação: Aguarde até que o Hub de Azure Stack conclua a atualização e verifique o status posteriormente.
Iniciando A unidade está se preparando para a operação. Esse Estado deve ser temporário, uma vez concluído, a unidade deve fazer a transição para um estado operacional diferente.

Ação: Aguarde até que o Hub de Azure Stack conclua a operação e verifique o status posteriormente.

Motivos pelos quais uma unidade não pode ser agrupada

Algumas unidades não estão prontas para serem no pool de armazenamento de Azure Stack Hub. Você pode descobrir por que uma unidade não está qualificada para pooling examinando a CannotPoolReason propriedade de uma unidade. A tabela a seguir fornece um pouco mais de detalhes sobre cada um dos motivos.

Motivo Descrição
Hardware incompatível a unidade não está na lista de modelos de armazenamento aprovados especificados usando o Serviço de Integridade.

Ação: Substitua a unidade por um novo disco.
Firmware não compatível o firmware na unidade física não está na lista de revisões de firmware aprovadas usando o Serviço de Integridade.

Ação: Substitua a unidade por um novo disco.
Em uso pelo cluster A unidade é usada atualmente por um cluster de failover.

Ação: Substitua a unidade por um novo disco.
Mídia removível A unidade é classificada como uma unidade removível.

Ação: Substitua a unidade por um novo disco.
Não íntegro A unidade não está em um estado íntegro e talvez precise ser substituída.

Ação: Substitua a unidade por um novo disco.
Capacidade insuficiente Há partições que ocupam espaço livre na unidade.

Ação: Substitua a unidade por um novo disco. Se você precisar usar esse disco, remova o disco do sistema, verifique se não há dados úteis no disco, apague o disco e recoloque o disco.
Verificação em andamento a Serviço de Integridade está verificando se a unidade ou o firmware na unidade foi aprovado para uso.

Ação: Aguarde até que o Hub de Azure Stack conclua o processo e verifique o status posteriormente.
Falha na verificação o Serviço de Integridade não pôde verificar se a unidade ou o firmware na unidade foi aprovado para uso.

Ação: Contate o suporte. Antes de fazer isso, inicie o processo de coleta do arquivo de log usando as diretrizes de https://aka.ms/azurestacklogfiles .
Offline A unidade está offline.

Ação: Contate o suporte. Antes de fazer isso, inicie o processo de coleta do arquivo de log usando as diretrizes de https://aka.ms/azurestacklogfiles .