Monitorar um único cluster do Azure Stack HCI, versão 23H2 com o Insights

Aplica-se a: Azure Stack HCI, versão 23H2

Este artigo descreve como usar o Insights para monitorar um único cluster do Azure Stack HCI. Para vários clusters do Azure Stack HCI, consulte Monitorar vários clusters do Azure Stack HCI com o Insights.

O Insights é um recurso do Azure Monitor que rapidamente faz com que você comece a monitorar o cluster do Azure Stack HCI. Você pode exibir as principais métricas, integridade e informações de uso sobre cluster, servidores, máquinas virtuais e armazenamento.

Reserve alguns instantes para watch o passo a passo do vídeo no Insights para o Azure Stack HCI:

Benefícios

O Insights para Azure Stack HCI oferece os seguintes benefícios:

  • Gerenciado pelo Azure. O Insights é gerenciado pelo Azure e acessado por meio do portal do Azure, garantindo que ele esteja sempre atualizado. Não há necessidade de configuração de banco de dados ou software especial.

  • Escalabilidade. O Insights é capaz de carregar mais de 400 conjuntos de informações de cluster em várias assinaturas simultaneamente. Não há limitações no cluster, domínio ou local físico.

  • Capacidade de personalização. A experiência do Insight é criada com base em modelos de pasta de trabalho do Azure Monitor. Isso permite que você altere as exibições e consultas, modifique ou defina limites que se alinham com seus limites específicos e salve essas personalizações em uma pasta de trabalho. Em seguida, você pode fixar gráficos nas pastas de trabalho nos painéis do Azure.

Pré-requisitos

Aqui estão os pré-requisitos do uso do Insights para o Azure Stack HCI:

  • Você deve ter acesso a um cluster do Azure Stack HCI implantado e registrado.

  • A identidade gerenciada para o recurso do Azure deve ser habilitada. Para obter mais informações, consulte Gerenciamento aprimorado habilitado.

Habilitar Insights

Habilitar o Insights ajuda a monitorar todos os clusters do Azure Stack HCI atualmente associados ao workspace do Log Analytics fornecendo métricas úteis de integridade. O Insights instala o Agente do Azure Monitor e ajuda você a configurar DCRs (regras de coleta de dados) para monitorar o cluster do Azure Stack HCI.

Siga estas etapas para habilitar o Insights do portal do Azure:

  1. No portal do Azure, navegue até a página de recursos de cluster do Azure Stack HCI e selecione o cluster. Na guia Funcionalidades , selecione Insights.

    Captura de tela mostrando o bloco Insights.

  2. Na página Insights , selecione Introdução.

    Captura de tela mostrando o botão Introdução.

  3. Na página Configuração do Insights , selecione um DCR existente na lista suspensa Regra de coleta de dados . O DCR especifica os logs de eventos e os contadores de desempenho que precisam ser coletados e os armazena em um workspace do Log Analytics. O Insights criará um DCR padrão se ainda não existir. Somente os DCRs habilitados para Insights estão incluídos.

    Captura de tela mostrando a janela de configuração do Insights.

  4. (Opcional) Você também pode criar um novo DCR selecionando Create Novo na página de configuração do Insights.

    Importante

    É altamente recomendável que você não crie seu próprio DCR. O DCR criado pelo Insights inclui um fluxo de dados especial necessário para sua operação. Você pode editar esse DCR para coletar mais dados, como eventos do Windows e do Syslog. Os DCRs criados por meio da instalação do AMA terão um prefixo AzureStackHCI- anexado com o nome DCR.

    1. Na página Nova regra de coleta de dados , especifique a assinatura, o nome dcr e o nome do ponto de extremidade de coleta de dados (DCE). Os DCEs são usados para acessar o serviço de configuração para buscar DCRs associadas para o Agente do Azure Monitor. Para obter mais informações sobre o DCE, consulte Pontos de extremidade de coleta de dados no Azure Monitor.

      Observação

      Se você estiver usando links privados no agente, deverá adicionar DCEs. Para obter mais informações sobre as configurações de rede ama, consulte Definir configurações de rede do Agente do Azure Monitor.

      Captura de tela mostrando a janela de regra de coleta de dados.

    2. Selecione o botão Revisar + criar.

      Se um DCR ainda não estiver criado para o cluster não monitorado, um será criado com contadores de desempenho habilitados e o canal de log de eventos do Windows habilitado.

  5. Examine a tela final com um resumo do nome dcr, número de logs de eventos, contadores de desempenho e nome do workspace do Log Analytics no qual os dados são armazenados. Selecione Configurar.

    Captura de tela mostrando o seletor suspenso da regra de coleta de dados.

    Depois de selecionar Configurar, você será redirecionado para a página Extensões, na qual poderá ver o status da instalação do agente. Ao configurar o Insights, o AMA é instalado automaticamente em todos os nós do cluster.

  6. Vá para a página de recursos de cluster do Azure Stack HCI e selecione o cluster. Os insights agora são mostrados como Configurados na guia Funcionalidades :

    Captura de tela mostrando o bloco Insights como Configurado.

Regras de coleta de dados

Ao habilitar o Insights em um computador com o Agente do Azure Monitor, você deve especificar um DCR a ser usado. Para obter mais informações sobre DCRs, consulte Regras de coleta de dados no Azure Monitor.

Opção Descrição
Contadores de desempenho Especifica quais contadores de desempenho de dados coletar do sistema operacional. Essa opção é necessária para todos os computadores. Esses contadores de desempenho são usados para preencher as visualizações na pasta de trabalho insights. Atualmente, a pasta de trabalho insights usa cinco contadores de desempenho - Memory()\Available Bytes, Network Interface()\Bytes Total/sec, , Processor(_Total)\% Processor Time, RDMA Activity()\RDMA Inbound Bytes/sece RDMA Activity()\RDMA Outbound Bytes/sec
Canal de Log de Eventos Especifica quais logs de eventos do Windows coletar do sistema operacional. Essa opção é necessária para todos os computadores. Os logs de eventos do Windows são usados para preencher as visualizações na pasta de trabalho insights. Atualmente, os dados são coletados por meio de dois canais de log de eventos do Windows: - microsoft-windows-health/operational e microsoft-windows-sddc-management/operational
Espaço de trabalho do Log Analytics Espaço de trabalho para armazenar os dados. Somente workspaces com Insights são listados.

Canal de evento

O Microsoft-windows-sddc-management/operational canal de eventos do Windows e Microsoft-windows-health/operational é adicionado ao workspace do Log Analytics em logs de eventos do Windows.

Captura de tela mostrando a janela Adicionar fonte de dados.

Ao coletar esses logs, o Insights mostra a status de integridade dos servidores, unidades, volumes e VMs individuais. Por padrão, cinco contadores de desempenho são adicionados.

Contadores de desempenho

Por padrão, cinco contadores de desempenho são adicionados:

Captura de tela mostrando os contadores de desempenho adicionados.

A tabela a seguir descreve os contadores de desempenho monitorados:

Contadores de desempenho Descrição
Memória(*)\Bytes disponíveis Bytes disponíveis é a quantidade de memória física, em bytes, imediatamente disponível para alocação para um processo ou para uso do sistema.
Interface de rede(*)\Bytes Total/s A taxa na qual os bytes são enviados e recebidos em cada adaptador de rede, incluindo caracteres de enquadramento. Bytes Total/s é uma soma de Bytes Recebidos/s e Bytes Enviados/s.
Tempo do processador(_Total)% do processador A porcentagem de tempo decorrido que todos os threads de processo usaram o processador para executar instruções.
Atividade RDMA(*)\Bytes de Entrada rdma/s Taxa de dados recebidos por RDMA pelo adaptador de rede por segundo.
Atividade rdma(*)\Bytes de saída rdma/s Taxa de dados enviados por RDMA pelo adaptador de rede por segundo.

Depois de habilitar o Insights, pode levar até 15 minutos para coletar os dados. Quando o processo for concluído, você poderá ver uma visualização avançada da integridade do cluster no menu Insights no painel esquerdo:

Captura de tela mostrando visualizações do Insight.

Desabilitar Insights

Para desabilitar o Insights, siga estas etapas:

  1. Selecione Insights na guia Funcionalidades .

  2. Selecione Desabilitar Insights.

    Captura de tela mostrando a janela Desabilitar Insights.

Quando você desabilitar o recurso Insights, a associação entre a regra de coleta de dados e o cluster é excluída e os logs de Gerenciamento do Serviço de Integridade e do SDDC não são mais coletados; no entanto, os dados existentes não são excluídos. Se você quiser excluir esses dados, vá para o workspace dcr e log analytics e exclua os dados manualmente.

Atualizar Insights

O bloco Insights mostra uma mensagem de Atualização de necessidades nos seguintes casos:

  • Uma regra de coleta de dados é alterada.
  • Um evento de integridade do log de eventos do Windows é excluído.
  • Qualquer um dos cinco contadores de desempenho do workspace do Log Analytics é excluído.

Para habilitar o Insights novamente, siga estas etapas:

  1. Selecione o bloco Insights em Funcionalidades.

  2. Selecione Atualizar para ver as visualizações novamente.

    Captura de tela mostrando a janela Atualizar Insights.

Solucionar problemas

Esta seção fornece diretrizes para resolver os problemas com o uso do Insights para o Azure Stack HCI.

Solucionar problemas de página pastas de trabalho em branco sem dados preenchidos

Questão. Você verá uma página pastas de trabalho em branco sem dados preenchidos, conforme mostrado na captura de tela a seguir:

Captura de tela de uma página pastas de trabalho em branco.

Possíveis causas. Pode haver várias causas para esse problema, como a configuração recente do Insights ou a configuração inadequada do DCR associado.

Solução. Para solucionar o problema, execute as seguintes etapas em sequência:

  1. Se você configurou recentemente o Insights, aguarde até uma hora para que o AMA colete dados.
  2. Verifique a configuração do DCR associado. Verifique se os canais de eventos e os contadores de desempenho são adicionados como fontes de dados ao DCR associado, conforme descrito na seção Regras de Coleta de Dados .
  3. Se o problema persistir depois de executar as etapas acima e você ainda não vir nenhum dado, entre em contato com o suporte ao cliente para obter assistência.

Para obter diretrizes mais detalhadas de solução de problemas, consulte Diretrizes de solução de problemas para o Agente do Azure Monitor.

Visualizações de insights

Depois que o Insights estiver habilitado, as tabelas a seguir fornecerão detalhes sobre todos os recursos.

Saúde

Fornece falhas de integridade em um cluster.

Métrica Descrição Unidade Exemplo
Falha Uma breve descrição das falhas de integridade. Ao clicar no link, um painel lateral é aberto com mais informações. Nenhuma unidade PoolCapacityThresholdExceeded
Tipo de recurso com falha O tipo de recurso que encontrou uma falha. Nenhuma unidade StoragePool
ID do recurso com falha ID exclusiva para o recurso que encontrou uma falha de integridade. ID Exclusiva {1245340c-780b-4afc-af3c-f9bdc4b12f8a}: SP:{c57f23d1-d784-4a42-8b59-4edd8e70e830}
Severidade A gravidade da falha pode ser de aviso ou crítica. Nenhuma unidade Aviso
Tempo de falha inicial Carimbo de data/hora de quando o servidor foi atualizado pela última vez. Datetime 9/04/2022, 12:15:42 PM

Servidor

Métrica Descrição Unidade Exemplo
Servidores Os nomes dos servidores no cluster. Nenhuma unidade VM-1
Última atualização A data e a hora de quando o servidor foi atualizado pela última vez. Datetime 9/04/2022, 12:15:42 PM
Status A integridade dos recursos do servidor no cluster. Pode ser íntegro, aviso, crítico e outros Íntegros
Uso da CPU A % de tempo em que o processo usou a CPU. Porcentagem 56%
Uso de memória O uso de memória do processo do servidor é igual ao contador Process\Private Bytes, além do tamanho dos dados mapeados na memória. Porcentagem 16%
Processadores lógicos O número de processadores lógicos. Contagem 2
CPUs O número de CPUs. Contagem 2
Tempo de atividade O tempo durante o qual um computador, especialmente um computador, está em operação. Timespan 2.609 horas.
Site O nome do site ao qual o servidor pertence. Nome do site SiteA
Nome de domínio O domínio local ao qual o servidor pertence. Nenhuma unidade Contoso.local

Máquinas virtuais

Fornece o estado de todas as máquinas virtuais no cluster. Uma VM pode estar em um dos seguintes estados: Executando, Parado, Com Falha ou Outro (Desconhecido, Iniciando, Captura de Instantâneo, Salvando, Parando, Pausando, Retomando, Pausado, Suspenso).

Métrica Descrição Unidade Exemplo
Servidores O nome do servidor. Nenhuma unidade Amostra-VM-1
Última Atualização Isso fornece a data e a hora de quando o servidor foi atualizado pela última vez Datetime 9/04/2022, 12:24:02 PM
Total de VMs O número de VMs em um nó de servidor. Contagem 0 de 0 em execução
Executando O número de VMs em execução em um nó de servidor. Contagem 2
Parado O número de VMs interrompidas em um nó de servidor. Contagem 3
Com falha O número de VMs falhou em um nó de servidor. Contagem 2
Outro Se a VM estiver em um dos seguintes estados (Desconhecido, Iniciando, Instantâneo, Salvando, Parando, Pausando, Retomando, Pausado, Suspenso), ele será considerado como "Outro". Contagem 2

Armazenamento

A tabela a seguir fornece a integridade de volumes e unidades no cluster:

Métrica Descrição Unidade Exemplo
Volumes O nome do volume Nenhuma unidade ClusterPerformanceHistory
Última atualização A data e a hora de quando o armazenamento foi atualizado pela última vez. Datetime 14/04/2022, 14h58h55
Status O status do volume. Íntegro, aviso, crítico e outros. Íntegros
Capacidade total A capacidade total do dispositivo em bytes durante o período do relatório. Bytes 2,5 GB
Capacidade disponível A capacidade disponível em bytes durante o período de relatório. Bytes 20B
Iops Operações de entrada/saída por segundo. Por segundo 45/s
Produtividade Número de bytes por segundo atendidos pelo Gateway de Aplicativo. Bytes por segundo 5B/s
Latency O tempo necessário para que a solicitação de E/S seja concluída. Segundo 0,0016 s
Resiliência A capacidade de recuperação de falhas. Maximiza a disponibilidade de dados. Nenhuma unidade Espelho de Três Vias
Eliminação de duplicação O processo de redução do número físico de bytes de dados que precisam ser armazenados em disco. Disponível ou não Sim/Não
Sistema de arquivos O tipo de sistema de arquivos. Nenhuma unidade ReFS

Preços do Azure Monitor

Quando você habilita a visualização de monitoramento, os logs são coletados de:

  • Gerenciamento de Integridade (Microsoft-windows-health/operational).
  • Gerenciamento do SDDC (Microsoft-Windows-SDDC-Management/Operational; ID do evento: 3000, 3001, 3002, 3003, 3004).

Você é cobrado com base na quantidade de dados ingeridos e nas configurações de retenção de dados do workspace do Log Analytics.

O Azure Monitor tem preços de pagamento conforme o uso e os primeiros 5 GB por conta de cobrança por mês são gratuitos. Como os preços podem variar devido a vários fatores, como a região do Azure que você está usando, visite a calculadora de preços do Azure Monitor para obter os cálculos de preços mais atualizados.

Próximas etapas