Partilhar via


Monitorizar um único cluster do Azure Stack HCI, versão 23H2 com o Insights

Aplica-se a: Azure Stack HCI, versão 23H2

Este artigo descreve como utilizar o Insights para monitorizar um único cluster do Azure Stack HCI. Para vários clusters do Azure Stack HCI, veja Monitorizar vários clusters do Azure Stack HCI com o Insights.

As informações são uma funcionalidade do Azure Monitor que o faz começar rapidamente a monitorizar o cluster do Azure Stack HCI. Pode ver as principais informações de métricas, estado de funcionamento e utilização relativas ao cluster, servidores, máquinas virtuais e armazenamento.

Dedique alguns momentos para watch instruções de vídeo sobre o Insights para o Azure Stack HCI:

Benefícios

As informações do Azure Stack HCI oferecem os seguintes benefícios:

  • Gerido pelo Azure. As informações são geridas pelo Azure e acedidas através do portal do Azure, garantindo que estão sempre atualizadas. Não é necessário configurar a base de dados ou software especial.

  • Escalabilidade. As informações são capazes de carregar mais de 400 conjuntos de informações de cluster em várias subscrições em simultâneo. Não existem limitações no cluster, domínio ou localização física.

  • Personalização. A experiência do Insight baseia-se nos modelos de livros do Azure Monitor. Isto permite-lhe alterar as vistas e as consultas, modificar ou definir limiares que se alinham com os seus limites específicos e, em seguida, guardar estas personalizações num livro. Em seguida, pode afixar gráficos nos livros aos dashboards do Azure.

Pré-requisitos

Eis os pré-requisitos da utilização do Insights para o Azure Stack HCI:

  • Tem de ter acesso a um cluster do Azure Stack HCI implementado e registado.

  • A identidade gerida do recurso do Azure tem de estar ativada. Para obter mais informações, veja Gestão avançada ativada.

Ativar Informações

Ativar o Insights ajuda-o a monitorizar todos os clusters do Azure Stack HCI atualmente associados à área de trabalho do Log Analytics ao fornecer métricas de estado de funcionamento úteis. As informações instalam o Agente do Azure Monitor e ajudam-no a configurar regras de recolha de dados (DCRs) para monitorizar o cluster do Azure Stack HCI.

Siga estes passos para ativar o Insights a partir do portal do Azure:

  1. Na portal do Azure, navegue até à página de recursos do cluster do Azure Stack HCI e, em seguida, selecione o cluster. No separador Capacidades , selecione Informações.

    Captura de ecrã a mostrar o mosaico Informações.

  2. Na página Informações , selecione Introdução.

    Captura de ecrã a mostrar o botão Introdução.

  3. Na página Configuração do Insights , selecione um DCR existente na lista pendente Regra de recolha de dados . O DCR especifica os registos de eventos e os contadores de desempenho que precisam de ser recolhidos e armazena-os numa área de trabalho do Log Analytics. As informações criam um DCR predefinido se ainda não existir. Só estão incluídos os DCRs que estão ativados para o Insights.

    Captura de ecrã a mostrar a janela de configuração do Insights.

  4. (Opcional) Também pode criar um novo DCR ao selecionar Create Novo na página de configuração do Insights.

    Importante

    Recomendamos vivamente que não crie o seu próprio DCR. O DCR criado pelo Insights inclui um fluxo de dados especial necessário para a operação. Pode editar este DCR para recolher mais dados, como eventos do Windows e do Syslog. Os DCRs criados através da instalação AMA terão um prefixo AzureStackHCI- anexado com o nome DCR.

    1. Na página Nova regra de recolha de dados , especifique a subscrição, o nome DCR e o nome do ponto final de recolha de dados (DCE). Os DCEs são utilizados para aceder ao serviço de configuração para obter DCRs associados para o Agente do Azure Monitor. Para obter mais informações sobre a DCE, veja Pontos finais de recolha de dados no Azure Monitor.

      Nota

      Se estiver a utilizar ligações privadas no agente, tem de adicionar DCEs. Para obter mais informações sobre as definições de rede AMA, veja Definir definições de rede do Agente do Azure Monitor.

      Captura de ecrã a mostrar a janela da regra de recolha de dados.

    2. Selecione o botão Rever + criar.

      Se um DCR ainda não estiver criado para o cluster não monitorizado, é criado um com contadores de desempenho ativados e o canal de registo de eventos do Windows ativado.

  5. Reveja o ecrã final com um resumo do nome DCR, número de registos de eventos, contadores de desempenho e nome da área de trabalho do Log Analytics na qual os dados são armazenados. Selecione Configurar.

    Captura de ecrã a mostrar o seletor pendente da regra de recolha de dados.

    Depois de selecionar Configurar, é redirecionado para a página Extensões , onde pode ver o estado da instalação do agente. Ao configurar o Insights, o AMA é instalado automaticamente em todos os nós do cluster.

  6. Aceda à página de recursos do cluster do Azure Stack HCI e, em seguida, selecione o cluster. As informações são agora apresentadas como Configuradas no separador Capacidades :

    Captura de ecrã a mostrar o mosaico Informações como Configurado.

Regras da recolha de dados

Quando ativa as Informações num computador com o Agente do Azure Monitor, tem de especificar um DCR para utilizar. Para obter mais informações sobre DCRs, veja Regras de recolha de dados no Azure Monitor.

Opção Descrição
Contadores de Desempenho Especifica os contadores de desempenho de dados a recolher do sistema operativo. Esta opção é necessária para todos os computadores. Estes contadores de desempenho são utilizados para preencher as visualizações no livro do Insights. Atualmente, o livro do Insights utiliza cinco contadores de desempenho - Memory()\Available Bytes, Network Interface()\Bytes Total/sec, Processor(_Total)\% Processor Time, RDMA Activity()\RDMA Inbound Bytes/sece RDMA Activity()\RDMA Outbound Bytes/sec
Canal de Registo de Eventos Especifica os registos de eventos do Windows a recolher do sistema operativo. Esta opção é necessária para todos os computadores. Os registos de eventos do Windows são utilizados para preencher as visualizações no livro do Insights. Atualmente, os dados são recolhidos através de dois canais de registo de eventos do Windows: - microsoft-windows-health/operational e microsoft-windows-sddc-management/operational
Área de trabalho do Log Analytics Área de trabalho para armazenar os dados. Só estão listadas áreas de trabalho com Informações.

Canal de eventos

O Microsoft-windows-sddc-management/operational e Microsoft-windows-health/operational o canal de eventos do Windows são adicionados à sua área de trabalho do Log Analytics em registos de eventos do Windows.

Captura de ecrã a mostrar a janela Adicionar origem de dados.

Ao recolher estes registos, o Insights mostra o estado de funcionamento dos servidores, unidades, volumes e VMs individuais. Por predefinição, são adicionados cinco contadores de desempenho.

Contadores de desempenho

Por predefinição, são adicionados cinco contadores de desempenho:

Captura de ecrã a mostrar os contadores de desempenho adicionados.

A tabela seguinte descreve os contadores de desempenho que são monitorizados:

Contadores de desempenho Description
Memória(*)\Bytes Disponíveis Bytes Disponíveis é a quantidade de memória física, em bytes, imediatamente disponível para alocação a um processo ou para utilização do sistema.
Interface de Rede(*)\Bytes Total/seg A velocidade a que os bytes são enviados e recebidos através de cada placa de rede, incluindo carateres de enquadramento. Bytes Total/seg é uma soma de Bytes Recebidos/seg e Bytes Enviados/seg.
Processor(_Total)% Tempo do processador A percentagem de tempo decorrido que todos os threads de processo utilizaram o processador para executar instruções.
Atividade RDMA(*)\Bytes de Entrada RDMA/seg Taxa de dados recebidos através de RDMA pela placa de rede por segundo.
Atividade RDMA(*)\Bytes de Saída RDMA/seg Taxa de dados enviados através de RDMA pela placa de rede por segundo.

Depois de ativar o Insights, pode demorar até 15 minutos a recolher os dados. Quando o processo estiver concluído, poderá ver uma visualização avançada do estado de funcionamento do cluster a partir do menu Informações no painel esquerdo:

Captura de ecrã a mostrar as visualizações do Insight.

Desativar Informações

Para desativar o Insights, siga estes passos:

  1. Selecione Informações no separador Capacidades .

  2. Selecione Desativar Informações.

    Captura de ecrã a mostrar a janela Desativar Informações.

Quando desativa a funcionalidade Informações, a associação entre a regra de recolha de dados e o cluster é eliminada e os registos do Serviço de Estado de Funcionamento e da Gestão do SDDC já não são recolhidos; no entanto, os dados existentes não são eliminados. Se quiser eliminar esses dados, aceda à área de trabalho do DCR e do Log Analytics e elimine os dados manualmente.

Atualizar Informações

O mosaico Informações mostra uma mensagem Precisa de atualização nos seguintes casos:

  • Uma regra de recolha de dados é alterada.
  • Um evento de estado de funcionamento do registo de eventos do Windows é eliminado.
  • Qualquer um dos cinco contadores de desempenho da área de trabalho do Log Analytics é eliminado.

Para ativar novamente o Insights, siga estes passos:

  1. Selecione o mosaico Informações emCapacidades.

  2. Selecione Atualizar para ver as visualizações novamente.

    Captura de ecrã a mostrar a janela Atualizar Informações.

Resolução de problemas

Esta secção fornece orientações para resolver os problemas com a utilização do Insights para o Azure Stack HCI.

Resolver problemas da página Livros em branco sem dados preenchidos

Problema. Verá uma página de Livros em branco sem dados preenchidos, conforme mostrado na seguinte captura de ecrã:

Captura de ecrã a mostrar uma página de Livros em branco.

Causas possíveis. Podem existir várias causas para este problema, como a configuração recente do Insights ou a configuração incorreta do DCR associado.

Solução. Para resolver o problema, execute os seguintes passos em sequência:

  1. Se tiver configurado recentemente o Insights, aguarde até uma hora para que o AMA recolha dados.
  2. Verifique a configuração do DCR associado. Confirme que os canais de eventos e os contadores de desempenho são adicionados como origens de dados ao DCR associado, conforme descrito na secção Regras de Recolha de Dados .
  3. Se o problema persistir após efetuar os passos acima e ainda não vir dados, contacte o suporte ao cliente para obter assistência.

Para obter orientações de resolução de problemas mais detalhadas, veja Orientações de resolução de problemas para o Agente do Azure Monitor.

Visualizações de informações

Assim que o Insights estiver ativado, as tabelas seguintes fornecem detalhes sobre todos os recursos.

Saúde

Fornece falhas de estado de funcionamento num cluster.

Metric Descrição Unidade Exemplo
Falha Uma breve descrição das falhas de estado de funcionamento. Ao clicar na ligação, é aberto um painel lateral com mais informações. Sem unidade PoolCapacityThresholdExceeded
Tipo de recurso com falhas O tipo de recurso que encontrou uma falha. Sem unidade StoragePool
ID do recurso com falhas ID exclusivo do recurso que encontrou uma falha de estado de funcionamento. ID Único {1245340c-780b-4afc-af3c-f9bdc4b12f8a}: SP:{c57f23d1-d784-4a42-8b59-4edd8e70e830}
Gravidade A gravidade da falha pode ser um aviso ou crítico. Sem unidade Aviso
Hora da falha inicial Carimbo de data/hora de quando o servidor foi atualizado pela última vez. Datetime 09/04/2022, 12:15:42

Servidor

Metric Descrição Unidade Exemplo
Servidores Os nomes dos servidores no cluster. Sem unidade VM-1
Última atualização A data e hora da última atualização do servidor. Datetime 09/04/2022, 12:15:42
Estado O estado de funcionamento dos recursos do servidor no cluster. Pode estar em bom estado de funcionamento, aviso, crítico e outro Bom estado de funcionamento
Utilização da CPU A % de tempo em que o processo utilizou a CPU. Percentagem 56%
Utilização de memória A utilização da memória do processo do servidor é igual ao processo de contador\Bytes Privados, além do tamanho dos dados mapeados pela memória. Percentagem 16%
Processadores lógicos O número de processadores lógicos. de palavras 2
CPUs O número de CPUs. de palavras 2
Tempo de atividade O tempo durante o qual um computador, especialmente um computador, está em funcionamento. Timespan 2.609 horas.
Site O nome do site ao qual o servidor pertence. Nome do site SiteA
Nome de domínio O domínio local ao qual o servidor pertence. Sem unidade Contoso.local

Máquinas virtuais

Fornece o estado de todas as máquinas virtuais no cluster. Uma VM pode estar num dos seguintes estados: Em Execução, Parada, Falhada ou Outra (Desconhecido, Inicial, Instantâneo, Guardar, Parar, Colocar em Pausa, Retomar, Em Pausa, Suspenso).

Metric Descrição Unidade Exemplo
Servidores O nome do servidor. Sem unidade Sample-VM-1
Última Actualização Isto dá a data e hora de quando o servidor foi atualizado pela última vez Datetime 09/04/2022, 12:24:02
Total VMs O número de VMs num nó de servidor. de palavras 0 de 0 em execução
Em Execução O número de VMs em execução num nó de servidor. de palavras 2
Parada O número de VMs paradas num nó de servidor. de palavras 3
Com falhas O número de VMs falhou num nó de servidor. de palavras 2
Outro Se a VM estiver num dos seguintes estados (Desconhecido, Início, Instantâneo, Guardar, Parar, Pausar, Retomar, Suspenso), é considerado como "Outro". de palavras 2

Armazenamento

A tabela seguinte fornece o estado de funcionamento dos volumes e unidades no cluster:

Metric Descrição Unidade Exemplo
Volumes O nome do volume Sem unidade ClusterPerformanceHistory
Última atualização A data e hora da última atualização do armazenamento. Datetime 14/04/2022, 14:58:55
Estado O estado do volume. Bom estado de funcionamento, aviso, crítico e outros. Bom estado de funcionamento
Capacidade total A capacidade total do dispositivo em bytes durante o período de relatórios. Bytes 2,5 GB
Capacidade disponível A capacidade disponível em bytes durante o período de relatórios. Bytes 20B
Iops Operações de entrada/saída por segundo. Por segundo 45/s
Débito Número de bytes por segundo que o Gateway de Aplicação tem servido. Bytes por segundo 5B/s
Latência O tempo que o pedido de E/S demora a ser concluído. Second 0,0016 s
Resiliência A capacidade de recuperação de falhas. Maximiza a disponibilidade dos dados. Sem unidade Espelho de Três Vias
Eliminação de duplicados O processo de redução do número físico de bytes de dados que têm de ser armazenados no disco. Disponível ou não Sim/Não
Sistema de ficheiros O tipo de sistema de ficheiros. Sem unidade ReFS

Preços do Azure Monitor

Quando ativa a visualização de monitorização, os registos são recolhidos a partir de:

  • Gestão do Estado de Funcionamento (Microsoft-windows-health/operacional).
  • Gestão SDDC (Microsoft-Windows-SDDC-Management/Operacional; ID do Evento: 3000, 3001, 3002, 3003, 3004).

É faturado com base na quantidade de dados ingeridos e nas definições de retenção de dados da área de trabalho do Log Analytics.

O Azure Monitor tem preços pay as you go e os primeiros 5 GB por conta de faturação por mês são gratuitos. Uma vez que os preços podem variar devido a vários fatores, como a região do Azure que está a utilizar, visite a calculadora de preços do Azure Monitor para obter os cálculos de preços mais atualizados.

Passos seguintes