Solução de Integridade do Agente no Azure Monitor

A solução Integridade do Agente no Azure ajuda você a entender quais agentes de monitoramento não estão respondendo e quais estão enviando dados operacionais. Isso inclui todos os agentes que se reportam diretamente ao workspace do Log Analytics no Azure Monitor ou a um grupo de gerenciamento do System Center Operations Manager conectado ao Azure Monitor.

Você também pode usar a solução Integridade do Agente para:

  • Controlar quantos agentes estão implantados e onde eles estão distribuídos geograficamente.
  • Executar outras consultas para conhecer a distribuição dos agentes implantados no Azure, em outros ambientes de nuvem ou localmente.

Pré-requisitos

Antes de implantar essa solução, confirme se você tem agentes do Windows com suporte que se reportam para o workspace do Log Analytics ou para um grupo de gerenciamento do Operations Manager integrado ao seu workspace.

Pacotes de gerenciamento

Se o grupo de gerenciamento do Operations Manager estiver conectado a um workspace do Log Analytics, os pacotes de gerenciamento a seguir serão instalados no Operations Manager. Esses pacotes de gerenciamento também são instalados em computadores com Windows conectados diretamente após você adicionar a solução.

  • Pacote de inteligência do Microsoft System Center Advisor HealthAssessment Direct (Microsoft.IntelligencePacks.HealthAssessmentDirect)
  • Pacote de inteligência do Microsoft System Center Advisor HealthAssessment Server Channel (Microsoft.IntelligencePacks.HealthAssessmentViaServer).

Não há nada a ser configurado nem gerenciado com esses pacotes de gerenciamento. Para obter mais informações sobre como os pacotes de gerenciamento da solução são atualizados, veja Conectar o Operations Manager ao Log Analytics.

Configuração

Adicione a solução Integridade do Agente ao seu workspace do Log Analytics usando o processo descrito em Adicionar soluções. Nenhuma configuração adicional é necessária.

Agentes com suporte

A tabela a seguir descreve as fontes conectadas às quais essa solução dá suporte.

Fonte conectada Com suporte Descrição
Agentes do Windows Sim Os eventos de pulsação são coletados dos agentes diretos do Windows.
Grupo de gerenciamento do System Center Operations Manager Yes Os eventos de pulsação são coletados de agentes que se reportam ao grupo de gerenciamento a cada 60 segundos e, depois, são encaminhados para o Azure Monitor. Não é necessária uma conexão direta entre o agente do Operations Manager e o Azure Monitor. Os dados de evento de pulsação são encaminhados do grupo de gerenciamento para o workspace do Log Analytics.

Usando a solução

Quando você adiciona a solução ao workspace do Log Analytics, o bloco Integridade do Agente é adicionado ao seu painel. Esse bloco mostra o número total de agentes e o número de agentes sem resposta nas últimas 24 horas.

Screenshot that shows the Agent Health tile on the dashboard.

Selecione o bloco Integridade do Agente para abrir o painel Integridade do Agente. O painel inclui as colunas na tabela a seguir. Cada coluna lista os 10 principais eventos por contagem que correspondem aos critérios da coluna para o intervalo de tempo especificado. É possível executar uma pesquisa de logs que fornece a lista inteira selecionando Ver todos abaixo de cada coluna ou selecionando o título da coluna.

Coluna Descrição
Contagem de agentes ao longo do tempo Uma tendência de sua contagem de agentes ao longo de um período de sete dias para agentes do Linux e do Windows
Contagem de agentes sem resposta Uma lista de agentes que não enviaram uma pulsação nas últimas 24 horas
Distribuição por tipo de sistema operacional Uma partição de quantos agentes do Windows e do Linux você tem em seu ambiente
Distribuição por versão do agente Uma partição das versões do agente instaladas em seu ambiente e uma contagem de cada uma delas
Distribuição por categoria do agente Uma partição das categorias de agentes que estão enviando eventos de pulsação: agentes diretos, agentes do Operations Manager ou o servidor de gerenciamento do Operations Manager
Distribuição por grupo de gerenciamento Uma partição dos grupos de gerenciamento do Operations Manager em seu ambiente
Localização geográfica dos agentes Uma partição dos países/regiões em que você tem agentes e uma contagem total do número de agentes que foram instalados em cada país/região
Contagem de gateways instalados O número de servidores que têm o gateway do Log Analytics instalado e uma lista desses servidores

Screenshot that shows an example of the Agent Health solution dashboard.

Registros de log do Azure Monitor

A solução cria um tipo de registro no workspace do Log Analytics: pulsação. Registros de pulsação têm as propriedades na tabela a seguir.

Propriedade Descrição
Type Heartbeat
Category Direct Agent, SCOM Agent ou SCOM Management Server
Computer Nome do computador
OSType Sistema operacional Windows ou Linux
OSMajorVersion Versão principal do sistema operacional
OSMinorVersion Versão secundária do sistema operacional
Version Versão do agente do Log Analytics ou do Operations Manager
SCAgentChannel Direct e/ou SCManagementServer
IsGatewayInstalled true se o gateway do Log Analytics estiver instalado; caso contrário, false
ComputerIP Endereço IP público para uma máquina virtual do Azure, se houver um disponível; endereço SNAT do Azure (não o endereço IP privado) para uma máquina virtual que usa um IP privado
ComputerPrivateIPs Lista de IPs privados do computador
RemoteIPCountry Localização geográfica onde o computador está implantado
ManagementGroupName Nome do grupo de gerenciamento do Operations Manager
SourceComputerId ID exclusiva do computador
RemoteIPLongitude Longitude da localização geográfica do computador
RemoteIPLatitude Latitude da localização geográfica do computador

Cada agente que se reporta a um servidor de gerenciamento de Operations Manager enviará duas pulsações. O valor da propriedade SCAgentChannel incluirá Direct e SCManagementServer, dependendo de quais fontes de dados e soluções de monitoramento você habilitou na assinatura.

Se você se lembra, os dados das soluções são enviados:

  • Diretamente de um servidor de gerenciamento do Operations Manager para o Azure Monitor
  • Diretamente do agente para o Azure Monitor, devido ao volume de dados coletados no agente

Para eventos de pulsação que têm o valor SCManagementServer, o valor ComputerIP é o endereço IP do servidor de gerenciamento, pois ele, na verdade, carrega os dados. Para pulsações em que SCAgentChannel está definido como Direct, é o endereço IP público do agente.

Pesquisas de log de exemplo

A tabela a seguir fornece pesquisas de logs de exemplo para os registros coletados pela solução.

Consulta Descrição
Heartbeat | Computador distinto Número total de agentes
Heartbeat | resumir LastCall = max (TimeGenerated) por Computador | onde LastCall nas < últimas (24h) Contagem de agentes sem resposta nas últimas 24 horas
Heartbeat | resumir LastCall = max (TimeGenerated) por Computador | onde LastCall nos < últimos (15m) Contagem de agentes sem resposta nos últimos 15 minutos
Heartbeat | onde TimeGenerated nas > últimas (24h) e Computer em ((Heartbeat | onde TimeGenerated nas > últimas (24h) | Computador distinto)) | resumir LastCall = max (TimeGenerated) por Computador Computadores online nas últimas 24 horas
Heartbeat | onde TimeGenerated nas > últimas (24h) e Computer! em ((Heartbeat | onde TimeGenerated nos > últimos (30m) | Computados distinto)) | resumir LastCall = max (TimeGenerated) por Computador Total de agentes offline nos últimos 30 minutos (para as últimas 24 horas)
Heartbeat | resumir AggregatedValue = dcount (Computador) por OSType Tendência do número de agentes ao longo do tempo por tipo de sistema operacional
Heartbeat | resumir AggregatedValue = dcount (Computador) por OSType Distribuição por tipo de sistema operacional
Heartbeat | resumir AggregatedValue = dcount (computador) por versão Distribuição por versão do agente
Heartbeat | resumir AggregatedValue = contagem () por categoria Distribuição por categoria do agente
Heartbeat | resumir AggregatedValue = dcount (Computador) por ManagementGroupName Distribuição por grupo de gerenciamento
Heartbeat | resumir AggregatedValue = dcount (Computador) por RemoteIPCountry Localização geográfica dos agentes
Heartbeat | onde iff (isnotnull (toint (IsGatewayInstalled)), IsGatewayInstalled == true, IsGatewayInstalled == "true") == true | Computador distinto Número de gateways do Log Analytics instalados

Próximas etapas