Solución Agent Health en Azure Monitor

La solución Agent Health de Azure le ayuda a comprender qué agentes de supervisión no responden y envían datos operativos. Aquí se incluyen todos los agentes que informan directamente al área de trabajo de Log Analytics en Azure Monitor o a un grupo de administración de System Center Operations Manager conectado a Azure Monitor.

También puede usar la solución Agent Health para:

  • Realizar un seguimiento de cuántos agentes están implementados y dónde se distribuyen geográficamente.
  • Realizar otras consultas para mantener el conocimiento de la distribución de los agentes implementados en Azure, en otros entornos de nube o en el entorno local.

Importante

La solución Agent Health solo supervisa el estado del agente de Log Analytics que está en una ruta de acceso de desuso. Esta solución no supervisa el estado del agente de Azure Monitor.

Requisitos previos

Antes de implementar esta solución, confirme que tiene agentes de Windows compatibles que informan al área de trabajo de Log Analytics o a un grupo de administración de Operations Manager integrado con el área de trabajo.

Módulos de administración

Si el grupo de administración de Operations Manager está conectado a un área de trabajo de Log Analytics, se instalarán los siguientes módulos de administración en Operations Manager. Estos módulos de administración también se instalan en equipos Windows directamente conectados después de agregar esta solución:

  • Intelligence Pack HealthAssessment Direct Channel de Microsoft System Center Advisor (Microsoft.IntelligencePacks.HealthAssessmentDirect)
  • Intelligence Pack HealthAssessment Server Channel de Microsoft System Center Advisor (Microsoft.IntelligencePacks.HealthAssessmentViaServer)

No hay nada para configurar o administrar en estos módulos de administración. Para obtener más información sobre cómo se actualizan los módulos de administración de soluciones, consulte Conexión de Operations Manager con Log Analytics.

Configuración

Agregue la solución Agent Health al área de trabajo de Log Analytics mediante el proceso descrito en Incorporación de soluciones. No es necesario realizar ninguna otra configuración.

Agentes admitidos

En la tabla siguiente se describen los orígenes conectados compatibles con esta solución.

Origen conectado Compatible Descripción
Agentes de Windows Se recopilan eventos de latido de agentes directos de Windows.
Grupo de administración de System Center Operations Manager Se recopilan eventos de latido de agentes que informan al grupo de administración cada 60 segundos y después se reenvían a Azure Monitor. No se requiere ninguna conexión directa entre los agentes de Operations Manager y Azure Monitor. Los datos de eventos de latido se reenvían del grupo de administración al área de trabajo de Log Analytics.

Uso de la solución

Al agregar la solución al área de trabajo de Log Analytics, se agrega el icono Agent Health al panel. Este icono muestra el número total de agentes y el número de agentes que no responden en las últimas 24 horas.

Captura de pantalla que muestra el icono de Agent Health en el panel.

Seleccione el icono de Agent Health para abrir el panel Agent Health. El panel incluye las columnas de la tabla siguiente. Cada columna muestra los 10 principales eventos por recuento que coinciden con los criterios de esa columna para el intervalo de tiempo especificado. Puede ejecutar una búsqueda de registros que proporcione toda la lista. Seleccione Ver todos debajo de cada columna o seleccione el encabezado de columna.

Columna Descripción
Agent count over time (Número de agentes a lo largo del tiempo) Una tendencia del número de agentes durante un período de siete días para agentes de Linux y Windows.
Count of unresponsive agents (Número de agentes que no responden) Una lista de agentes que no han enviado ningún latido en las últimas 24 horas.
Distribution by OS Type (Distribución por tipo de sistema operativo) Una partición de cuántos agentes de Windows y Linux tiene en su entorno.
Distribution by Agent Version (Distribución por versión del agente) Una partición de las versiones de agente instaladas en su entorno y el número de cada una de ellas.
Distribution by Agent Category (Distribución por categoría del agente) Una partición de las categorías de agentes que envían eventos de latido: agentes directos, agentes de Operations Manager o el servidor de administración de Operations Manager.
Distribution by Management Group (Distribución por grupo de administración) Una partición de los grupos de administración de Operations Manager en su entorno.
Geo-location of Agents (Geolocalización de los agentes) Una partición de los países o regiones donde tiene agentes y el número total de agentes instalados en cada país o región.
Count of Gateways Installed (Número de puertas de enlace instaladas) Número de servidores que tienen instalada la puerta de enlace de Log Analytics y una lista de estos servidores.

Captura de pantalla que muestra un ejemplo del panel de la solución Agent Health.

Registros de Azure Monitor

La solución crea un tipo de registro en el área de trabajo de Log Analytics: latido. Los registros de latido tienen las propiedades que aparecen en la tabla siguiente.

Propiedad Descripción
Type Heartbeat
Category Direct Agent, SCOM Agento SCOM Management Server
Computer Nombre del equipo
OSType Sistema operativo Windows o Linux
OSMajorVersion Versión principal del sistema operativo
OSMinorVersion Versión secundaria del sistema operativo
Version Versión del agente de Log Analytics o del agente de Operations Manager
SCAgentChannel Direct o SCManagementServer
IsGatewayInstalled true si está instalada la puerta de enlace de Log Analytics; de lo contrario false
ComputerIP Dirección IP pública de una máquina virtual de Azure, si hay una disponible; dirección SNAT de Azure (no la dirección IP privada) de una máquina virtual que usa una dirección IP privada
ComputerPrivateIPs Lista de direcciones IP privadas del equipo
RemoteIPCountry Ubicación geográfica donde está implementado el equipo
ManagementGroupName Nombre del grupo de administración de Operations Manager
SourceComputerId Identificador único del equipo
RemoteIPLongitude Longitud de la ubicación geográfica del equipo
RemoteIPLatitude Latitud de la ubicación geográfica del equipo

Cada agente que informa a un servidor de administración de Operations Manager enviará dos latidos. El valor de la propiedad SCAgentChannel incluirá Direct y SCManagementServer, en función de los orígenes de datos y las soluciones de supervisión que haya habilitado en la suscripción.

Si recuerda, los datos de las soluciones se envían:

  • Directamente desde un servidor de administración de Operations Manager a Azure Monitor.
  • Directamente desde el agente a Azure Monitor, debido al volumen de datos recopilados en el agente.

En los eventos de latido que tengan el valor SCManagementServer, el valor ComputerIP es la dirección IP del servidor de administración porque carga realmente los datos. En los latidos donde SCAgentChannel esté establecido en Direct, es la dirección IP pública del agente.

Búsquedas de registros de ejemplo

En la tabla siguiente se proporcionan búsquedas de registros de ejemplo de los registros que recopila la solución.

Consultar Descripción
Heartbeat | distinct Computer Número total de agentes
Heartbeat | summarize LastCall = max(TimeGenerated) by Computer | where LastCall < ago(24h) Número de agentes que no responden en las últimas 24 horas
Heartbeat | summarize LastCall = max(TimeGenerated) by Computer | where LastCall < ago(15m) Número de agentes que no responden en los últimos 15 minutos
Heartbeat | where TimeGenerated > ago(24h) and Computer in ((Heartbeat | where TimeGenerated > ago(24h) | distinct Computer)) | summarize LastCall = max(TimeGenerated) by Computer Equipos en línea en las últimas 24 horas
Heartbeat | where TimeGenerated > ago(24h) and Computer !in ((Heartbeat | where TimeGenerated > ago(30m) | distinct Computer)) | summarize LastCall = max(TimeGenerated) by Computer Total de agentes sin conexión en los últimos 30 minutos (durante las últimas 24 horas)
Heartbeat | summarize AggregatedValue = dcount(Computer) by OSType Tendencia del número de agentes a lo largo del tiempo por tipo de sistema operativo
Heartbeat | summarize AggregatedValue = dcount(Computer) by OSType Distribution by OS Type (Distribución por tipo de sistema operativo)
Heartbeat | summarize AggregatedValue = dcount(Computer) by Version Distribution by Agent Version (Distribución por versión del agente)
Heartbeat | summarize AggregatedValue = count() by Category Distribution by Agent Category (Distribución por categoría del agente)
Heartbeat | summarize AggregatedValue = dcount(Computer) by ManagementGroupName Distribution by Management Group (Distribución por grupo de administración)
Heartbeat | summarize AggregatedValue = dcount(Computer) by RemoteIPCountry Geo-location of Agents (Geolocalización de los agentes)
Heartbeat | where iff(isnotnull(toint(IsGatewayInstalled)), IsGatewayInstalled == true, IsGatewayInstalled == "true") == true | distinct Computer Número de puertas de enlace de Log Analytics instaladas

Pasos siguientes

Más información sobre la generación de alertas desde consultas de registro en Azure Monitor.