Решение "Работоспособность агентов" в Azure Monitor

Решение "Работоспособность агентов" в Azure помогает понять, какие агенты мониторинга не отвечают и отправляют операционные данные. Сюда относятся все агенты, которые отправляют отчеты непосредственно в рабочую область Log Analytics в Azure Monitor или в группу управления Operations Manager System Center, подключенную к Azure Monitor.

Вы также можете использовать решение "Работоспособность агентов" для выполнения следующих задач:

  • Контроль числа развернутых агентов и их географического распределения.
  • Выполнение других запросов, позволяющих отслеживать распределение агентов, развернутых в Azure, других облачных средах или в локальной среде.

Важно!

Решение "Работоспособность агента" отслеживает только работоспособность агента Log Analytics , который находится на пути устаревания. Это решение не отслеживает работоспособность агента Azure Monitor.

Предварительные требования

Перед развертыванием этого решения убедитесь, что у вас есть поддерживаемые агенты Windows, которые отправляют отчеты в рабочую область Log Analytics или группу управления Operations Manager, интегрированную с вашей рабочей областью.

Пакеты управления

Если группа управления Operations Manager подключена к рабочей области Log Analytics, в Operations Manager будут установлены следующие пакеты. Эти пакеты управления также устанавливаются на компьютерах Windows, подключенных напрямую, после добавления этого решения:

  • Пакет аналитики канала Direct оценки работоспособности помощника Microsoft System Center (Microsoft.IntelligencePacks.HealthAssessmentDirect)
  • Microsoft System Center Advisor HealthAssessment Server Channel Intelligence Pack (Microsoft.IntelligencePacks.HealthAssessmentViaServer)

Управление и настройка здесь не требуются. Дополнительные сведения об обновлении пакетов управления для решений см. в статье Подключение Operations Manager к Log Analytics.

Конфигурация

Добавьте решение для мониторинга работоспособности агентов в рабочую область Log Analytics, как описано в статье Добавление решений. Дальнейшая настройка не требуется.

Поддерживаемые агенты

В приведенной ниже таблице описаны подключенные источники, которые поддерживает это решение.

Подключенный источник Поддерживается Описание
Агенты Windows Да События пульса собираются от прямых агентов Windows.
Группа управления System Center Operations Manager Да События пульса собираются от агентов, которые передают данные группе управления каждые 60 секунд, а затем перенаправляются в Azure Monitor. Прямое подключение агентов Operations Manager к Azure Monitor не требуется. Данные событий пульса перенаправляются из группы управления в рабочую область Log Analytics.

Использование решения

При добавлении решения в рабочую область Log Analytics на панель мониторинга добавляется плитка Работоспособность агентов. На ней отображается общее число агентов и число агентов, не отвечающих на запросы за последние 24 часа.

Снимок экрана: плитка работоспособности агента на панели мониторинга.

Щелкните плитку Работоспособность агентов, чтобы открыть панель мониторинга Работоспособность агентов. Панель мониторинга содержит столбцы, перечисленные в приведенной ниже таблице. Каждый столбец содержит по десять основных событий, соответствующих таким указанным критериям, как диапазон времени. Вы можете выполнить поиск по журналам, который предоставляет весь список. Выберите Просмотреть все под каждым столбцом или выберите заголовок столбца.

Столбец Описание
Число агентов по времени Тенденция изменения числа агентов в течение семи дней для агентов Linux и Windows.
Число агентов, не отвечающих на запросы Список агентов, которые не отправили пакеты пульса за последние 24 часа.
Распределение по типам ОС Число агентов Windows и Linux в вашей среде.
Распределение по версиям агентов Другие версии агентов, установленные в вашей среде, и их число.
Распределение по категориям агентов Различные категории агентов, отправляющих события пульса: прямые агенты, агенты Operations Manager и сервер управления Operations Manager.
Распределение по группам управления Разные группы управления Operations Manager в вашей среде.
Географическое расположение агентов Разные страны или регионы, в которых находятся ваши агенты, и общее число агентов, установленных в каждой стране или регионе.
Число установленных шлюзов Число серверов, на которых установлен шлюз Log Analytics, и список этих серверов.

Снимок экрана: пример панели мониторинга решения

Записи журнала Azure Monitor

Решение создает один тип записи в рабочей области Log Analytics: пакет пульса. Записи пульса имеют свойства, перечисленные в следующей таблице.

Свойство Описание
Type Heartbeat
Category Direct Agent, SCOM Agentили SCOM Management Server
Computer Имя компьютера
OSType Операционная система Windows или Linux.
OSMajorVersion Основная версия операционной системы.
OSMinorVersion Второстепенная версия операционной системы.
Version Версия агента Log Analytics или агента Operations Manager.
SCAgentChannel Direct и (или) SCManagementServer
IsGatewayInstalled true, если установлен шлюз Log Analytics; в противном случае false
ComputerIP Общедоступный IP-адрес для виртуальной машины Azure, если он доступен; адрес Azure SNAT (не частный IP-адрес) для виртуальной машины, использующей частный IP
ComputerPrivateIPs Список частных IP-адресов компьютера.
RemoteIPCountry Географическое расположение, в котором развернут компьютер.
ManagementGroupName Имя группы управления Operations Manager
SourceComputerId Уникальный идентификатор компьютера
RemoteIPLongitude Долгота географического расположения компьютера
RemoteIPLatitude Широта географического расположения компьютера

Каждый агент, отправляющий отчеты на сервер управления Operations Manager, будет отправлять два пакета пульса. Значение свойства SCAgentChannel будет включать Direct и SCManagementServer в зависимости от того, какие источники данных и решения по мониторингу включены в вашей подписке.

При отзыве отправляются данные из решений:

  • Непосредственно с сервера управления Operations Manager в Azure Monitor.
  • Непосредственно из агента в Azure Monitor из-за объема данных, собранных в агенте.

Для событий пульса со значением SCManagementServer значением ComputerIP является IP-адрес сервера управления, так как он фактически передает данные. Для пульсов со значением Direct для параметра SCAgentChannel IP-адрес компьютера — это общедоступный IP-адрес агента.

Пример поисков журналов

Следующая таблица содержит примеры поисков по журналу для получения записей, собранных этим решением.

Запрос Описание
Heartbeat | distinct Computer Общее число агентов
Heartbeat | summarize LastCall = max(TimeGenerated) by Computer | where LastCall < ago(24h) Число агентов, не отвечающих на запросы за последние 24 часа
Heartbeat | summarize LastCall = max(TimeGenerated) by Computer | where LastCall < ago(15m) Число агентов, не отвечающих на запросы за последние 15 минут
Heartbeat | where TimeGenerated > ago(24h) and Computer in ((Heartbeat | where TimeGenerated > ago(24h) | distinct Computer)) | summarize LastCall = max(TimeGenerated) by Computer Подключенные компьютеры (за последние 24 часа)
Heartbeat | where TimeGenerated > ago(24h) and Computer !in ((Heartbeat | where TimeGenerated > ago(30m) | distinct Computer)) | summarize LastCall = max(TimeGenerated) by Computer Общее число автономных агентов за последние 30 минут (за последние 24 часа)
Heartbeat | summarize AggregatedValue = dcount(Computer) by OSType Тенденция изменения числа агентов за промежуток времени по типу ОС
Heartbeat | summarize AggregatedValue = dcount(Computer) by OSType Распределение по типам ОС
Heartbeat | summarize AggregatedValue = dcount(Computer) by Version Распределение по версиям агентов
Heartbeat | summarize AggregatedValue = count() by Category Распределение по категориям агентов
Heartbeat | summarize AggregatedValue = dcount(Computer) by ManagementGroupName Распределение по группам управления
Heartbeat | summarize AggregatedValue = dcount(Computer) by RemoteIPCountry Географическое расположение агентов
Heartbeat | where iff(isnotnull(toint(IsGatewayInstalled)), IsGatewayInstalled == true, IsGatewayInstalled == "true") == true | distinct Computer Число установленных шлюзов Log Analytics

Дальнейшие действия

Подробнее о создании оповещений из запросов журналов в Azure Monitor.