Сведения о работе оповещений о метриках в Azure Monitor

Оповещения о метриках в Azure Monitor работают для основных многомерных метрик. Это могут быть метрики платформы, пользовательские метрики, популярные журналы из Azure Monitor, преобразованные в метрики, метрики Application Insights. Для оповещений о метриках регулярно выполняется анализ, чтобы проверить соответствие условий одного временного ряда метрик или более. Если зафиксированы правильные значения, отправляется соответствующее уведомление. Функция оповещений о метриках по умолчанию работает с отслеживанием состояния, то есть уведомления отправляются только при изменении состояния (сработало, разрешено). Если вы хотите сделать их без отслеживания состояния, см. раздел Создание оповещений метрик при каждом выполнении условия.

Как работают оповещения о метриках?

Вы можете определить правило генерации оповещений о метрике, указав целевой ресурс, который нужно отслеживать, имя метрики, тип условия (статическое и динамическое) и условие (оператор и порог или конфиденциальность), а также группу действий, которую нужно активировать при срабатывании правила генерации оповещений. Типы условий влияют на способ определения пороговых значений. Дополнительные сведения о типе условия "Динамические пороговые значения" и значениях параметра конфиденциальности.

Правило генерации оповещений со статическим типом условия

Предположим, что вы создали простое правило генерации оповещений о метрике со статическим пороговым значением следующим образом:

  • Целевой ресурс (ресурс Azure, который требуется отслеживать): myVM.
  • Метрика: загрузка ЦП
  • Тип условия: статический
  • Тип агрегирования (статистический показатель, который выполняется в необработанных значениях метрик. Поддерживаются следующие типы агрегирования: минимальное, максимальное, среднее, общее, число): среднее значение
  • Период (окно поиска, в котором проверяются значения метрик): за последние 5 минут
  • Частота (частота, с которой оповещение метрики проверяет, соблюдены ли условия): 1 мин
  • Оператор: "больше, чем"
  • Пороговое значение: 70

С момента создания правила генерации оповещений мониторинг выполняется каждую минуту, просматриваются значения метрики за последние 5 минут и проверяется, превышает ли среднее значение этих значений 70. Если условие выполняется, то есть средняя загрузка ЦП за последние 5 минут превышает 70, правило генерации оповещений запускает активированное уведомление. Если вы настроили действие электронной почты или веб-перехватчика в группе действий, связанной с правилом генерации оповещений, вы получите активированное уведомление для настроенных параметров.

При использовании нескольких условий в одном правиле, правило "объединяет" все условия вместе. Это значит, что оповещение срабатывает, когда все условия в правиле генерации оповещений оцениваются как true и разрешаются, когда одно из условий перестает быть true. Например, для этого типа оповещения правилом было бы отслеживание виртуальной машины Azure и оповещение, когда "Процент ЦП превышает 90 %" и "Длина очереди превышает 300 элементов".

Правило генерации оповещений с динамическим типом условия

Предположим, что вы создали простое правило генерации оповещений о метрике с динамическим пороговым значением следующим образом:

  • Целевой ресурс (ресурс Azure, который требуется отслеживать): myVM.
  • Метрика: загрузка ЦП
  • Тип условия: динамический
  • Тип агрегирования (статистический показатель, который выполняется в необработанных значениях метрик. Поддерживаются следующие типы агрегирования: минимальное, максимальное, среднее, общее, число): среднее значение
  • Период (окно поиска, в котором проверяются значения метрик): за последние 5 минут
  • Частота (частота, с которой оповещение метрики проверяет, соблюдены ли условия): 1 мин
  • Оператор: "больше, чем"
  • Чувствительность: средняя
  • Периоды поиска: 4
  • Число нарушений: 4

После создания правила генерации оповещений алгоритм машинного обучения с динамическими пороговыми значениями будет получать доступные исторические данные, вычислять порог, который наилучшим образом соответствует шаблону поведения ряда метрик, а также будет непрерывно обучаться на основе новых данных, чтобы сделать порог более точным.

С момента создания правила генерации оповещений мониторинг выполняется каждую минуту. При этом просматриваются значения метрик за последние 20 минут, сгруппированные в 5-минутные периоды, а также проверяется, превышает ли среднее значение за период ожидаемый порог в каждом из 4 периодов. Если условие выполняется, то есть средний процент загрузки ЦП за последние 20 минут (четыре 5-минутных периода) отклонялся от ожидаемого поведения четыре раза, правило генерации оповещений запускает активированное уведомление. Если вы настроили действие электронной почты или веб-перехватчика в группе действий, связанной с правилом генерации оповещений, вы получите активированное уведомление для настроенных параметров.

Просмотр и разрешение сработавших оповещений

Представленные выше примеры выполнения правила генерации оповещений можно также просмотреть на портале Azure или в колонке Все оповещения.

Скажем, если показатели использования в ресурсе myVM продолжают превышать порог при последующих проверках, правило генерации оповещений не сработает повторно, пока не будут устранены условия.

Через некоторое время значение использования в разделе "myVM" возвращается к нормальному (опускается ниже порогового). Правило генерации оповещений отслеживает это условие еще два раза, чтобы отправить уведомление об устранении. Правило генерации оповещений отправляет сообщение об устранении или деактивации, когда условие оповещения не выполняется в течение трех последовательных периодов для сокращения отправки нежелательных оповещений в случае нестабильности условий.

По мере того как уведомление об устранении отправляется через веб-перехватчик или электронную почту, на портале Azure также обновляется состояние экземпляра оповещения (называемое состоянием мониторинга) на "Разрешено".

Примечание

Когда правило оповещения отслеживает несколько условий, появление оповещения будет разрешено, если, по крайнее мере, одно условие больше не соблюдается на протяжении трех последовательных периодов.

Использование измерений

Оповещения о метриках в Azure Monitor также поддерживают отслеживание комбинаций значений нескольких измерений с одним правилом. Поясним на примере, почему вы можете использовать комбинации нескольких измерений.

Предположим, что у вас есть план службы приложений для веб-сайта. Вы хотите отследить использование ЦП на нескольких экземплярах, на которых запущен веб-сайт или приложение. Это можно сделать следующим образом, используя правило генерации оповещений о метрике.

  • Целевой ресурс: myAppServicePlan
  • Метрика: загрузка ЦП
  • Тип условия: статический
  • Измерения
    • Экземпляр = InstanceName1, InstanceName2
  • Тип агрегирования: Среднее
  • Период: за последние 5 минут
  • Частота: 1 мин
  • Оператор: GreaterThan
  • Пороговое значение: 70

Как и раньше, это правило отслеживает, превышает ли среднее потребление ЦП за последние 5 минут 70 %. Тем не менее с помощью того же правила вы можете отслеживать два экземпляра, на которых запущен сайт. Каждый экземпляр будет отслеживаться индивидуально, и вы будете получать уведомления отдельно.

Скажем, у вас есть веб-приложение, которое очень часто используется, и вам нужно добавить больше экземпляров. Правило выше по-прежнему отслеживает только два экземпляра. Тем не менее можно создать правило следующим образом.

  • Целевой ресурс: myAppServicePlan
  • Метрика: загрузка ЦП
  • Тип условия: статический
  • Измерения
    • Экземпляр = *
  • Тип агрегирования: Среднее
  • Период: за последние 5 минут
  • Частота: 1 мин
  • Оператор: GreaterThan
  • Пороговое значение: 70

Это правило будет автоматически отслеживать все значения для экземпляра, например вы можете отслеживать экземпляры по мере их появления без необходимости снова изменять правило генерации оповещений о метрике.

При мониторинге нескольких измерений правило генерации оповещений с динамическим пороговым значением позволяет создать точно настроенные пороги для нескольких сотен метрик одновременно. Динамические пороговые значения приводят к управлению меньшим количеством правил генерации оповещений и значительной экономии времени на управление и создание правил генерации оповещений.

Предположим, у вас есть веб-приложение со множеством экземпляров и вы не знаете, какой порог является наиболее подходящим. Приведенные выше правила всегда будут использовать порог 70 %. Тем не менее можно создать правило следующим образом.

  • Целевой ресурс: myAppServicePlan
  • Метрика: загрузка ЦП
  • Тип условия: динамический
  • Измерения
    • Экземпляр = *
  • Тип агрегирования: Среднее
  • Период: за последние 5 минут
  • Частота: 1 мин
  • Оператор: GreaterThan
  • Чувствительность: средняя
  • Периоды поиска: 1
  • Число нарушений: 1

Это правило отслеживает, превышает ли среднее потребление ЦП за последние 5 минут ожидаемое поведение для каждого экземпляра. По этому же правилу вы можете отслеживать экземпляры по мере их появления без необходимости снова изменять правило генерации оповещений о метрике. Каждый экземпляр получит пороговое значение, которое соответствует шаблону поведения ряда метрик, и будет постоянно меняться на основе новых данных, чтобы обеспечить более точное пороговое значение. Как и прежде, каждый экземпляр будет отслеживаться индивидуально и вы будете получать уведомления отдельно.

При увеличении периодов просмотра и числа нарушений также можно выполнить фильтрацию только до оповещения о вашем определении значительного отклонения. Дополнительные сведения о расширенных параметрах динамических пороговых значений.

Примечание

Рекомендуется выбирать значение Степень детализации агрегации (Период) , которое превышает значение параметра Частота оценки для снижение вероятности отсутствия первой оценки добавленных временных рядов в следующих случаях:

  • Правило оповещения метрики, отслеживающее несколько измерений — при добавлении нового сочетания значений
  • Правило оповещения метрики, отслеживающее несколько ресурсов — при добавлении нового сочетания значений
  • Правило оповещения метрики, отслеживающее метрику, которая не формируется непрерывно (разреженная метрика) — когда метрика формируется по истечении периода, превышающего 24 часа, когда она не была выданы

Мониторинг в масштабе с помощью оповещений о метриках в Azure Monitor

На данный момент вы узнали, как одно предупреждение метрики можно использовать для отслеживания одного или нескольких метрических временных рядов, связанных с одним ресурсом Azure. Во многих случаях вы можете захотеть, чтобы одно и то же правило генерации оповещений применялось ко многим ресурсам. Azure Monitor также поддерживает отслеживание нескольких ресурсов (одинакового типа) с помощью одного правила оповещения метрик для ресурсов, находящихся в одном и том же регионе Azure.

В настоящее время эта функция поддерживается для метрик платформы (не настраиваемых метрик) для следующих служб в следующих облаках Azure:

Служба Public Azure (Общедоступные Azure) Государственный сектор Китай
Виртуальные машины1 Да Да Да
Базы данных SQL Server Да Да Да
Эластичные пулы SQL Да Да Да
Пулы емкости файлов NetApp Да Да Да
Тома файлов NetApp Да Да Да
Хранилища ключей Да Да Да
Кэш Azure для Redis Да Да Да
Устройства Data Box Edge Да Да Да

1 Не поддерживается для метрик сети (входящий сетевой трафик, исходящий сетевой трафик, входящие потоки, исходящие потоки, максимальная скорость создания входящих потоков, максимальная скорость создания исходящих потоков).

Область мониторинга можно указать единым правилом оповещения метрики одним из трех следующих способов. Например, для виртуальных машин можно указать область как:

  • список виртуальных машин (в одном регионе Azure) в рамках одной подписки;
  • все виртуальные машины (в одном регионе Azure) в одной или нескольких группах одной подписки;
  • все виртуальные машины (в одном регионе Azure) в одной подписке.

Примечание

Область правила оповещения метрики нескольких ресурсов должна содержать не менее одного ресурса выбранного типа ресурса.

Создание правил генерации оповещений метрики, которые отслеживают несколько ресурсов, аналогично созданию любого другого оповещения метрики, которое отслеживает один ресурс. Единственным отличием является то, что следует выбрать все ресурсы, которые вы хотите отслеживать. Эти правила также можно создать, используя шаблоны Azure Resource Manager. Отдельные уведомления предоставляются по каждому отслеживаемому ресурсу.

Примечание

В правиле оповещения метрики, отслеживающем несколько ресурсов, допускается только одно условие.

Обычная задержка

Для оповещений о метриках, как правило можно получить уведомление в течение 5 минут, если задать частоту правила генерации оповещений в 1 минуту. В случае серьезных нагрузок для систем отправки уведомлений может наблюдаться более длительная задержка.

Поддерживаемые типы ресурсов оповещений о метриках

Полный список поддерживаемых типов ресурсов можно найти в этой статье.

Дальнейшие действия