Мониторинг работоспособности и оповещений в Azure Stack — модульный центр обработки данных (MDC)

Azure Stack предоставляет ряд возможностей для мониторинга, которые помогают отслеживать работоспособность и просматривать оповещения для региона Azure Stack. На плитке Region management (Управление регионами) перечислены все развернутые регионы Azure Stack. По умолчанию она закреплена на портале администрирования для подписки поставщика по умолчанию. На плитке отображается количество активных критических и предупреждающих оповещений для каждого региона. Плитка представляет собой точку входа в компонент отслеживания работоспособности и оповещений Azure Stack.

The Region Management tile in Azure Stack administrator portal

Концепция работоспособности в Azure Stack

За отслеживание работоспособности и оповещения отвечает поставщик ресурсов работоспособности. В процессе развертывания и настройки Azure Stack компоненты инфраструктуры Azure Stack регистрируются в поставщике ресурсов работоспособности. Такая регистрация позволяет отображать сведения о работоспособности и оповещения для каждого компонента. В Azure Stack используется очень простое определение работоспособности. Если для зарегистрированного экземпляра компонента существуют оповещения, состояние работоспособности этого компонента определяется по наивысшему уровню серьезности активных оповещений: "предупреждение" или "критическое".

Определение серьезности оповещений

В Azure Stack оповещения имеют только два уровня серьезности: предупреждение и критическое.

  • Предупреждение
    Оператор может решить проблему, связанную с предупреждениями в плановом режиме. Такие оповещения обычно не влияют на пользовательские рабочие нагрузки.

  • Критическая
    Критически важные оповещения следует обрабатывать как можно скорее. Эти оповещения указывают на проблемы, которые влияют или вскоре повлияют на работу пользователей Azure Stack.

Просмотр состояния работоспособности компонента и управление им

Вы можете просматривать состояние работоспособности компонентов на портале администратора или с помощью REST API и PowerShell.

Чтобы просмотреть состояние работоспособности на портале, щелкните нужный регион на плитке Region management (Управление регионами). Вы можете просмотреть состояние работоспособности для инфраструктурных ролей и поставщиков ресурсов.

List of infrastructure roles

Щелкните поставщик ресурсов или инфраструктурную роль, чтобы просмотреть подробные сведения.

Предупреждение

Если щелкнуть роль инфраструктуры, а затем щелкнуть экземпляр роли, можно запустить, перезапустить или завершить работу. Не используйте эти действия при установке обновлений в интегрированной системе. Чтобы устранить неполадки, опубликуйте проблему на форуме Azure Stack.

Просмотр оповещений

Список активных оповещений для каждого региона Azure Stack можно открыть непосредственно из колонки Region management (Управление регионами). В конфигурации по умолчанию первой располагается плитка Оповещения, которая содержит сводку по критическим и предупреждающим оповещениям для этого региона. Вы можете закрепить плитку оповещений, как и любую другую плитку из этой колонки, на панели мониторинга для быстрого доступа.

Alerts tile that shows a warning in Azure Stack administrator portal

Чтобы просмотреть список всех активных оповещений для этого региона, выберите верхнюю часть плитки Оповещения. Чтобы открыть отфильтрованный список оповещений (критических или предупреждающих), выберите любой из элементов на этой плитке (Критические или Предупреждающие).

Колонка "Оповещения" поддерживает возможность фильтрации как по состоянию (активному, так и закрытому) и серьезности (критическое или предупреждение). В представлении по умолчанию отображаются все активные оповещения. Все закрытые оповещения удаляются из системы через семь дней.

Примечание

Если предупреждение остается активным, но не обновлялось в течение дня, можно запустить Test-AzureStack и закрыть оповещение при отсутствии сообщений о проблемах.

Filter pane to filter by critical or warning status in Azure Stack administrator portal

Действие View API (Показать API) позволяет открыть REST API, который использовался для создания представления списка. Эта дает возможность быстро ознакомиться с синтаксисом REST API, чтобы применять его для получения сведений об оповещениях. Этот API можно использовать в службе автоматизации или для интеграции с существующими решениями мониторинга центра обработки данных, подготовки отчетов или отслеживания проблем.

Вы можете щелкнуть любое оповещение, чтобы просмотреть сведения о нем. Сведения об оповещении содержат все поля, связанные с этим оповещением. Отсюда вы можете быстро перейти к затронутым компонентам и (или) к источнику оповещения. Например, указанное ниже оповещение возникает при отключении или недоступности одного из экземпляров инфраструктурной роли. Чтобы просмотреть статью, можно найти ссылку на перекрестную ссылку в разделе "Исправление " сведений об оповещении.

The Alert details blade in Azure Stack administrator portal

Оповещения с исправлением

В некоторых оповещениях можно выбрать действие Исправить.

При выборе действия Исправить выполняется заданная для оповещения процедура попытки устранения проблемы. После выбора этого действия его состояние отображается в виде уведомлений портала.

The Repair alert action in progress

Действие Исправить сообщит об успешном или неуспешном завершении процедуры в той же колонке уведомлений на портале. При сбое действия Исправить для оповещения можно попробовать запустить его повторно из раздела сведений об оповещении. В случае успешного выполнения действия по исправлениюне запускайте его повторно.

The Repair action completes successfully

Когда экземпляр инфраструктурной роли вернется в оперативный режим, оповещение автоматически закроется. Многие (но не все) оповещения автоматически закрываются после устранения проблемы. Оповещения, в которых есть кнопка действия "Исправить", закрываются автоматически, если Azure Stack удается устранить проблему. Для всех других оповещений нажимайте кнопку Закрыть оповещение после того, как вы выполните действия по исправлению. Если проблема сохранится, Azure Stack создаст новое оповещение. Если же проблема решена успешно, оповещение остается закрытым и не требует дополнительных действий.

Дальнейшие действия

Управления обновлениями в Azure Stack

Управление регионами в Azure Stack