Мониторинг работоспособности и оповещений в Azure StackMonitor health and alerts in Azure Stack

Azure Stack предоставляет ряд возможностей для мониторинга, которые помогают отслеживать работоспособность и просматривать оповещения для региона Azure Stack.Azure Stack includes infrastructure monitoring capabilities that help you view health and alerts for an Azure Stack region. На плитке Region management (Управление регионами) перечислены все развернутые регионы Azure Stack.The Region management tile lists all the deployed regions of Azure Stack. По умолчанию она закреплена на портале администрирования для подписки поставщика по умолчанию.It's pinned by default in the administrator portal for the Default Provider Subscription. На плитке отображается количество активных критических и предупреждающих оповещений для каждого региона.The tile shows the number of active critical and warning alerts for each region. Плитка представляет собой точку входа в компонент отслеживания работоспособности и оповещений Azure Stack.The tile is your entry point into the health and alert functionality of Azure Stack.

Плитка Region Management (Управление регионами) на портале администрирования Azure Stack

Концепция работоспособности в Azure StackUnderstand health in Azure Stack

За отслеживание работоспособности и оповещения отвечает поставщик ресурсов работоспособности.The health resource provider manages health and alerts. В процессе развертывания и настройки Azure Stack компоненты инфраструктуры Azure Stack регистрируются в поставщике ресурсов работоспособности.Azure Stack infrastructure components register with the health resource provider during Azure Stack deployment and configuration. Такая регистрация позволяет отображать сведения о работоспособности и оповещения для каждого компонента.This registration enables the display of health and alerts for each component. В Azure Stack используется очень простое определение работоспособности.Health in Azure Stack is a simple concept. Если для зарегистрированного экземпляра компонента существуют оповещения, состояние работоспособности этого компонента определяется по наивысшему уровню серьезности активных оповещений: "предупреждение" или "критическое".If alerts for a registered instance of a component exist, the health state of that component reflects the worst active alert severity: warning or critical.

Определение серьезности оповещенийAlert severity definition

В Azure Stack оповещения имеют только два уровня серьезности: предупреждение и критическое.Azure Stack raises alerts with only two severities: warning and critical.

  • ПредупреждениеWarning
    Оператор может решить проблему, связанную с предупреждениями в плановом режиме.An operator can address the warning alert in a scheduled manner. Такие оповещения обычно не влияют на пользовательские рабочие нагрузки.The alert typically doesn't impact user workloads.

  • Критическая.Critical
    Критически важные оповещения следует обрабатывать как можно скорее.An operator should address the critical alert with urgency. Эти оповещения указывают на проблемы, которые влияют или вскоре повлияют на работу пользователей Azure Stack.These alerts indicate issues that currently impact or will soon impact Azure Stack users.

Просмотр состояния работоспособности компонента и управление имView and manage component health state

Вы можете просматривать состояние работоспособности компонентов на портале администратора или с помощью REST API и PowerShell.You can view the health state of components in the administrator portal and through REST API and PowerShell.

Чтобы просмотреть состояние работоспособности на портале, щелкните нужный регион на плитке Region management (Управление регионами).To view the health state in the portal, click the region that you want to view in the Region management tile. Вы можете просмотреть состояние работоспособности для инфраструктурных ролей и поставщиков ресурсов.You can view the health state of infrastructure roles and of resource providers.

Список инфраструктурных ролей

Щелкните поставщик ресурсов или инфраструктурную роль, чтобы просмотреть подробные сведения.You can click a resource provider or infrastructure role to view more detailed information.

Предупреждение

Если щелкнуть роль инфраструктуры, а затем щелкнуть экземпляр роли, то существуют параметры запуска, перезапуска или завершения работы.If you click an infrastructure role, and then click the role instance, there are options to Start, Restart, or Shutdown. Не используйте эти действия при установке обновлений в интегрированной системе.Don't use these actions when you apply updates to an integrated system. Чтобы получить помощь в устранении неполадок, опубликуйте свою проблему на форуме по Azure Stack.For troubleshooting assistance, post your issue to the Azure Stack forum.

Просмотр оповещенийView alerts

Список активных оповещений для каждого региона Azure Stack можно открыть непосредственно из колонки Region management (Управление регионами).The list of active alerts for each Azure Stack region is available directly from the Region management blade. В конфигурации по умолчанию первой располагается плитка Оповещения, которая содержит сводку по критическим и предупреждающим оповещениям для этого региона.The first tile in the default configuration is the Alerts tile, which displays a summary of the critical and warning alerts for the region. Вы можете закрепить плитку оповещений, как и любую другую плитку из этой колонки, на панели мониторинга для быстрого доступа.You can pin the Alerts tile, like any other tile on this blade, to the dashboard for quick access.

Плитка "Оповещения", отображающая предупреждение на портале администрирования Azure Stack

Чтобы просмотреть список всех активных оповещений для этого региона, выберите верхнюю часть плитки Оповещения.To view a list of all active alerts for the region, select the top part of the Alerts tile. Чтобы открыть отфильтрованный список оповещений (критических или предупреждающих), выберите любой из элементов на этой плитке (Критические или Предупреждающие).To view a filtered list of alerts (Critical or Warning), select either the Critical or Warning line item within the tile.

Колонка Оповещения поддерживает фильтрацию по состоянию (активные или закрытые) и серьезности (критические или предупреждающие).The Alerts blade supports the ability to filter both on status (Active or Closed) and severity (Critical or Warning). В представлении по умолчанию отображаются все активные оповещения.The default view displays all active alerts. Все закрытые оповещения удаляются из системы через семь дней.All closed alerts are removed from the system after seven days.

Примечание

Если предупреждение остается активным, но не обновлялось в течение дня, можно запустить Test-AzureStack и закрыть оповещение при отсутствии сообщений о проблемах.If an alert remains active but hasn't been updated in over a day, you can run Test-AzureStack and close the alert if no problems are reported.

Панель фильтров для фильтрации по критическому состоянию или состоянию предупреждения на портале администрирования Azure Stack

Действие View API (Показать API) позволяет открыть REST API, который использовался для создания представления списка.The View API action displays the REST API that was used to generate the list view. Эта дает возможность быстро ознакомиться с синтаксисом REST API, чтобы применять его для получения сведений об оповещениях.This action provides a quick way to become familiar with the REST API syntax that you can use to query alerts. Этот API можно использовать в службе автоматизации или для интеграции с существующими решениями мониторинга центра обработки данных, подготовки отчетов или отслеживания проблем.You can use this API in automation or for integration with your existing datacenter monitoring, reporting, and ticketing solutions.

Вы можете щелкнуть любое оповещение, чтобы просмотреть сведения о нем.You can click a specific alert to view the alert details. Сведения об оповещении содержат все поля, связанные с этим оповещением. Отсюда вы можете быстро перейти к затронутым компонентам и (или) к источнику оповещения.The alert details show all fields that are associated with the alert and enable quick navigation to the affected component and source of the alert. Например, указанное ниже оповещение возникает при отключении или недоступности одного из экземпляров инфраструктурной роли.For example, the following alert occurs if one of the infrastructure role instances goes offline or isn't accessible.

Колонка сведений об оповещении на портале администрирования Azure Stack

Оповещения с исправлениемRepair alerts

В некоторых оповещениях можно выбрать действие Исправить.You can select Repair in some alerts.

При выборе действия Исправить выполняется заданная для оповещения процедура попытки устранения проблемы.When selected, the Repair action performs steps specific to the alert to attempt to resolve the issue. После выбора этого действия его состояние отображается в виде уведомлений портала.Once selected, the status of the Repair action is available as a portal notification.

Выполняется действие оповещения об исправлении

Действие Исправить сообщит об успешном или неуспешном завершении процедуры в той же колонке уведомлений на портале.The Repair action will report successful completion or failure to complete the action in the same portal notification blade. При сбое действия Исправить для оповещения можно попробовать запустить его повторно из раздела сведений об оповещении.If a Repair action fails for an alert, you may rerun the Repair action from the alert detail. В случае успешного выполнения действия по исправлению****не запускайте его повторно.If the Repair action successfully completes, do not rerun the Repair action.

Действие восстановления успешно завершено

Когда экземпляр инфраструктурной роли вернется в оперативный режим, оповещение автоматически закроется.After the infrastructure role instance is back online, this alert automatically closes. Многие (но не все) оповещения автоматически закрываются после устранения проблемы.Many, but not every alert, automatically close when the underlying issue is resolved. Оповещения, в которых есть кнопка действия "Исправить", закрываются автоматически, если Azure Stack удается устранить проблему.Alerts that provide a Repair action button will close automatically if Azure Stack resolves the issue. Для всех других оповещений нажимайте кнопку Закрыть оповещение после того, как вы выполните действия по исправлению.For all other alerts, select Close Alert after you do the remediation steps. Если проблема сохранится, Azure Stack создаст новое оповещение.If the issue persists, Azure Stack generates a new alert. Если же проблема решена успешно, оповещение остается закрытым и не требует дополнительных действий.If you resolve the issue, the alert remains closed and requires no more steps.

Дальнейшие действияNext steps

Управления обновлениями в Azure StackManage updates in Azure Stack

Управление регионами в Azure StackRegion management in Azure Stack