Microsoft Azure의 경고 개요

이 문서에서는 경고에 대해 설명하고 그 이점과 사용 방법을 소개합니다.

Microsoft Azure의 경고란?

경고는 Azure Monitor에서 모니터링 데이터를 사용하여 인프라나 애플리케이션의 문제가 발견되는 경우에 사용자에게 사전에 알려 줍니다. 시스템 사용자가 문제를 알아채기 전에 경고를 통해 문제를 식별하여 해결할 수 있습니다.

개요

아래 다이어그램은 경고의 흐름을 나타냅니다.

Diagram of alert flow

경고 규칙은 경고 및 경고가 발생할 때 수행되는 작업에서 분리됩니다. 경고 규칙은 경고의 대상 및 조건을 캡처합니다. 경고 규칙은 사용 또는 사용 안 함 상태입니다. 경고 규칙이 사용인 경우에만 경고가 발생합니다.

다음은 경고 규칙의 주요 특성입니다.

대상 리소스 - 경고에 사용할 수 있는 범위 및 신호를 정의합니다. 대상은 Azure 리소스일 수 있습니다. 예제 대상:

  • 가상 머신
  • 스토리지 계정
  • Log Analytics 작업 영역.
  • Application Insights

특정 리소스(예: 가상 머신)의 경우 경고 규칙의 대상으로 여러 리소스를 지정할 수 있습니다.

신호 - 대상 리소스에서 내보냅니다. 신호는 메트릭, 활동 로그, Application Insights 및 로그 유형일 수 있습니다.

조건 - 대상 리소스에 적용되는 신호 및 논리의 조합입니다. 예제:

  • CPU 사용률:> 70%
  • 서버 응답 시간:> 4ms
  • 로그 쿼리의 결과 수:> 100

경고 이름 – 사용자가 구성한 경고 규칙의 구체적인 이름입니다.

경고 설명 – 사용자가 구성한 경고 규칙에 대한 설명입니다.

심각도 - 경고 규칙에 지정된 조건이 충족되면 발생하는 경고의 심각도입니다. 심각도 범위는 0~4입니다.

  • 심각도 0 = 위험
  • 심각도 1 = 오류
  • 심각도 2 - 경고
  • 심각도 3 = 정보
  • 심각도 4 = 자세한 정보

작업 - 경고가 발생할 때 수행되는 특정 작업입니다. 자세한 내용은 작업 그룹을 참조하세요.

경고 가능한 내용

데이터 원본 모니터링에 설명된 대로 메트릭 및 로그에 대해 경고할 수 있습니다. 신호에 포함되는 사항들은 다음과 같으며 이에 국한되지 않습니다.

  • 메트릭 값
  • 로그 검색 쿼리
  • 활동 로그 이벤트
  • 기본 Azure 플랫폼의 상태
  • 웹 사이트 가용성 테스트

경고 환경

경고 페이지

경고 페이지는 지난 24시간 동안 만들어진 경고 요약을 제공합니다.

경고 권장 사항(미리 보기)

참고

경고 규칙 권장 사항 기능은 현재 미리 보기 상태이며 VM에만 사용할 수 있습니다.

선택한 리소스에 대해 개별적으로 또는 리소스 그룹 또는 구독의 일부로 정의된 경고 규칙이 없는 경우 새 경고 규칙을 만들거나Azure Portal에서 권장되는 기본 경고 규칙을 사용하도록 설정(미리 보기)할 수 있습니다.

Screenshot of alerts page with link to recommended alert rules.

경고 요약 창

이 리소스에 대해 구성된 경고가 있는 경우 경고 요약 창에 지난 24시간 동안 발생한 경고가 요약됩니다. 구독 또는 페이지 상단의 필터 매개 변수로 목록을 필터링할 수 있습니다. 페이지에는 각 심각도에 대한 총 경고가 표시됩니다. 심각도를 기준으로 경고를 필터링하려면 심각도를 선택합니다.

참고

지난 30일 동안 생성된 경고에만 액세스할 수 있습니다.

REST API를 사용하여 구독에서 생성된 경고 인스턴스를 프로그래밍 방식으로 열거할 수도 있습니다.

Screenshot of alerts page.

페이지 상단에 있는 다음 필터 중 하나에서 값을 선택하여 목록의 범위를 좁힐 수 있습니다.

설명
구독 경고를 보려는 Azure 구독을 선택합니다. 필요에 따라 모든 구독을 선택할 수 있습니다. 선택한 구독에서 사용자가 액세스할 수 있는 경고만 보기에 포함됩니다.
리소스 그룹 단일 리소스 그룹을 선택합니다. 선택한 리소스 그룹의 대상이 있는 경고만 보기에 포함됩니다.
리소스 종류 리소스 종류를 하나 이상 선택합니다. 선택한 형식의 대상이 있는 경고만 보기에 포함됩니다. 이 열은 리소스 그룹을 지정한 후에만 사용할 수 있습니다.
리소스 리소스를 선택합니다. 해당 리소스가 대상으로 지정된 경고만 보기에 포함됩니다. 이 열은 리소스 종류를 지정한 후에만 사용할 수 있습니다.
심각도 경고 심각도를 선택하거나 심각도에 상관없이 모든 경고를 포함하려면 모두를 선택합니다.
경고 조건 경고 조건을 선택하거나 모든 조건의 경고를 포함하려면 모두를 선택합니다.
사용자 응답 사용자 응답을 선택하거나 모든 사용자 응답에 대한 경고를 포함하려면 모두를 선택합니다.
서비스 모니터링 하나의 서비스를 선택하거나 모든 서비스를 포함하려면 모두를 선택합니다. 서비스를 대상으로 사용하는 규칙에서 생성된 경고만 포함됩니다.
시간 범위 선택한 시간 범위 내에 발생한 경고만 보기에 포함됩니다. 지원되는 값은 지난 1시간, 지난 24시간, 지난 7일 및 지난 30일입니다.

페이지 맨 위에서 을 선택하여 표시할 열을 선택합니다.

경고 세부 정보 창

경고를 선택하면 이 경고 세부 정보 창에서 경고에 대한 세부 정보를 제공하고 경고에 대한 응답 방식을 변경할 수 있습니다.

Screenshot of alert details pane.

경고 세부 정보 창에는 다음이 포함됩니다.

섹션 Description
요약 경고에 대한 속성과 기타 중요한 정보를 표시합니다.
기록 경고에 대한 모든 작업과 경고에 대한 변경 내용을 나열합니다.

경고 관리

경고에 대한 사용자 응답을 설정하여 해결 프로세스의 위치를 지정할 수 있습니다. 경고 규칙에 지정된 조건이 충족되면 경고가 생성되거나 실행되고, 상태는 새 경고입니다. 경고를 확인할 때 및 경고를 닫을 때 상태를 변경할 수 있습니다. 모든 사용자 응답 변경 내용은 경고 기록에 저장됩니다.

다음 사용자 응답이 지원됩니다.

사용자 응답 설명
새로 만들기 문제를 감지했으며 아직 검토하지 않았습니다.
승인됨 관리자가 경고를 검토하고 작업을 시작했습니다.
종결 문제가 해결되었습니다. 경고가 닫힌 후에는 다른 사용자 응답으로 변경하여 다시 열 수 있습니다.

사용자 응답은 다르며 경고 조건과 무관합니다. 응답은 사용자가 설정하고 경고 조건은 시스템에서 설정합니다. 경고가 실행되면 경고의 경고 조건이 '실행됨'으로 설정되고 경고를 실행한 기본 조건이 해결되면 경고 조건이 '해결됨'으로 설정됩니다.

경고 규칙 관리

규칙 페이지를 표시하려면 경고 규칙 관리를 선택합니다. 규칙 페이지는 Azure 구독 전반의 모든 경고 규칙을 관리하는 단일 위치입니다. 모든 경고 규칙을 나열하며 대상 리소스, 리소스 그룹, 규칙 이름 또는 상태에 따라 정렬할 수 있습니다. 또한 이 페이지에서 경고 규칙을 편집, 사용 또는 사용하지 않도록 설정할 수 있습니다.

Screenshot of alert rules page.

경고 규칙 만들기

모니터링 서비스 또는 신호 형식에 관계 없이 일관된 방식으로 경고 규칙을 작성할 수 있습니다.

새 경고 규칙을 만드는 방법은 다음과 같습니다.

  1. 경고의 대상을 선택합니다.
  2. 대상에 사용 가능한 신호 중에서 신호를 선택합니다.
  3. 신호의 데이터에 적용할 논리를 지정합니다.

이 간소화된 작성 프로세스에서는 Azure 리소스를 선택하기 전에 지원되는 모니터링 원본 또는 신호를 더 이상 알 필요가 없습니다. 사용 가능한 신호 목록은 선택한 대상 리소스를 기준으로 자동 필터링됩니다. 또한 해당 대상에 따라 경고 규칙의 논리를 정의하는 과정을 자동으로 안내합니다.

경고 규칙을 만드는 방법에 대한 자세한 내용은 Azure Monitor를 사용하여 경고 만들기, 보기 및 관리를 참조하세요.

경고는 여러 Azure 모니터링 서비스 전체에서 제공됩니다. 각 서비스를 사용하는 방법 및 시기에 대한 자세한 내용은 Azure 애플리케이션 및 리소스 모니터링을 참조하세요.

경고 인스턴스에 대한 Azure RBAC(역할 기반 액세스 제어)

경고 인스턴스의 사용 및 관리를 위해서는 사용자에게 모니터링 기여자 또는 모니터링 읽기 권한자의 Azure 기본 제공 역할이 있어야 합니다. 이러한 역할은 구독 수준에서 리소스 수준의 세부적인 할당까지의 모든 Azure Resource Manager 범위에서 지원됩니다. 예를 들어 사용자에게 가상 머신 ContosoVM1에 대한 모니터링 기여자 액세스 권한만 있는 경우 해당 사용자는 ContosoVM1에서 생성된 경고만 사용하고 관리할 수 있습니다.

프로그래밍 방식으로 경고 인스턴스 관리

구독에 대해 생성된 경고를 프로그래밍 방식으로 쿼리하려고 할 수 있습니다. 쿼리는 Azure Portal 외부에서 사용자 지정 보기를 만들거나 패턴 및 추세를 식별하기 위해 경고를 분석하기 위한 것일 수 있습니다.

발생한 경고를 쿼리하려면 AlertsManagementResources 스키마와 함께 Azure Resource Graph를 사용하는 것이 좋습니다. 여러 구독에서 생성된 경고를 관리해야 하는 경우 Resource Graph가 권장됩니다.

Resource Graph REST API에 대한 다음 샘플 요청은 마지막 날에 하나의 구독 내에서 경고를 반환합니다.

{
  "subscriptions": [
    <subscriptionId>
  ],
  "query": "alertsmanagementresources | where properties.essentials.lastModifiedDateTime > ago(1d) | project alertInstanceId = id, parentRuleId = tolower(tostring(properties['essentials']['alertRule'])), sourceId = properties['essentials']['sourceCreatedId'], alertName = name, severity = properties.essentials.severity, status = properties.essentials.monitorCondition, state = properties.essentials.alertState, affectedResource = properties.essentials.targetResourceName, monitorService = properties.essentials.monitorService, signalType = properties.essentials.signalType, firedTime = properties['essentials']['startDateTime'], lastModifiedDate = properties.essentials.lastModifiedDateTime, lastModifiedBy = properties.essentials.lastModifiedUserName"
}

Azure Resource Graph Explorer가 있는 포털(portal.azure.com)에서 이 Resource Graph 쿼리의 결과를 볼 수도 있습니다.

낮은 규모의 쿼리 시나리오에서 경고 관리 REST API를 사용하거나 발생된 경고를 업데이트할 수도 있습니다.

스마트 그룹

스마트 그룹은 경고 노이즈를 줄이고 문제 해결을 도와주는 기계 학습 알고리즘 기반의 경고 집계입니다. 스마트 그룹스마트 그룹을 관리하는 방법을 알아보세요.

다음 단계