Azure Monitor 경고란?

경고는 Azure Monitor 데이터가 인프라 또는 애플리케이션에 문제가 있을 수 있음을 나타내는 경우 사전에 알려주어 사용자가 문제를 알아채기 전에 문제를 감지하고 해결하는 데 도움이 됩니다.

Azure Monitor 데이터 플랫폼의 모든 메트릭 또는 로그 데이터 원본에 대해 경고할 수 있습니다.

이 다이어그램은 경고의 작동 방식을 보여 줍니다.

Diagram that explains Azure Monitor alerts.

경고 규칙은 데이터를 모니터링하고 지정된 리소스에서 문제가 발생하고 있음을 나타내는 신호를 캡처합니다. 경고 규칙은 신호를 캡처하고 신호가 조건의 기준을 충족하는지 확인합니다.

경고 규칙은 다음을 결합합니다.

  • 모니터링할 리소스
  • 리소스의 신호 또는 데이터입니다.
  • 조건.

경고 규칙의 조건이 충족되면 경고이 트리거됩니다. 경고는 연결된 작업 그룹을 시작하고 경고 상태를 업데이트합니다. 둘 이상의 리소스를 모니터링하는 경우 각 리소스에 대해 별도로 경고 규칙 조건이 평가되고 각 리소스에 대해 개별적으로 경고가 발생합니다.

경고는 30일 동안 저장되며 30일 보존 기간이 지나면 삭제됩니다. Azure Portal의 경고 페이지에서 모든 Azure 리소스에 대한 모든 경고 인스턴스를 볼 수 있습니다.

경고는 다음으로 구성됩니다.

  • 작업 그룹: 이러한 그룹은 알림 또는 자동화된 워크플로를 트리거하여 사용자에게 경고가 트리거되었음을 알릴 수 있습니다. 작업 그룹에는 다음이 포함될 수 있습니다.
    • 이메일, SMS 및 푸시 알림과 같은 알림 방법입니다.
    • 생성됩니다.
    • Azure 함수
    • ITSM 인시던트.
    • Logic Apps
    • 웹후크를 보호합니다.
    • 웹후크.
    • Event Hubs
  • 경고 조건: 이러한 조건은 시스템에 의해 설정됩니다. 경고가 실행되면 경고 조건이 실행됨으로 설정됩니다. 경고를 발생시킨 기본 조건이 지워지면 경고 조건이 해결됨으로 설정됩니다.
  • 사용자 응답: 응답은 사용자가 설정하며 사용자가 변경할 때까지 변경되지 않습니다.
  • 경고 처리 규칙: 경고 처리 규칙을 사용하여 트리거된 경고가 실행될 때 이를 수정할 수 있습니다. 경고 처리 규칙을 사용하여 작업 그룹을 추가하거나, 작업 그룹을 표시하지 않거나, 필터를 적용하거나, 미리 정의된 일정에 따라 규칙이 처리되도록 할 수 있습니다.

경고 유형

이 표에서는 각 경고 유형에 대한 간략한 설명을 제공합니다. 각 경고 유형 및 요구 사항에 가장 적합한 경고 유형을 선택하는 방법에 대한 자세한 내용은 Azure Monitor 경고 유형을 참조 하세요.

경고 유형 설명
메트릭 경고 메트릭 경고는 정기적으로 리소스 메트릭을 평가합니다. 메트릭은 플랫폼 메트릭, 사용자 지정 메트릭, 메트릭으로 변환된 Azure Monitor의 로그 또는 Application Insights 메트릭일 수 있습니다. 메트릭 경고는 여러 조건과 동적 임계값을 적용할 수도 있습니다.
로그 검색 경고 로그 검색 경고를 사용하면 사용자가 Log Analytics 쿼리를 사용하여 미리 정의된 빈도로 리소스 로그를 평가할 수 있습니다.
활동 로그 경고 활동 로그 경고는 정의된 조건과 일치하는 새 활동 로그 이벤트가 발생할 때 트리거됩니다. Resource Health 경고 및 Service Health 경고는 서비스 및 Resource Health를 보고하는 활동 로그 경고입니다.
스마트 검색 경고 Application Insights 리소스에 대한 스마트 검색은 웹 애플리케이션의 잠재적인 성능 문제와 오류 이상에 대해 자동으로 경고해 줍니다. Application Insights 리소스에서 스마트 검색을 마이그레이션하여 다양한 스마트 검색 모듈에 대한 경고 규칙을 만들 수 있습니다.
Prometheus 경고 Prometheus 경고는 Azure Monitor Prometheus용 관리 서비스에 저장된 Prometheus 메트릭에 대한 경고에 사용됩니다. 경고 규칙은 PromQL 오픈 소스 쿼리 언어를 기반으로 합니다.

경고 및 상태

경고는 상태 저장형이거나 상태 비저장형일 수 있습니다.

  • 상태 비저장 경고는 이전에 발생했더라도 조건이 충족될 때마다 발생합니다.
  • 상태 저장 경고는 규칙 조건이 충족되면 실행되고 조건이 해결될 때까지 다시 실행되거나 더 이상 작업을 트리거하지 않습니다.

경고는 30일 동안 저장되며 30일 보존 기간이 지나면 삭제됩니다.

상태 비저장 경고

상태 비저장 경고는 조건이 충족될 때마다 발생합니다. 모든 상태 비저장 경고의 경고 조건은 항상 fired입니다.

  • 모든 활동 로그 경고는 상태 비저장입니다.
  • 상태 비지정 메트릭 경고에 대한 알림 빈도는 경고 규칙의 구성된 빈도에 따라 다릅니다.
    • 5분 미만의 경고 빈도: 조건이 계속 충족되는 동안 1~6분 사이에 알림이 전송됩니다.
    • 5분 이상의 경고 빈도: 조건이 계속 충족되는 동안 구성된 빈도 간에 알림이 전송되고 빈도의 두 배가 됩니다. 예를 들어 빈도가 15분인 경고 규칙의 경우 15~30분 사이에 알림이 전송됩니다.

상태 저장 경고

상태 저장 경고는 규칙 조건이 충족되면 실행되고 조건이 해결될 때까지 다시 실행되거나 더 이상 작업을 트리거하지 않습니다. 상태 저장 경고에 대한 경고 조건은 해결된 것으로 간주될 때까지 fired입니다. 경고가 해결된 것으로 간주되면 경고 규칙은 웹후크 또는 이메일을 사용하여 해결된 알림을 보내고 경고 조건은 resolved로 설정됩니다.

상태 저장 경고의 경우 경고 자체는 30일 후에 삭제되지만 경고가 해결될 때까지 경고 조건은 저장되어 다른 경고가 발생하지 않도록 하고 경고가 해결되면 알림을 보낼 수 있도록 합니다.

상태 저장 로그 검색 경고에는 제한 사항이 있습니다. 자세한 내용은 여기를 참조하세요.

이 표에서는 상태 저장 경고가 해결된 것으로 간주되는 시기를 설명합니다.

경고 유형 경고는 다음과 같은 경우에 해결됩니다.
메트릭 경고 세 번의 연속 검사에 대해 경고 조건이 충족되지 않습니다.
로그 검색 경고 특정 시간 범위에 대해 경고 조건이 충족되지 않습니다. 시간 범위는 경고 빈도에 따라 다릅니다.
  • 1분: 경고 조건이 10분 동안 충족되지 않습니다.
  • 5~15분: 3개의 빈도 기간 동안 경고 조건이 충족되지 않습니다.
  • 15분에서 11시간: 두 개의 빈도 기간 동안 경고 조건이 충족되지 않습니다.
  • 11-12시간: 경고 조건이 1번의 빈도 기간 동안 충족되지 않습니다.

Azure Portal에서 권장되는 기본 경고 규칙을 사용하도록 설정할 수 있습니다.

시스템은 다음을 기반으로 권장되는 경고 규칙 목록을 컴파일합니다.

  • 리소스를 모니터링하는 데 중요한 신호 및 임계값에 대한 리소스 공급자의 지식.
  • 이 리소스에 대해 고객이 일반적으로 경고하는 내용을 알려 주는 데이터입니다.

참고 항목

권장되는 경고 규칙은 다음을 위해 사용하도록 설정됩니다.

  • 가상 머신
  • AKS 리소스
  • Log Analytics 작업 영역

대규모 경고

대규모 경고 규칙을 만들기 위해 다음 방법 중 원하는 방법을 사용할 수 있습니다. 각 선택에는 비용 및 경고 규칙의 기본 감쇠에 영향을 줄 수 있는 장단점이 있습니다.

메트릭 경고

하나의 메트릭 경고 규칙을 사용하여 동일한 Azure 지역에 있는 동일한 유형의 여러 리소스 를 모니터링할 수 있습니다. 모니터링되는 각 리소스에 대해 개별 알림이 전송됩니다. 현재 이 기능에 대해 지원되는 Azure 서비스 목록은 Azure Monitor에서 메트릭 경고에 대해 지원되는 리소스를 참조하세요.

여러 리소스를 지원하지 않는 Azure 서비스에 대한 메트릭 경고 규칙의 경우 Azure CLI, PowerShell 또는 Azure Resource Manager 템플릿과 같은 자동화 도구를 사용하여 여러 리소스에 대해 동일한 경고 규칙을 만듭니다. 샘플 ARM 템플릿은 Azure Monitor의 메트릭 경고 규칙에 대한 Resource Manager 템플릿 샘플을 참조하세요.

각 메트릭 경고 규칙은 모니터링되는 시계열 수에 따라 요금이 청구됩니다.

로그 검색 경고

로그 검색 경고 규칙을 사용하여 Log Analytics 작업 영역으로 데이터를 보내는 모든 리소스를 모니터링합니다. 이러한 리소스는 모든 구독 또는 지역에서 사용할 수 있습니다. Log Analytics 작업 영역을 설정할 때 데이터 수집 규칙을 사용하여 로그 검색 경고 규칙에 필요한 데이터를 수집합니다.

차원별 분할을 사용하여 작업 영역 중심 경고 대신 리소스 중심 경고를 만들 수도 있습니다. resourceId 열을 분할하면 조건을 충족하는 리소스당 하나의 경고가 표시됩니다.

차원별로 분할을 사용하는 로그 검색 경고 규칙은 쿼리에서 생성된 차원에 의해 생성된 시계열 수에 따라 요금이 청구됩니다. 데이터가 Log Analytics 작업 영역에 이미 수집된 경우 추가 비용은 없습니다.

Log Analytics 작업 영역에서 대규모로 메트릭 데이터를 사용하는 경우 데이터 수집에 따라 가격이 변경됩니다.

대규모 경고에 Azure 정책 사용

Azure 정책을 사용하여 대규모로 경고를 설정할 수 있습니다. 이렇게 하면 대규모 경고를 쉽게 구현할 수 있다는 장점이 있습니다. Azure Monitor 기준 경고를 사용하여 구현되는 방법을 확인할 수 있습니다.

정책을 사용하여 경고 규칙을 만드는 경우 큰 경고 규칙 집합을 기본 오버헤드가 증가할 수 있습니다.

경고에 대한 Azure 역할 기반 액세스 제어

권한이 있는 리소스에 대해서만 경고를 액세스, 생성 또는 관리할 수 있습니다.

경고 규칙을 만들려면 다음이 있어야 합니다.

  • 경고 규칙의 대상 리소스에 대한 읽기 권한.
  • 경고 규칙이 만들어지는 리소스 그룹에 대한 쓰기 권한. Azure Portal에서 경고 규칙을 만드는 경우 경고 규칙은 기본적으로 대상 리소스가 있는 동일한 리소스 그룹에 만들어집니다.
  • 해당하는 경우 경고 규칙과 연결된 모든 작업 그룹에 대한 읽기 권한입니다.

모든 Azure Resource Manager 범위에서 지원되는 이러한 기본 제공 Azure 역할에는 경고 정보에 대한 권한이 있고 액세스할 수 있으며 경고 규칙을 만들 수 있습니다.

  • 모니터링 기여자: 기여자 경고를 만들고 해당 범위 내에서 리소스를 사용할 수 있습니다.
  • 판독기 모니터링: 판독기는 해당 범위 내에서 경고를 보고 리소스를 읽을 수 있습니다.

대상 작업 그룹 또는 규칙 위치가 두 개의 기본 제공 역할과 다른 범위에 있는 경우 적절한 권한이 있는 사용자를 만듭니다.

가격 책정

가격 책정에 대한 자세한 내용은 Azure Monitor 가격 책정을 참조하세요.

다음 단계