Azure Cosmos DB 모니터링

이 문서에서는 다음을 설명합니다.

  • 이 서비스에 대해 수집할 수 있는 모니터링 데이터의 유형.
  • 해당 데이터를 분석하는 방법.

참고 항목

이 서비스 및/또는 Azure Monitor에 이미 익숙하고 모니터링 데이터를 분석하는 방법만 알고 싶은 경우 이 문서의 끝부분에 있는 분석 섹션을 참조하세요.

Azure 리소스를 사용하는 중요한 애플리케이션 및 비즈니스 프로세스가 있는 경우 시스템을 모니터링하고 시스템에 대한 경고를 받아야 합니다. Azure Monitor 서비스는 시스템의 모든 구성 요소에서 메트릭과 로그를 수집하고 집계합니다. Azure Monitor는 가용성, 성능, 복원력에 대한 보기를 제공하고 문제를 알려 줍니다. Azure Portal, PowerShell, Azure CLI, REST API 또는 클라이언트 라이브러리를 사용하여 모니터링 데이터를 설정하고 볼 수 있습니다.

Insights

Azure의 일부 서비스에는 서비스 모니터링을 위한 시작점을 제공하는 모니터링 대시보드가 Azure Portal에 있습니다. 이러한 대시보드를 인사이트라고 하며, Azure Portal에서 Azure Monitor의 Insights Hub에서 찾을 수 있습니다.

Azure Cosmos DB Insights

Azure Cosmos DB 인사이트는 Azure Monitor 통합 문서 기능을 기반으로 하는 기능입니다. Azure Cosmos DB 인사이트를 사용하여 모든 Azure Cosmos DB 리소스의 전체 성능, 실패, 용량 및 운영 상태를 통합된 대화형 환경에서 파악합니다.

Azure Cosmos DB 인사이트에 대한 자세한 내용은 다음 문서를 참조하세요.

리소스 유형

Azure는 리소스 유형 및 ID의 개념을 사용하여 구독의 모든 항목을 식별합니다. 마찬가지로 Azure Monitor는 네임스페이스라고도 하는 리소스 유형에 따라 핵심 모니터링 데이터를 메트릭 및 로그로 구성합니다. 리소스 유형에 따라 다른 메트릭 및 로그를 사용할 수 있습니다. 서비스는 둘 이상의 리소스 유형과 연결될 수 있습니다.

리소스 유형은 Azure에서 실행되는 모든 리소스에 대한 리소스 ID의 일부이기도 합니다. 예를 들어 가상 머신의 리소스 유형 중 하나는 Microsoft.Compute/virtualMachines입니다. 서비스 및 관련 리소스 유형 목록은 리소스 공급자를 참조하세요.

Azure Cosmos DB의 리소스 종류에 대한 자세한 내용은 Azure Cosmos DB 모니터링 데이터 참조를 참조하세요.

데이터 저장소

Azure Monitor의 경우:

  • 메트릭 데이터는 Azure Monitor 메트릭 데이터베이스에 저장됩니다.
  • 로그 데이터는 Azure Monitor 로그 저장소에 저장됩니다. 로그 분석은 이 저장소를 쿼리할 수 있는 Azure Portal의 도구입니다.
  • Azure 활동 로그는 Azure Portal에 자체 인터페이스가 있는 별도의 저장소입니다.

선택적으로 메트릭 및 활동 로그 데이터를 Azure Monitor 로그 저장소로 라우팅할 수 있습니다. 그런 다음 Log Analytics를 사용하여 데이터를 쿼리하고 다른 로그 데이터와 상호 연결할 수 있습니다.

많은 서비스에서는 진단 설정을 사용하여 메트릭 및 로그 데이터를 Azure Monitor 외부의 다른 스토리지 위치로 보낼 수 있습니다. 예를 들면 Azure Storage, 호스트된 파트너 시스템Event Hubs를 사용하는 비 Azuree 파트너 시스템이 있습니다.

Azure Monitor가 데이터를 저장하는 방법에 대한 자세한 내용은 Azure Monitor 데이터 플랫폼을 참조하세요.

Azure Monitor 플랫폼 메트릭

Azure Monitor는 대부분의 서비스에 대한 플랫폼 메트릭을 제공합니다. 이러한 메트릭은 다음과 같습니다.

  • 각 네임스페이스에 대해 개별적으로 정의됩니다.
  • Azure Monitor 시계열 메트릭 데이터베이스에 저장됩니다.
  • 간단하며 실시간에 가까운 경고를 지원할 수 있습니다.
  • 시간 경과에 따른 리소스의 성능을 추적하는 데 사용됩니다.

수집: Azure Monitor는 플랫폼 메트릭을 자동으로 수집합니다. 구성이 필요하지 않습니다.

라우팅: 일반적으로 플랫폼 메트릭을 Azure Monitor 로그/Log Analytics로 라우팅하여 다른 로그 데이터로 쿼리할 수도 있습니다. 자세한 내용은 메트릭 진단 설정을 참조하세요. 서비스에 대한 진단 설정을 구성하는 방법은 Azure Monitor에서 진단 설정 만들기를 참조하세요.

Azure Monitor의 모든 리소스에 대해 수집할 수 있는 모든 메트릭 목록은 Azure Monitor에서 지원되는 메트릭을 참조하세요.

Azure Monitor는 기본적으로 Azure Cosmos DB 메트릭을 수집합니다. 명시적으로 아무것도 구성할 필요가 없습니다. 대부분의 메트릭은 Azure Cosmos DB 포털 페이지 또는 Azure Monitor 페이지에서 사용할 수 있습니다. 기본적으로 이러한 메트릭은 1분 세분성으로 수집됩니다. 세분성은 선택한 메트릭에 따라 다를 수 있습니다. 기본값으로 이러한 메트릭의 보존 기간은 30일입니다.

Azure Cosmos DB 서버 쪽 메트릭에는 처리량, 스토리지, 가용성, 대기 시간, 일관성 및 시스템 수준 메트릭이 포함됩니다. 클라이언트 쪽에서는 요청 요금, 작업 ID, 예외 및 스택 추적 정보, HTTP 상태 및 하위 상태 코드, 진단 문자열에 대한 세부 정보를 수집할 수 있습니다. 기본적으로 이러한 메트릭의 보존 기간은 7일입니다. 이 데이터는 문제를 디버그하거나 Azure Cosmos DB 지원 팀에 문의해야 하는 경우에 사용할 수 있습니다.

컨테이너 이름과 같은 메트릭의 차원 값은 대/소문자를 구분하지 않습니다. 이러한 상황은 이러한 이름을 가진 컨테이너에 대한 원격 분석 및 작업의 혼동 또는 충돌을 초래할 수 있습니다. 이러한 차원 값에 대한 문자열 비교를 수행할 때 대/소문자를 구분하지 않는 비교를 사용합니다.

Azure Cosmos DB에 사용 가능한 메트릭 목록은 Azure Cosmos DB 모니터링 데이터 참조를 참조하세요.

비Azure Monitor 기반 메트릭

이 서비스는 Azure Monitor 메트릭 데이터베이스에 포함되지 않은 다른 메트릭을 제공합니다.

Azure Monitor 리소스 로그

리소스 로그는 Azure 리소스에서 수행한 작업에 대한 인사이트를 제공합니다. 로그는 자동으로 생성되지만 저장하거나 쿼리하려면 로그를 Azure Monitor 로그로 라우팅해야 합니다. 로그는 범주별로 구성됩니다. 지정된 네임스페이스에는 여러 리소스 로그 범주가 있을 수 있습니다.

수집: 리소스 로그는 진단 설정을 만들고 하나 이상의 위치로 라우팅할 때까지 수집 및 저장되지 않습니다. 진단 설정을 만들 때 수집할 로그 범주를 지정합니다. 진단 설정을 만들고 유지 관리하는 방법에는 Azure Portal, 프로그래밍 방식, Azure Policy 사용 등을 포함한 여러 가지 방법이 있습니다.

라우팅: 제안되는 기본값은 리소스 로그를 Azure Monitor 로그로 라우팅하여 다른 로그 데이터로 쿼리할 수 있도록 하는 것입니다. Azure Storage, Azure Event Hubs, 특정 Microsoft 모니터링 파트너와 같은 다른 위치도 사용할 수 있습니다. 자세한 내용은 Azure 리소스 로그리소스 로그 대상을 참조하세요.

리소스 로그 수집, 저장 및 라우팅에 대한 자세한 내용은 Azure Monitor의 진단 설정을 참조하세요.

Azure Monitor에서 사용 가능한 모든 리소스 로그 범주 목록은 Azure Monitor에서 지원되는 리소스 로그를 참조하세요.

Azure Monitor의 모든 리소스 로그에는 동일한 헤더 필드와 서비스별 필드가 있습니다. 공용 스키마는 Azure Monitor 리소스 로그 스키마에서 설명합니다.

Azure Cosmos DB 계정의 진단 로그를 모니터링하고 Azure Monitor에서 대시보드를 만들 수 있습니다. 두 번째 세분성에서 발생하는 이벤트 및 추적과 같은 데이터는 로그로 저장됩니다. 예를 들어, 컨테이너의 처리량이 변경되면 Azure Cosmos DB 계정의 속성이 변경됩니다. 로그는 이러한 이벤트를 캡처합니다. 수집된 데이터에 대해 쿼리를 실행하여 이러한 로그를 분석할 수 있습니다.

사용 가능한 리소스 로그 범주, 관련 Log Analytics 테이블 및 Azure Cosmos DB용 로그 스키마는 Azure Cosmos DB 모니터링 데이터 참조를 참조하세요.

Azure 활동 로그

활동 로그에는 해당 리소스의 외부에서 볼 때 각 Azure 리소스에 대한 작업을 추적하는 구독 수준 이벤트(예: 새 리소스 만들기 또는 가상 머신 시작)가 포함되어 있습니다.

수집: 활동 로그 이벤트는 자동으로 생성되고 별도의 저장소에 수집되어 Azure Portal에서 볼 수 있습니다.

라우팅: 다른 로그 데이터와 함께 분석할 수 있도록 활동 로그 데이터를 Azure Monitor 로그로 보낼 수 있습니다. Azure Storage, Azure Event Hubs, 특정 Microsoft 모니터링 파트너와 같은 다른 위치도 사용할 수 있습니다. 활동 로그를 라우팅하는 방법에 대한 자세한 내용은 Azure 활동 로그 개요를 참조하세요.

모니터링 데이터 분석

모니터링 데이터를 분석하기 위한 많은 도구가 있습니다.

Azure Monitor 도구

Azure Monitor는 다음과 같은 기본 도구를 지원합니다.

더 복잡한 시각화를 허용하는 도구는 다음과 같습니다.

  • 대시보드: 다양한 종류의 데이터를 Azure Portal에서 하나의 창에 결합할 수 있습니다.
  • 통합 문서: Azure Portal에서 만들 수 있는 사용자 지정 가능한 보고서입니다. 통합 문서에는 텍스트, 메트릭, 로그 쿼리가 포함될 수 있습니다.
  • Grafana: 뛰어난 운영 대시보드를 제공하는 개방형 플랫폼 도구입니다. Grafana를 사용하여 Azure Monitor 외의 여러 소스에서 온 데이터를 포함하는 대시보드를 만들 수 있습니다.
  • Power BI: 다양한 데이터 소스에서 대화형 시각화를 제공하는 비즈니스 분석 서비스입니다. Azure Monitor에서 자동으로 로그 데이터를 가져오도록 Power BI를 구성하여 이러한 시각화를 활용할 수 있습니다.

Azure Monitor 내보내기 도구

다음 방법을 사용하여 Azure Monitor에서 다른 도구로 데이터를 내보낼 수 있습니다.

Azure Monitor용 REST API를 시작하려면 Azure 모니터링 REST API 연습을 참조하세요.

Azure Cosmos DB 메트릭 분석

Azure Monitor 메트릭 탐색기를 사용하여 Azure Cosmos DB 계정 포털 탐색의 모니터링 아래에서 메트릭을 선택해 다른 Azure 서비스의 메트릭으로 Azure Cosmos DB에 대한 메트릭을 분석할 수 있습니다. 메트릭 탐색기를 사용하는 방법에 대한 자세한 내용은 Azure Monitor 메트릭 탐색기로 메트릭 분석을 참조하세요.

또한 Azure Cosmos DB 리소스에 대한 서버 쪽 대기 시간, 요청 단위 사용량 및 정규화된 요청 단위 사용량을 모니터링할 수 있습니다. 요청 단위, 스토리지, 대기 시간, 가용성, Cassandra 등과 관련된 메트릭을 선택할 수 있습니다.

클라이언트 쪽에서는 요청 요금, 작업 ID, 예외 및 스택 추적 정보, HTTP 상태 및 하위 상태 코드, 진단 문자열에 대한 메트릭을 수집하여 문제를 디버그할 수 있습니다.

자세한 내용과 관련 지침은 다음 문서를 참조하세요.

Azure Monitor에서 지원되는 모든 리소스 메트릭 목록은 지원되는 Azure Monitor 메트릭을 참조하세요. Azure Cosmos DB에 대해 수집되는 플랫폼 메트릭의 목록은 Azure Cosmos DB 데이터 참조 메트릭 모니터링을 참조하세요.

프로그래밍 방식으로 Azure Cosmos DB 모니터링

포털에서 제공되는 계정 수준 메트릭(예: 계정 스토리지 사용 및 총 요청)은 API for NoSQL을 통해 사용할 수 없습니다. 그러나 API for NoSQL을 사용하여 컬렉션 수준에서 사용량 현황 데이터를 검색할 수 있습니다. 컬렉션 수준 데이터를 검색하려면 다음 방법 중 하나를 사용합니다.

  • REST API를 사용하려면 컬렉션에 대해 GET을 수행합니다. 컬렉션에 대한 할당량 및 사용량 정보는 응답의 x-ms-resource-quotax-ms-resource-usage 헤더에 반환됩니다.

  • .NET SDK를 사용하려면 DocumentClient.ReadDocumentCollectionAsync 메서드를 사용합니다. 이 메서드는 CollectionSizeUsage, DatabaseUsage, DocumentUsage 등의 여러 사용량 속성이 포함된 ResourceResponse를 반환합니다.

더 많은 메트릭에 액세스하려면 Azure Monitor SDK를 사용합니다. 사용 가능한 메트릭 정의는 다음 형식을 사용하여 검색할 수 있습니다.

https://management.azure.com/subscriptions/{SubscriptionId}/resourceGroups/{ResourceGroup}/providers/Microsoft.DocumentDb/databaseAccounts/{DocumentDBAccountName}/providers/microsoft.insights/metricDefinitions?api-version=2018-01-01

개별 메트릭을 검색하기 위해 다음 형식을 사용합니다.

https://management.azure.com/subscriptions/{SubscriptionId}/resourceGroups/{ResourceGroup}/providers/Microsoft.DocumentDb/databaseAccounts/{DocumentDBAccountName}/providers/microsoft.insights/metrics?timespan={StartTime}/{EndTime}&interval={AggregationInterval}&metricnames={MetricName}&aggregation={AggregationType}&`$filter={Filter}&api-version=2018-01-01

자세한 내용은 Azure 모니터링 REST API를 참조하세요.

Azure Cosmos DB 로그 분석

Azure Monitor 로그의 데이터는 테이블에 저장됩니다. 각 테이블에는 고유한 속성 집합이 있습니다. Azure Monitor의 모든 리소스 로그에는 동일한 필드와 그 뒤에 오는 서비스별 필드가 있습니다. 공용 스키마는 Azure Monitor 리소스 로그 스키마에서 설명합니다.

Azure Cosmos DB에 대해 수집된 리소스 로그 형식은 Azure Cosmos DB 모니터링 데이터 참조를 참조하세요.

Azure Cosmos DB용 Azure Monitor 로그 작업에 대한 자세한 내용은 다음 문서를 참조하세요.

Kusto 쿼리

KQL(Kusto 쿼리 언어)을 사용하여 Azure Monitor 로그/로그 분석 저장소에서 모니터링 데이터를 분석할 수 있습니다.

Important

포털의 서비스 메뉴에서 로그를 선택하면 쿼리 범위가 현재 서비스로 설정된 상태로 로그 분석이 열립니다. 이 범위는 로그 쿼리에 해당 유형의 리소스의 데이터만 포함된다는 의미입니다. 다른 Azure 서비스의 데이터를 포함하는 쿼리를 실행하려면 Azure Monitor 메뉴에서 로그를 선택합니다. 자세한 내용은 Azure Monitor Log Analytics의 로그 쿼리 범위 및 시간 범위를 참조하세요.

모든 서비스에 대한 일반적인 쿼리 목록은 로그 분석 쿼리 인터페이스를 참조하세요.

Log Analytics를 사용하여 Kusto 쿼리를 실행하기 전에 컨트롤 플레인 작업에 대한 진단 로그를 사용하도록 설정해야 합니다. 진단 로그를 사용하도록 설정할 때 리소스별 테이블 또는 단일 AzureDiagnostics 테이블(레거시)에 데이터를 저장할지 선택합니다. Kusto 쿼리의 정확한 텍스트는 선택한 컬렉션 모드에 따라 달라집니다.

로그 검색 검색 창에 입력하여 Azure Cosmos DB 리소스를 모니터링하는 데 도움을 받을 수 있는 몇몇 쿼리가 아래에 있습니다.

Azure Cosmos DB에서 모든 컨트롤 플레인 로그를 쿼리하려면 다음을 수행합니다.

CDBControlPlaneRequests

Azure Cosmos DB에서 모든 데이터 평면 로그를 쿼리하려면 다음을 수행합니다.

CDBDataPlaneRequests

단일 리소스와 관련된 필터링된 데이터 영역 로그 목록을 쿼리하려면 다음을 수행합니다.

CDBDataPlaneRequests
| where AccountName=="<account-name>"

리소스별로 그룹화된 데이터 영역 로그 수를 가져오려면 다음을 수행합니다.

CDBDataPlaneRequests
| summarize count() by AccountName

작업 형식별로 그룹화된 데이터 평면 로그에 대한 차트를 생성하려면 다음을 수행합니다.

CDBDataPlaneRequests
| summarize count() by OperationName
| render piechart

Azure Cosmos DB 문제를 해결하는 데 사용할 수 있는 Kusto 쿼리는 다음 문서를 참조하세요.

이러한 예제는 KQL(Kusto 쿼리 언어)을 사용하여 Azure Monitor에서 실행할 수 있는 다양한 쿼리의 작은 샘플일 뿐입니다. 더 많은 예제는 Kusto 쿼리 샘플을 참조하세요.

경고

Azure Monitor 경고는 모니터링 데이터에서 특정한 조건이 발견될 때 사용자에게 사전에 알립니다. 경고를 통해 사용자에게 알리기 전에 시스템 문제를 식별하고 해결할 수 있습니다. 자세한 내용은 Azure Monitor 경고을 참조하세요.

Azure 리소스에 대한 일반적인 경고의 소스에는 여러 가지가 있습니다. Azure 리소스에 대한 일반적인 경고의 예는 샘플 로그 경고 쿼리를 참조하세요. AMBA(Azure Monitor 기준 경고) 사이트는 중요한 플랫폼 메트릭 경고, 대시보드 및 지침을 구현하는 반자동 방법을 제공합니다. 이 사이트는 ALZ(Azure 랜딩 존)의 일부인 전체 서비스를 포함하여 지속적으로 확장되는 Azure 서비스 하위 집합에 적용됩니다.

공통 경고 스키마는 Azure Monitor 경고 알림의 사용을 표준화합니다. 자세한 내용은 일반 경고 스키마를 참조하세요.

경고 유형

Azure Monitor 데이터 플랫폼의 모든 메트릭 또는 로그 데이터 원본에 대해 경고할 수 있습니다. 모니터링하는 서비스 및 수집하는 모니터링 데이터에 따라 다양한 유형의 경고가 있습니다. 서로 다른 형식의 경고에는 다양한 장점과 단점이 있습니다. 자세한 내용은 올바른 모니터링 경고 유형 선택을 참조하세요.

다음 목록에서는 만들 수 있는 Azure Monitor 경고의 유형에 대해 설명합니다.

  • 메트릭 경고는 정기적으로 리소스 메트릭을 평가합니다. 메트릭은 플랫폼 메트릭, 사용자 지정 메트릭, 메트릭으로 변환된 Azure Monitor의 로그 또는 Application Insights 메트릭일 수 있습니다. 메트릭 경고는 여러 조건과 동적 임계값을 적용할 수도 있습니다.
  • 로그 경고를 사용하면 사용자가 로그 분석 쿼리를 사용하여 미리 정의된 빈도로 리소스 로그를 평가할 수 있습니다.
  • 활동 로그 경고는 정의된 조건과 일치하는 새 활동 로그 이벤트가 발생할 때 트리거됩니다. Resource Health 경고 및 Service Health 경고는 서비스 및 Resource Health를 보고하는 활동 로그 경고입니다.

일부 Azure 서비스는 스마트 검색 경고, Prometheus 경고 또는 권장 경고 규칙도 지원합니다.

일부 서비스의 경우 동일한 Azure 지역에 존재하는 동일한 형식의 여러 리소스에 동일한 메트릭 경고 규칙을 적용하여 대규모로 모니터링할 수 있습니다. 모니터링되는 각 리소스에 대해 개별 알림이 전송됩니다. 지원되는 Azure 서비스 및 클라우드에 대한 내용은 하나의 경고 규칙을 사용하여 여러 리소스 모니터링을 참조하세요.

Azure Cosmos DB 경고 규칙

다음 표에는 Azure Cosmos DB에 대한 몇 가지 일반 및 권장 경고 규칙이 나열되어 있습니다.

경고 유형 조건 설명
요청 단위에 대한 트래픽률 제한(메트릭 경고) 차원 이름: StatusCode, 연산자: 같음, 차원 값: 429 컨테이너 또는 데이터베이스가 프로비전된 처리량 제한을 초과하는 경우 경고합니다.
지역 장애 조치(failover) 연산자: 보다 큼, 집계 유형: 개수, 임계값: 1 단일 지역이 장애 조치(failover)되는 경우. 이 경고는 서비스 관리 장애 조치(failover)를 사용하도록 설정하지 않은 경우에 유용합니다.
키 회전(활동 로그 경고) 이벤트 수준: 정보 제공, 상태: 시작 계정 키가 회전될 때 경고합니다. 새 키로 애플리케이션을 업데이트할 수 있습니다.

Azure Cosmos DB에 대한 경고를 만드는 방법과 관련된 자세한 내용 및 지침은 메트릭에 대한 경고 만들기를 참조하세요. 논리 파티션 키에 대한 스토리지가 20GB에 근접하는지 모니터링하는 경고를 만들려면 논리 파티션 키 크기에 대한 경고 만들기를 참조하세요.

Advisor 권장 사항

일부 서비스의 경우 리소스 작업 중에 위험한 상태 또는 임박한 변경 사항이 발생하는 경우 해당 서비스에서 포털의 개요 페이지에 경고가 표시됩니다. 왼쪽 메뉴의 모니터링 아래 Advisor 권장 사항에서 해당 경고에 대한 자세한 정보와 권장 수정 사항을 찾을 수 있습니다. 정상적으로 작동하는 중에는 Advisor 권장 사항이 표시되지 않습니다.

Azure Advisor에 대한 자세한 내용은 Azure Advisor 개요를 참조하세요.