다음을 통해 공유


비즈니스 연속성 및 재해 복구

재해는 하드웨어 오류, 자연 재해 또는 소프트웨어 오류일 수 있습니다. 재해를 준비하고 복구하는 프로세스를 DR(재해 복구)이라고 합니다. 이 문서에서는 Azure Operator Insights에 대한 BCDR(비즈니스 연속성 및 재해 복구)을 달성하기 위한 권장 사례를 설명합니다.

BCDR 전략에는 가용성 영역 중복 및 사용자 관리 복구가 포함됩니다.

제어 평면

Azure Operator Insights 컨트롤 플레인은 소프트웨어 오류 및 가용성 영역의 실패 모두에 대해 복원력이 있습니다. 데이터 제품을 만들고 관리하는 기능은 이러한 실패 모드의 영향을 받지 않습니다.

컨트롤 플레인은 지역적으로 중복되지 않습니다. Azure 지역에서 중단이 발생하는 경우 해당 지역에 새 데이터 제품을 만들거나 기존 제품에 액세스/관리할 수 없습니다. 지역의 중단이 복구되면 기존 데이터 제품에 다시 액세스하고 관리할 수 있습니다.

데이터 평면

데이터 제품은 소프트웨어 또는 하드웨어 오류에 대한 복원력이 있습니다. 예를 들어 소프트웨어 버그로 인해 서비스가 중단되거나 하드웨어 오류로 인해 보강 쿼리를 위한 컴퓨팅 리소스가 손실되면 서비스가 자동으로 복구합니다. 유일한 영향이라면 데이터 제품의 스토리지 엔드포인트 및 KQL 사용량 URL에서 새로 수집된 데이터를 사용할 수 있게 될 때까지 약간 지연된다는 것입니다.

영역 중복

데이터 제품은 영역 중복을 지원하지 않습니다. 가용성 영역이 실패하면 데이터 제품의 수집, BLOB/DFS 및 KQL/SQL API를 모두 사용할 수 없게 되며 대시보드가 작동하지 않습니다. 이미 수집된 데이터의 변환이 일시 중지됩니다. 이전에 수집한 데이터는 손실되지 않습니다. 가용성 영역이 복구되면 처리가 다시 시작됩니다.

가용성 영역 중단 중에 생성된 데이터가 어떻게 되는지는 수집 에이전트의 동작에 따라 달라집니다.

  • 수집 에이전트가 데이터를 버퍼링하고 가용성 영역이 복구될 때 다시 전송하는 경우 데이터는 손실되지 않습니다. Azure Operator Insights가 변환 백로그를 통해 작업하는 데 다소 시간이 걸릴 수 있습니다.
  • 그러지 않으면 데이터가 손실됩니다.

재해 복구

Azure Operator Insights에는 기본적으로 지역 중복성이 없습니다. 지역 중단은 가용성 영역 실패와 동일한 방식으로 데이터 제품에 영향을 줍니다. 전체 Azure 지역의 실패를 처리하려는 고객을 지원하기 위한 권장 사항 및 기능이 제공됩니다.

사용자 관리형 중복

최대 중복을 위해 활성-활성 모드에서 데이터 제품을 배포할 수 있습니다. 선택한 백업 Azure 지역에 두 번째 데이터 제품을 배포하고 수집 에이전트를 구성하여 데이터를 두 데이터 제품으로 동시에 포크합니다. 백업 데이터 제품은 주 지역의 실패에 영향을 받지 않습니다. 지역 중단 시 백업 데이터 제품을 데이터 원본으로 사용하는 대시보드를 살펴봅니다. 이 아키텍처는 솔루션의 비용을 두 배로 늘립니다.

또는 활성-수동 모드를 사용할 수 있습니다. 백업 Azure 지역에 두 번째 데이터 제품을 배포하고 주 데이터 제품으로 보내도록 수집 에이전트를 구성합니다. 지역 가동 중단 시 지역 가동 중단 시 백업 데이터 제품으로 데이터를 보내도록 수집 에이전트를 다시 구성합니다. 이 아키텍처는 중단 중에 생성된 데이터에 대한 모든 권한을 부여하지만(수집 에이전트를 다시 구성하는 시간부터), 중단 중에는 해당 시간 이전에 수집된 데이터에 액세스할 수 없습니다. 이 아키텍처에는 두 번째 데이터 제품에 대한 약간의 인프라 요금이 필요하지만 추가 데이터 처리 요금은 없습니다.