BCP 기능 유효성 검사 이해

완료됨

기능 유효성 검사는 ERCM 수명 주기의 필수적인 부분입니다. 여기에는 이론과 실제 모두에서 BCP(비즈니스 연속성 계획) 효율성을 테스트하는 작업이 포함됩니다. 각 서비스 팀은 BCP를 정기적으로 테스트하여 계획 효과와 서비스 팀이 계획을 실행할 준비를 측정합니다. ERCM 프로그램 지침에 따라 BCP 및 기능 유효성 검사에 대한 연간 검토는 마지막 검토 후 12개월 이내에 수행해야 하며 BIA 및 DA와 같은 지원 설명서의 검토를 포함해야 합니다.

기능 유효성 검사 단계: - 시나리오 개발, - 유효성 검사 수행, - 결과 문서화, - 격차 및 개선 사항 식별

유효성 검사 수준

다양한 잠재적 인시던트에 대한 복원력 및 복구 전략의 유효성을 검사하기 위해 ERCM 프로그램은 사람, 위치 및 기술에 영향을 주는 여러 범주의 테스트 시나리오를 정의합니다. 개별 서비스 팀은 ERCM 테스트 시나리오 지침 내에서 고유한 특정 테스트를 자유롭게 정의할 수 있습니다.

테스트 시나리오의 예는 다음과 같습니다.

  • 기본 건물 또는 캠퍼스 클러스터 손실
  • 기술 중단
  • 지역 네트워크 중단
  • 중요한 타사 중단
  • 인력 중단
  • 광범위한 지역 이벤트
  • 단일 데이터 센터 손실
  • 사이버 공격
  • 팬데믹

각 테스트 시나리오의 컨텍스트 내에서 Microsoft는 기능이 테스트되지 않았음을 의미하는 0에서 테스트 중에 기능이 완전히 활성화되었음을 의미하는 7까지 8단계의 유효성 검사를 정의합니다. 수준 1~4는 프로덕션 환경 외부에서 비즈니스 연속성 계획의 기능을 테스트합니다. 수준 5~7에서는 프로덕션 환경 내에서 복구 전략에 대한 더욱 엄격한 유효성 검사가 필요하며 수준 7에서는 모든 종속성을 포함하여 전체 애플리케이션 에코시스템에 대한 복구 계획 유효성 검사가 필요합니다. 각 서비스에 필요한 유효성 검사 수준은 서비스의 중요도를 기반으로 하며 더 중요한 서비스는 더 엄격한 유효성 검사를 받습니다. Service Trust Portal에서 사용할 수 있는 분기별 보고서를 통해 고객이 사용할 수 있는 Microsoft Online Services 선택에 대한 기능 유효성 검사 결과를 만듭니다.

서비스에 영향을 미치는 인시던트에 대응

기능 유효성 검사 및 지속적인 BCM 개선의 가치는 Microsoft가 서비스에 영향을 미치는 인시던트에 대응하기 위해 비즈니스 연속성 계획을 실행해야 할 때 분명해집니다. 허리케인 하비(Harvey)가 텍사스를 강타하여 샌 안토니오 데이터 센터에 영향이 예상되었을 때 Exchange Online 팀은 비즈니스 연속성 계획을 활성화하여 데이터 센터에서 트래픽을 사전에 제거하여 고객에게 미치는 영향을 방지했습니다. 위협이 지나고 나면 명확하게 정의된 복구 프로세스에 따라 데이터 센터가 인시던트 없이 정상 운영으로 돌아갔습니다. 이러한 프로세스는 Exchange Online이 이전 자연 재해에서 얻은 교훈을 기반으로 연속성 계획을 업데이트하고 테스트하여 실제 비상 상황에서 계획이 효과적인지 확인했기 때문에 마련되었습니다.

내부 인시던트에서 얻은 교훈도 비즈니스 연속성 개선을 지원합니다. Microsoft 기업 네트워크에서 잘못된 그룹 정책 배포로 인해 DNS 중단이 발생했을 때 기업 네트워크가 별도의 장애 영역에서 상용 서비스와 격리되었기 때문에 고객은 어떠한 영향도 받지 않았습니다. 그러나 Microsoft의 내부 커뮤니케이션이 영향을 받아 인시던트 해결을 위한 조정이 더 어려워졌습니다. 이 인시던트로 인해 내부 커뮤니케이션에 영향을 미치는 사건이 발생하는 동안 Microsoft 팀 간의 협업을 가능하게 하는 긴급 프로토콜이 만들어졌습니다.

자세한 정보