Share via


Microsoft Azure 事件整備程度 - Unified

宣告 Azure 事件時,我們會透過 Azure 服務健康狀態中的 [服務問題] 刀鋒視窗,將更新傳達給受影響的訂用帳戶或租用戶 (Azure 入口網站內)。

事件發生之前

我們建議您準備下列步驟,並協助保護您的組織:

收到通知並隨時更新影響您 Azure 服務的事件

  1. 在Azure 入口網站中熟悉 Azure 服務健康狀態 – 發生問題時可「前往」的位置。

  2. 設定服務健康狀態警示,以透過電子郵件、簡訊、Webhook 等方式將所有問題通知給您。在訂用帳戶層級,依服務,以及/或依區域。

    • 服務問題通知類型會警示您的組織,您的服務會受到服務事件的影響

    • 安全性諮詢通知類型會警示您的組織,您的服務會受到安全性事件或隱私權事件的影響。

    以下是基礎警示設定建議:

    • 針對服務問題、計劃性維護和健康情況諮詢類型:

      • 重要工作負載 – 為提供重要工作負載的訂用帳戶和服務設定警示。
      • 在 Azure 堆疊中設定基礎服務的警示:
        • 「網路基礎結構」服務 – Azure 堆疊中從 IaaS 到 SaaS,所有類型的工作負載和應用程式都仰賴的基礎層。
        • 「Microsoft Azure 入口網站」服務 – 用來管理 Azure 資源的基礎服務。 其多功能性會將它定位為「全擷取」服務,涵蓋各種案例,會影響將在此服務下傳達的摘要體驗。
    • 針對 Security Advisories 類型:

      • 所有 Azure 訂用帳戶和服務 – 通常不良的動作以較少使用的資源為目標,因此,此類警示必須涵蓋所有 Azure 資源

    此外, Azure 監視器基準警示 解決方案提供完整的指引和程式碼,可實作平台警示的基準,以及透過 Azure 環境中的原則和計畫來執行服務健康情況警示,並提供自動化或手動部署的選項。

  3. 請確定下列角色具有正確的連絡人資訊,並定期檢閱以維持最新狀態。 如需詳細資訊,請檢閱隨時掌握 Azure 安全性問題 - Azure 服務健康狀態 |Microsoft Learn)

  4. 請考慮使用健康狀態警示或已排程的事件,隨時掌握特定問題,讓您的人員和系統能夠得知特定問題和即將發生的維護事件。

若要瞭解 Azure 的通訊原則,請檢閱提升中斷體驗—自動化、通訊和透明度 | Azure 部落格和更新 | Microsoft Azure。

提高安全性和復原狀態,以避免或將事件的影響降到最低

  1. 檢閱並實施作業安全性最佳做法,以保護您的資料、應用程式和其他資產,特別是下列項目:

    • 強制執行多重要素驗證以減輕安全風險的疑慮。

    • 實施高風險使用者的警示。 設定條件式存取,以確保您在環境中有「存在風險的使用者」時收到通知。

    • 控制訂用帳戶在目錄中的進出。 基於控管目的,全域系統管理員可以允許或不允許目錄使用者變更其組織內未知的目錄。 這可確保您的組織能夠完整查看組織目錄下所使用的訂用帳戶,並防止移動可能移至未知目錄的訂用帳戶。

  2. 使用 Azure Well-Architected Framework (WAF) 和檢閱,將重要的工作負載可靠性、安全性等方面最佳化。 也請考慮這些動作,以補充 WAF 中的工作。

    • 利用整合到 [Azure Advisor] 刀鋒視窗下Azure 入口網站的可靠性活頁簿,檢閱應用程式的可靠性狀態、評估風險和計劃改進。

    • 擴充跨區域的工作負載/部署,以取得商務持續性和災害復原 (BCDR)。 使用已發佈的 Azure 區域配對完整清單。

    • 跨可用性區域展開區域內的工作負載/部署。

    • 請考慮適用於商務關鍵性工作負載的在 Azure 中隔離 VM - Azure 虛擬機器 | Microsoft Learn

    • 請考慮維護設定,以控制和管理許多 Azure 虛擬機器的更新

    • 請使用 Azure Chaos Studio 評估您的 Azure 應用程式復原能力。 將您的 Azure 應用程式受控于實際或模擬的受控錯誤,以觀察應用程式的復原能力,以及網路延遲、儲存體中斷、即將到期的密碼,以及資料中心中斷等中斷的回應。

    • 利用服務淘汰活頁簿,此活頁簿會整合到 [Azure Advisor] 刀鋒視窗下的 Azure 入口網站,作為服務淘汰的單一集中式資源層級檢視。 它可協助您評估影響、評估選項,以及規劃從淘汰服務和功能移轉。

請參照 Azure 的進階可靠性部落格,隨時掌握 Azure 持續復原工作的最新消息。

在事件期間

當您的金鑰訂用帳戶受到事件影響時,請務必了解有關此事件的相關通訊位置和方式:

  1. 檢閱 Azure 入口網站中的 Azure 服務健康狀態警示,以取得工程師的最新更新。

    • 請務必注意,「事件之前」一節中提及的特定角色連絡人 (亦即訂用帳戶管理員/擁有者、技術/隱私權連絡人、租用戶系統管理員) 也可能會收到安全性或隱私權事件的電子郵件通知。
  2. 如果存取入口網站時發生問題,請使用備用的公用 Azure 狀態頁面 azure.status.microsoft

  3. 如果 [狀態] 頁面發生問題,請在 「X」(舊稱 Twitter) 上透過 @AzureSupport 了解是否有任何更新。

為什麼要使用服務健康狀態,而不是公用的 [狀態] 頁面?

在出現潛在問題的最初跡象時,許多客戶會檢查我們的可公開存取狀態頁面 (例如 azure.status.microsoft) ,以查看我們的雲端服務是否有已知問題。 這些頁面只會顯示符合特定準則的廣泛問題,而不會顯示影響少數客戶的較小事件。

              (Azure 入口網站內的) Azure 服務健康狀態了解您管理的訂用帳戶和租用戶,因此它會針對任何影響您的資源的已知問題,顯示更精確的檢視。 其也可讓您設定警示,讓您可以自動收到通知。

何時適合開啟支援案例?

如果服務事件已經透過 [服務健康情況] 傳達,則此處會提供所有最新的資訊,並不需要開啟支援要求。 如果您認為自己受到服務事件的影響,但未在 [服務健康情況] 頁面中看到代表的問題,請開啟支援要求

如果還有收到的安全性問題資料未涵蓋問題,請參照追蹤識別碼來開啟支援要求

事件之後

  1. Azure 服務健康狀態的 [健康情況歷程記錄] 窗格 (或透過客戶設定的服務健康狀態警示) 閱讀事件後檢閱 (PIR),以瞭解我們所學到的內容。

  2. 對於符合公開狀態頁面準則的主要事件,請加入 Azure 事件回顧即時資料流以取得所有問題的解答,或觀看錄製內容。

  3. 如果您認為您可能符合 SLA 信用額度資格,請建立問題類型為「退款要求」的新支援要求,並包含事件追蹤識別碼。