保護部署在 Azure Stack Hub 上的虛擬機器 - Modular Data Center (MDC)

請以本文為指南,計劃如何保護使用者部署在 Azure Stack Hub 上的虛擬機器 (VM)。

若要避免資料遺失和意外停機,請在 Azure Stack Hub 上,為 VM 型的應用程式實作資料保護和災害復原計劃。 所實作的保護計劃將取決於商務需求和應用程式的設計。 此計劃應遵循貴組織制訂的架構,而此架構應是依照組織的商務持續性和災害復原 (BC/DR) 的完善策略所建立。 如需 Azure Stack Hub 的 BC/DR 考量方面的高階概觀,請參閱 Azure Stack:商務持續性和災害復原的考量 (英文)。

應用程式復原目標

判斷組織對各應用程式停機時間和資料遺失的容許量。 將停機時間和資料遺失量化,您可以建立復原計劃,將對組織造成嚴重損壞的影響降到最低。 針對每個應用程式,請考量:

  • 復原時間目標 (RTO)
    RTO 是應用程式在事件發生之後可能無法使用的最大可接受時間。 例如,RTO 為 90 分鐘表示必須能夠在災害開始的 90 分鐘內,將應用程式還原為執行狀態。 如果您的 RTO 偏低,就可以讓第二個部署持續以待命狀態執行,從而防止區域性中斷。

  • 復原點目標 (RPO)
    RPO 是在災害期間可接受的最大資料遺失時間長度。 例如,如果您在每小時執行備份的單一資料庫中儲存資料,而且沒有複寫到其他資料庫,您可能會遺失最多一個小時的資料。

進行評量來訂定每個應用程式的 RTO 和 RPO。

另一個重要計量是平均復原時間 (MTTR),這是在失敗後還原應用程式所花費的平均時間。 MTTR 是系統的經驗值。 如果 MTTR 超過 RTO,系統失敗就會導致無法接受的商務中斷,因為將無法在定義的 RTO 內還原系統。

IaaS VM 的保護選項

備份 - 還原

虛擬機器型應用程式上最常見的保護配置就是使用備份軟體。 VM 的備份工作通常涵蓋作業系統、作業系統設定、應用程式二進位檔,以及 VM 中所包含的持續性應用程式資料。 備份是使用客體作業系統中的代理程式所建立,用於擷取應用程式、作業系統或檔案系統/磁碟區。 另一種無代理程式的方法,是依賴與 Azure Stack Hub API 的整合,以讀取 VM 設定的相關資訊,並建立與 VM 連接的磁碟快照。 請注意,Azure Stack Hub 不支援直接從 Hypervisor 備份。

規劃您的備份策略

從量化需要保護的 VM 執行個體數目開始,規劃您的備份策略及定義規模需求。 備份系統中的所有 VM,可能不是保護應用程式最有效的方式。 使用 Azure Stack Hub 時,若 VM 在擴展集或可用性設定組中,則不應在 VM 層級加以備份。 由於 VM 集合可縮減或擴增,因此會將這些 VM 視為暫時性 VM。在理想情況下,需要保存的資料均會位在個別存放庫中,例如資料庫或物件存放區。 如果應用程式是部署在擴增架構中,且包含必須保存和保護的資料,則需使用應用程式所提供的原生功能或依賴代理程式,在應用程式層級進行備份。

在 Azure Stack 上備份 VM 的重要考量:

  • 分類
    • 請考量使用者為 VM 備份選擇的模型。
    • 根據應用程式優先順序或業務上受到的影響,來定義復原服務等級協定 (SLA)。
  • 調整
    • 如果有大量新的 VM 正在上架時,請考慮交錯進行備份 (如果有備份需要)。
    • 評估可有效率地擷取並傳輸備份資料的備份產品,以盡可能減少解決方案上的資源內容。
    • 評估可有效率地使用增量或差異備份來儲存備份資料的備份產品,以盡可能減少完整備份環境中所有 VM 的需求。
  • Restore
    • 備份產品可還原虛擬磁碟、現有 VM 中的應用程式資料,或整個 VM 資源及相關聯的虛擬磁碟。 您需要的還原配置取決於您打算如何還原應用程式。 例如,您可以較輕鬆地從範本重新部署 SQL 伺服器,然後再還原資料庫,而不是還原整個 VM 或一組 VM。

複寫/手動容錯移轉

支援復原作業的替代方法,是將資料複寫至另一個環境。 您可以使用代理程式,將資料的範圍設定為應用程式 (例如資料庫複寫),或客體作業系統中的作業系統,或與 Azure Stack Hub ApI 整合,將資料範圍設在 VM 層級上。 發生災害時,需要容錯移轉至次要位置。 您可以透過應用程式 (例如 SQL 可用性群組),或在客體作業系統層級使用代理程式或叢集技術,以原生方式處理容錯移轉,也可在 VM 層級使用保護產品來執行此作業。

高可用性/自動容錯移轉

若應用程式原生支援高可用性,或依賴叢集軟體在節點間達到高可用性,則可在一個 Azure Stack Hub 的一組 VM 中,或是多個 Azure Stack Hub 執行個體間加以部署。 在所有情況下,一定要有某種程度的負載平衡,以確保應用程式流量正確地路由傳送。 在此設定中,應用程式可以從錯誤中自動復原。 針對本機硬體錯誤,Azure Stack Hub 基礎結構會在實體基礎結構中,實作高可用性和容錯功能。 針對計算層級錯誤,Azure Stack Hub 會以 N-1 設定使用縮放單位中的多個節點。 在 VM 層級中,可用性和擴展集會將縮放單位中的每個節點模擬為容錯網域,以確保節點層級的反親和性,讓節點失敗不會關閉分散式應用程式。

無保護

部分應用程式可能沒有需要保存的資料。 例如,用於開發和測試的 VM 通常不需要進行復原。 另一個範例是無狀態應用程式,可在發生失敗時,從 CI/CD 管線重新部署。 請務必找出不需要保護的應用程式,避免額外的 VM 保護。

後續步驟

本文提供一般指引,說明如何保護部署在 Azure Stack 上的使用者 VM。 如需有關如何使用 Azure 服務保護使用者 VM 的詳細資訊,請參閱:

合作夥伴產品