SAP 工作負載的災害復原概觀和基礎結構指導方針

許多在 Azure 上執行重要商務應用程式的組織都會設定高可用性 (HA) 和災害復原 (DR) 策略。 高可用性的目的是藉由消除基礎系統基礎結構中的單一失敗點來增加商務系統的 SLA。 高可用性技術可降低非計劃性基礎結構失敗的影響,並協助進行計劃性維護。 災害復原定義為原則、工具和程式,以在地理上廣泛或人為引發的災害之後,啟用重要技術基礎結構和系統的復原或延續。

為了達到 Azure 上 SAP 工作負載的高可用性,虛擬機器通常會部署在 可用性設定組 可用性區域 彈性擴展集中 ,以保護應用程式免于區域內基礎結構維護或失敗。 但部署不會保護應用程式不受區域內廣泛災害的影響。 因此,為了保護應用程式免于區域性災害,應備妥應用程式的災害復原策略。 災害復原是一種記載且結構化的方法,旨在協助組織執行復原程式以回應災害,以及保護或最小化 IT 服務中斷並提升復原。

本檔提供藉由實作結構化 DR 方法來保護 SAP 工作負載免于大規模災難的詳細資料。 本檔中的詳細資料會根據不同的 Azure 服務和 SAP 元件,以抽象層級呈現。 您必須定期測試、記錄和微調 SAP 工作負載的確切 DR 策略和復原順序。 此外,檔著重于適用于 SAP 工作負載的 Azure 對 Azure DR 策略。

一般災害復原計畫考慮

Azure 上的 SAP 工作負載會在虛擬機器上執行,並結合不同的 Azure 服務來部署一般 SAP NetWeaver 應用程式的不同層級(中央服務、應用程式伺服器、資料庫伺服器)。 一般而言,應該針對在 Azure 上執行的整個 IT 環境規劃 DR 策略,這表示也要考慮非 SAP 應用程式。 如果 DR 網站上未復原相依服務或資產,在 SAP 系統中執行的商務解決方案可能無法整體執行。 因此,您需要考慮所有元件和系統,來制定定義完善的完整 DR 計畫。

針對 Azure 上的 DR,組織應考慮可能會觸發容錯移轉的不同案例。

  • SAP 應用程式或商務程式可用性。
  • Azure 服務(例如虛擬機器、儲存體、負載平衡器等)因普遍失敗而無法在區域內使用。
  • 應用程式的潛在威脅和弱點(例如應用層 DDoS 攻擊)
  • 商務合規性需要操作工作來測試 DR 策略(例如,根據合規性每年執行 DR 失敗練習)。

若要達到不同案例的復原目標,組織必須根據業務需求來概述其工作負載的復原時間目標 (RTO) 和復原點目標 (RPO)。 RTO 描述應用程式可以關閉的時間量,通常是以小時、分鐘或秒為單位來測量。 而 RPO 則描述企業可接受的交易資料量,以便讓正常作業繼續。 識別您企業的 RTO 和 RPO 非常重要,因為它可協助您以最佳方式設計 DR 策略。 SAP 工作負載所涉及的元件(計算、儲存體、資料庫等)會使用不同的技術複寫到 DR 區域(Azure 原生服務、原生資料庫複寫技術、自訂腳本)。 每個技術都提供不同的 RPO,設計 DR 策略時必須考慮這一點。 在 Azure 上,您可以使用一些 Azure 原生服務,例如 Azure Site Recovery,Azure 備份可協助您符合 SAP 工作負載的 RTO 和 RPO。 請參閱 Azure Site Recovery SLA 和 Azure 備份 ,以最佳方式與您的 RTO 和 RPO 一致。

Azure 上的災害復原設計考慮

在 Azure 上設計災害復原解決方案時,需要考慮不同的元素。 設計內部部署災害復原解決方案的原則和概念也適用于 Azure。 但在 Azure 中,區域選擇是災害復原設計策略的關鍵區段。 因此,選擇 Azure 上的 DR 區域時,請記住下列幾點。

  • 商務或法規合規性需求可以指定主要和災害復原網站之間的距離需求。 如果自然災害發生在更廣泛的地理位置,距離需求有助於提供可用性。 在這種情況下,組織可以選擇另一個 Azure 區域作為其災害復原網站。 Azure 區域通常會以數百或甚至數千公里的大型距離分隔,例如美國。 由於距離,網路往返延遲會較高,這可能會導致較高的 RPO。

  • 想要在 Azure 上模擬其內部部署 Metro DR 策略的客戶,可以使用 可用性區域來進行災害復原 。 但是,如果發生地理上廣泛的自然災害,區域對區域 DR 策略可能會低於復原能力需求。

  • 在 Azure 上,每個區域會與相同地理位置內的另一個區域配對(巴西南部除外)。 這種方法允許跨區域提供資源的平臺複寫。 選擇配對區域的優點可以在區域配對檔中 找到 。 當組織選擇使用 Azure 配對區域時,必須考慮 SAP 工作負載的數個額外點:

    • 並非所有 Azure 服務都提供配對區域中的跨區域複寫。

    • 配對 Azure 區域中的 Azure 服務和功能可能不是對稱的。 例如,Azure NetApp Files、主要區域中可用的 M 系列等 VM SKU 可能無法在配對區域中使用。 若要檢查 Azure 產品或服務是否可在區域中使用,請參閱 依區域的 Azure 產品。

    • GRS 選項適用于具有標準儲存體類型的儲存體帳戶,可將資料複寫至配對的區域。 但標準儲存體不適用於 SAP DBMS 或虛擬磁片。

    • 用來備份 支援解決方案 的 Azure 備份服務只能在配對區域之間複寫備份。 針對所有其他資料,使用 SQL Server Always On、SAP HANA 系統複寫和其他服務等原生 DBMS 功能執行您自己的複寫。 針對 SAP 應用層使用 Azure Site Recovery、rsync 或 robocopy 和其他協力廠商軟體的組合。

參考 SAP 工作負載部署

識別 DR 區域之後,請務必瞭解您在主要區域中設定的 Azure 核心服務(例如網路、計算、儲存體)廣度,而且可以在 DR 區域中設定。 組織必須針對 SAP 工作負載開發 DR 部署模式。 部署模式會有所不同,且必須符合組織的需求。

  • 將生產 SAP 工作負載部署到主要區域,並將非生產工作負載部署到災害復原區域。
  • 將所有 SAP 工作負載(生產和非生產環境)部署到您的主要區域。 只有在有容錯移轉時,才會使用災害復原區域。

下列參考架構顯示在 Azure 上執行的一般 SAP NetWeaver 系統,以及主要區域中的高可用性。 下面顯示的次要月臺是災害復原月臺,SAP 系統會在災害事件之後還原。 主要和災害復原區域都是相同訂用帳戶的一部分。 若要達到 SAP 工作負載的 DR,您必須識別每個 SAP 層的復原策略,以及應用程式所使用的不同 Azure 服務。

組織應該針對整個 IT 環境規劃及設計 DR 策略。 在生產環境中執行的 SAP 系統通常會與 Active Directory、DNS、協力廠商應用程式等不同服務和介面整合。 因此,您也必須在災害復原規劃中包含非 SAP 系統和其他服務。 本檔著重于 SAP 應用程式的復原規劃。 但是您可以擴充相依元件的 DR 規劃大小和範圍,以符合您的需求。

Disaster Recovery reference architecture for SAP workload

SAP 工作負載的 DR 解決方案基礎結構元件

在 Azure 上執行的 SAP 工作負載會使用不同的基礎結構元件來執行商務解決方案。 若要規劃這類解決方案的 DR,請務必讓主要區域中設定的所有基礎結構元件都可供使用,而且也可以設定在 DR 區域中。 在為 Azure 上的 SAP 工作負載設計 DR 解決方案時,應該考慮下列基礎結構元件。

  • 網路
  • 計算
  • 儲存體

網路

  • ExpressRoute 會透過連線提供者的協助,透過私人連線將內部部署網路延伸至 Microsoft 雲端。 在設計災害復原架構時,必須考慮使用異地備援 ExpressRoute 線路建立健全的後端網路連線能力。 建議您從內部部署設定至少一個 ExpressRoute 線路到主要區域。 另一個(s) 應該連線到災害復原區域。 請參閱設計適用于災害復原 的 Azure ExpressRoute 一文,其中說明設計 ExpressRoute 災害復原的不同案例。

    注意

    請考慮將站對站 VPN 設定為 Azure ExpressRoute 的備份。 如需詳細資訊,請參閱 使用 S2S VPN 作為 Azure ExpressRoute 私人對等互連 的備份。

  • 虛擬網路和子網橫跨區域中的所有可用性區域。 針對兩個區域的 DR,您必須在災害復原區域上設定個別的虛擬網路和子網。 請參閱 關於 Azure VM 災害復原 中的網路功能,以深入瞭解 DR 區域的網路設定。

  • Azure Standard Load Balancer 為 SAP 系統的高可用性設計提供網路元素。 針對叢集系統,Standard Load Balancer 會提供叢集服務的虛擬 IP 位址,例如在 VM 上執行的 ASCS/SCS 實例和資料庫。 若要在 DR 月臺上執行高可用性 SAP 系統,必須建立個別的負載平衡器,並據以調整叢集組態。

  • Azure 應用程式閘道是 Web 流量負載平衡器。 透過其 Web 應用程式防火牆 功能,其適合用來向網際網路公開 Web 應用程式且安全性改善的服務。 Azure 應用程式閘道可以根據組態來服務公用(網際網路)或私人用戶端,或兩者。 容錯移轉之後,若要接受 DR 區域上的類似連入 HTTP 流量,必須在 DR 區域中設定個別的Azure 應用程式閘道。

  • 當網路元件(例如虛擬網路、防火牆等)分別在 DR 區域中建立時,您必須確定 DR 區域中的 SAP 工作負載會適應 DNS 更新、防火牆等網路變更。

  • 這兩個區域中的虛擬網路都是獨立的,若要建立兩者之間的通訊,您必須啟用 兩個區域之間的虛擬網路對等互連

虛擬機器

  • 在 Azure 上,單一 SAP 系統的不同元件會在具有不同 SKU 類型的虛擬機器上執行。 針對 DR,可以使用 Azure Site Recovery 將元件 複寫至另一個 Azure 區域或區域,來啟用在 Azure VM 上執行的應用程式 (SAP NetWeaver 和非 SAP) 的保護。 使用 Azure Site Recovery,Azure VM 會持續從主要複寫至災害復原網站。 根據選取的 Azure DR 區域,VM SKU 類型可能無法在 DR 網站上使用。 您也必須確定 Azure DRregion 中也提供所需的 VM SKU 類型。 檢查 依區域的 Azure 產品,以查看所需的 VM 系列 SKU 類型是否可用。

    重要

    如果 SAP 系統設定為具有 FD=1 的彈性擴展集,則您必須使用 PowerShell 來設定 Azure Site Recovery 以進行災害復原。 目前,它是針對部署在擴展集中的 VM 設定災害復原的唯一方法。

  • 針對在 Azure 虛擬機器上執行的資料庫,建議使用原生資料庫複寫技術將資料同步處理至災害復原網站。 執行資料庫的大型 VM 可能無法在所有區域中使用。 如果您使用 可用性區域進行災害復原,您應該檢查災害復原 月臺區域中是否有個別的 VM SKU。

    注意

    不建議針對資料庫使用 Azure Site Recovery,因為它不保證資料庫一致性且具有 資料變換限制

  • 在主要區域上執行的生產應用程式時, 保留實例 通常用來省去 Azure 成本。 如果使用保留實例,您必須註冊 1 年或 3 年期承諾,這可能對 DR 網站沒有成本效益。 此外,設定 Azure Site Recovery 並不保證您在容錯移轉期間所需的 VM SKU 容量。 若要確定 VM SKU 容量可供使用,您可以考慮啟用隨選容量保留 的選項 。 它會在 Azure 區域或 Azure 可用性區域中保留任何持續時間的計算容量,而不需承諾。 Azure Site Recovery 已 與隨選容量保留整合 。 透過這項整合,您可以使用 Azure Site Recovery 的容量保留功能,在 DR 月臺中保留計算容量,並保證您的容錯移轉。 如需詳細資訊,請參閱隨選容量保留 限制和限制

  • Azure 訂用帳戶具有 VM 系列 (例如 Mv2 系列) 和其他資源的配額。 有時候組織想要針對 DR 使用不同的 Azure 訂用帳戶。 每個訂用帳戶(主要和 DR)可能會為每個 VM 系列指派不同的配額。 請確定用於 DR 網站的訂用帳戶有足夠的計算配額可供使用。

儲存體

  • 為 VM 啟用 Azure Site Recovery 以設定 DR 時,連結至 VM 的 OS 和本機資料磁片會複寫至 DR 月臺。 在複寫期間,VM 磁片寫入會傳送至來源區域中的快取儲存體帳戶。 資料會從該處傳送至目的地區域,並從資料產生復原點。 當您在 DR 期間容錯移轉 VM 時,會使用復原點來還原目的地區域中的 VM。 但 Azure Site Recovery 不支援 Azure 中可用的所有儲存體類型。 如需詳細資訊,請參閱 儲存體 的 Azure Site Recovery 支援矩陣。

  • 除了連結至 VM 的 Azure 受控資料磁片之外,不同的 Azure 原生儲存體解決方案也會用來在 Azure 上執行 SAP 應用程式。 每個 Azure 儲存體解決方案的 DR 方法可能會有所不同,因為 Azure Site Recovery 不支援 Azure 中所有可用的儲存體服務。 以下是通常用於 SAP 工作負載的儲存體類型清單。

    儲存體類型 DR 策略建議
    受控磁碟 Azure Site Recovery
    Azure 檔案上的 NFS (LRS 或 ZRS) 自訂腳本以在兩個月臺之間複寫資料(例如 rsync)
    Azure NetApp Files 上的 NFS 使用 Azure NetApp Files 磁片區的跨區域複寫
    Azure 共用磁片 (LRS 或 ZRS) 在兩個網站之間複寫資料的自訂解決方案
    Azure 檔案上的 SMB (LRS 或 ZRS) 使用 RoboCopy 在兩個網站之間複製檔案
    Azure NetApp Files 上的 SMB 使用 Azure NetApp Files 磁片區的跨區域複寫
  • 針對如 NFS 叢集的自訂建置儲存體解決方案,您必須確定已備妥適當的 DR 策略。

  • 不同的原生 Azure 儲存體服務(例如Azure 檔案儲存體、Azure NetApp Files、Azure 共用磁片)可能無法在所有區域中使用。 因此,若要在容錯移轉之後在 DR 區域上設定類似的 SAP 設定,請確定 DR 月臺中會提供個別的儲存體服務。 如需詳細資訊,請參閱 依區域的 Azure 產品。

  • 如果使用可用性區域進行災害復原 ,請記住下列幾點:

    • Azure NetApp Files 功能尚不會感知區域。 目前 Azure NetApp Files 功能不會部署在 Azure 區域的所有可用性區域中。 因此,Azure NetApp Files 服務可能無法在您選擇的 DR 策略可用性區域中使用。
    • Azure NetApp File 磁片區的跨區域複寫僅適用于固定 區域配對 ,不適用於跨區域。
  • 如果您已使用 Active Directory 整合來設定儲存體,也應該在 DR 月臺儲存體帳戶上完成類似的設定。

  • Azure 共用磁片需要 Windows Server 容錯移轉叢集 (WSFC) 等叢集軟體,以處理叢集節點通訊和寫入鎖定。 因此,若要有 Azure 共用磁片的 DR 策略,您也必須在 DR 網站中擁有叢集軟體所管理的共用磁片。 然後,您可以使用腳本,將資料從連結至主要區域中叢集的共用磁碟複製到 DR 區域中另一個叢集的共用磁片。

下一步