使用 Azure Stack HCI 延展式叢集進行災害復原

Azure Blob 儲存體
Azure 備份
Azure 監視器
Azure Stack HCI

下列參考架構說明如何使用延展式叢集來設計和實作 Azure Stack HCI 的災害復原。

架構

說明主動-主動和主動-被動 Azure Stack HCI 延展式叢集的圖表,其中包含透過儲存體複本複寫的儲存體磁片區和叢集效能歷程記錄。在主動-主動模式中,每個方向都有複寫流量,同時裝載 Azure Stack HCI VM 的兩個月臺。在主動-被動模式中,複寫是單向的,而主動月臺裝載 Azure Stack HCI VM。

下載這個架構的 Visio 檔案

單元

此架構包含下列元件和功能:

  • Azure Stack HCI (20H2) Azure Stack HCI 是一種超交集基礎結構, (HCI) 叢集解決方案,可裝載虛擬化的 Windows 和 Linux 工作負載,以及其在混合式內部部署環境中的儲存體。 延展式叢集可以包含四到 16 個實體節點。
  • 儲存體複本。 儲存體複本是一種 Windows Server 技術,可在伺服器或叢集之間進行磁片區複寫,以便進行災害復原。
  • 即時移轉。 即時移轉是 Windows Server 中的 Hyper-V 功能,可讓您順暢地將執行中的虛擬機器 (VM) 從一部 Hyper-V 主機移至另一部主機,而不會察覺到停機時間。
  • 雲端見證。 雲端見證是容錯移轉叢集仲裁見證,使用 Microsoft Azure Blob 儲存體 提供叢集仲裁的投票。

實例詳細資料

您通常會使用此架構進行災害復原,並自動容錯移轉 Azure Stack HCI VM,以及介於 5 毫秒網路等待時間範圍內的兩個實體位置之間的檔案共用。

建議

下列建議適用于大部分案例。 除非您有覆寫建議的特定需求,否則請遵循建議。

使用延展式叢集來針對 Azure Stack HCI 上裝載的虛擬化工作負載和檔案共用實作自動化災害復原

若要增強 Azure Stack HCI 的內建復原能力,請實作由兩個節點群組所組成的延展式 Azure Stack HCI 叢集,每個網站各有一個群組。 每個群組至少必須包含兩個節點。 叢集中的節點總數不能超過 Azure Stack HCI 叢集支援的節點數目上限。 節點必須滿足標準 HCI 硬體需求

延伸的 Azure Stack HCI 叢集依賴儲存體的複本,以在其各自實體網站的兩個節點群組託管的儲存體磁碟區之間執行同步儲存體複寫。 如果失敗影響了主要網站的可用性,叢集會自動將其工作負載轉換至正常運作網站中的節點,以將可能的停機時間降至最低。 針對主要月臺的計劃性或預期停機時間,您可以使用 Hyper-V 即時移轉順暢地將工作負載轉換為其他月臺,以避免完全停機。 在此案例中,您應該留意儲存位置。 您應該先反轉儲存體複本的複寫方向,然後執行 VM 的即時移轉。 在即時移轉完成之前,會有效能影響。

注意

同步複寫可確保當機一致性,在容錯移轉期間檔案系統層級不會遺失任何資料。

警告

適用于延展式叢集的同步複寫需求會限制複寫月臺中兩組叢集節點之間的 5 毫秒來回網路延遲。 根據實體網路連線特性,此條件約束通常會轉譯為大約 20-30 個實體英哩。

注意

儲存體複本的簽署和加密功能會自動保護複寫流量。

考量

Microsoft Azure Well-Architected Framework是一組遵循此參考架構中的指引原則。 下列考慮會以這些原則的內容框起。

可靠性

可靠性可確保您的應用程式符合您對客戶的承諾。 如需詳細資訊,請參閱 可靠性要素概觀

  • 月臺層級容錯網域。 Azure Stack HCI 延展式叢集的每個實體網站都代表可提供額外復原的不同容錯網域。 容錯網域是一組共用單一失敗點的硬體元件。 若要對特定層級具有容錯能力,您需要在該層級上有多個容錯網域。

注意

如果每個位置對應至個別的 AD DS 月臺,叢集布建程式會自動設定月臺指派。 如果沒有代表兩個位置的個別 AD DS 月臺,但節點位於兩個不同的子網上,叢集布建程式會根據子網指派來識別月臺。 如果節點位於相同的子網上,您必須明確定義月臺指派。

  • 網站感知。 網站感知可讓您藉由指定其慣用的網站來控制虛擬化工作負載的放置。 指定延展式叢集的慣用網站可提供許多優點,包括能夠在網站層級將工作負載分組,以及自訂仲裁投票選項。 根據預設,在冷啟動期間,所有虛擬機器都會使用慣用的網站,雖然您也可以在叢集角色或群組層級設定慣用的網站。 這可讓您以主動-主動模式將特定虛擬機器配置至其各自的月臺。 從仲裁的觀點來看,慣用的網站選取會以偏好該網站的方式影響投票的配置。 例如,如果裝載延展式叢集節點的兩個月臺之間的連線失敗,而且無法連線到叢集見證,則慣用的網站會維持在線上狀態,而其他月臺中的節點則會收回。

  • 改善儲存空間直接存取磁片區修復速度。 儲存空間直接存取提供自動重新同步處理下列事件,這些事件會影響其存放集區內磁片的可用性,例如關閉其中一個叢集節點或當地語系化的硬體失敗。 Azure Stack HCI 會實作比 Windows Server 2019 更精細運作的 增強式重新同步處理常式 。 此程式可大幅減少重新同步作業的持續時間,並將多個重迭硬體故障的潛在影響降到最低。

  • 復原限制。 Azure Stack HCI 提供多個復原層級,但由於其超融合式架構,該復原不僅易受限於叢集仲裁,也受限於集區仲裁

  • 與各種 Azure 服務整合,以提供額外的復原優勢。 您可以將在 Azure Stack HCI 叢集上執行的虛擬化工作負載與這類 Azure 服務整合,例如Azure 備份Azure Site Recovery

  • 加速容錯移轉。 您可以優化網路基礎結構及其設定,以加速完成月臺層級容錯移轉。 例如,您可以在代表叢集資源的 DNS 記錄中利用延展虛擬 LAN (VLAN) 、網路抽象裝置,以及較短的存留時間 (TTL) 值。 此外,請考慮降低 預設復原期間,這會決定允許叢集 VM 在隔離狀態中執行的時間週期。

警告

搭配 SDN 使用 Stretched 叢集會被視為進階設定,您應該連絡您的系統整合者或Microsoft 支援服務以取得進一步的協助。

安全性

安全性可提供保證,以避免刻意攻擊和濫用您寶貴的資料和系統。 如需詳細資訊,請參閱安全性要素的概觀

  • 傳輸過程中的保護。 儲存體複本為其複寫流量提供內建安全性,其中包括封包簽署、AES-128-GCM 完整資料加密、Intel AES-NI 加密加速的支援,以及預先驗證完整性攔截式攻擊防護。 儲存體複本也會利用 Kerberos AES256 在複寫節點之間進行驗證。

  • 待用加密。 Azure Stack HCI 支援其資料磁碟區的 BitLocker 磁碟機加密,因此有助於符合 FIPS 140-2 和 HIPAA 等標準。

  • 與各種 Azure 服務整合,以提供額外的安全性優勢。 您可以將在 Azure Stack HCI 叢集上執行的虛擬化工作負載與雲端Microsoft Defender這類 Azure 服務整合

  • 適合防火牆的設定。 儲存體複本流量需要複寫 節點之間的開啟埠數目有限

警告

儲存體複本和 Azure Stack HCI 延展式叢集必須在 AD DS 環境中運作。 規劃 Azure Stack HCI 延展式叢集部署時,請確定每個裝載叢集節點的月臺中 AD DS 網域控制站的連線能力。

成本最佳化

成本最佳化是關於考慮如何減少不必要的費用,並提升營運效率。 如需詳細資訊,請參閱成本最佳化要素的概觀

  • 主動-主動與主動-被動設定。 延展式 Azure Stack HCI 叢集支援主動-被動和主動-主動模式。 在主動-被動模式中,指定的主要月臺會單向複寫到另一個提供災害復原功能的月臺。 在主動-主動模式中,兩個月臺會單向複寫其各自的磁片區彼此,並在任一月臺發生失敗時提供容錯移轉功能。 主動-主動模式有助於將業務持續性成本降到最低,因為不需要專用的災害復原站台。

  • 雲端見證與檔案共用見證。 見證資源是 Azure Stack HCI 叢集中的必要元件。 若要實作,請選擇 Azure 雲端見證或檔案共用見證。 Azure 雲端見證依賴您指定為仲裁點的 Azure 儲存體帳戶中的 Blob,以防止分割大腦案例。 檔案共用見證依賴伺服器訊息區 (SMB) 檔案共用來完成相同的目標。

注意

Azure 雲端見證是 Azure Stack HCI 延展式叢集的建議選擇,前提是叢集中的所有伺服器節點都有可靠的網際網路連線。 對應的 Azure 費用是可忽略的;它們是以小型 Blob 的價格為基礎,其不常更新會對應至叢集狀態的變更。 在涉及延展式叢集的案例中,檔案共用見證應該位於第三個網站,除非第三個月臺已可用,且具有裝載延展叢集節點之網站的可靠連線,否則可能會大幅提高實作成本。

  • 重復資料刪除。 Azure Stack HCI 和儲存體複本支援重復資料刪除。 從 Windows Server 2019 開始,重復資料刪除適用于使用復原檔案系統 (ReFS) 格式化的磁片區,這是 Azure Stack HCI 的建議檔案系統。 重復資料刪除可藉由識別檔案的重複部分,並只儲存一次,來協助增加可用的儲存容量。

警告

雖然您應該在來源和目的地伺服器上安裝重復資料刪除伺服器角色服務,但請勿在 Azure Stack HCI 延展式叢集內的目的地節點上啟用重復資料刪除。 因為重復資料刪除會管理寫入,所以它應該只在來源叢集節點上執行。 目的地節點一律會收到每個磁片區的重復資料刪除複本。

卓越營運

卓越營運涵蓋部署應用程式的作業程式,並讓它在生產環境中執行。 如需詳細資訊,請參閱 營運卓越要素概觀

  • 自動容錯移轉和復原。 主要月臺失敗會觸發自動容錯移轉。 在容錯移轉之後,從新的主要/先前次要月臺建立複寫到新次要/先前的主要月臺的程式也會自動進行。 為了防止潛在的資料遺失,叢集會防止容錯回復,直到複寫的磁片區完全同步處理為止。

  • 使用 Windows Admin Center 簡化布建和管理體驗。 Windows Admin Center中的建立叢集精靈提供精靈驅動介面,引導您完成建立 Azure Stack HCI 延展式叢集的程式。 精靈會偵測叢集節點是否位於兩個不同的Active Directory 網域服務 (AD DS) 月臺,或其 IP 位址是否屬於兩個不同的子網。 如果它們位於兩個不同的子網中,精靈會自動建立並設定對應的叢集網站,每個月臺都代表不同的容錯網域。 它也可讓您指定慣用的網站。 同樣地,Windows Admin Center簡化布建複寫磁片區的程式

注意

針對延展式叢集建立磁片區和虛擬磁片比單一月臺叢集更相關。 延展式叢集最少需要四個磁碟區,其由兩個資料磁碟區和兩個記錄磁碟區所組成,且每個站台都會有一個資料/記錄磁碟區組。 當您使用 Windows Admin Center 建立複寫的資料磁片區時,此程式會自動在主要月臺中布建記錄磁片區,以及次要月臺中的資料和記錄複寫磁片區,以確保每個磁片區都有所需的大小和組態設定。

  • 支援使用Windows PowerShell自動延展式叢集布建和儲存體管理 您可以從其中一部 Azure Stack HCI 伺服器或從管理電腦從遠端執行 PowerShell。

  • 與一系列 Azure 服務整合,以提供額外的作業優勢。 您可以將 Azure Stack HCI 叢集上執行的虛擬化工作負載與 Azure監視器和Azure 自動化解決方案等 Azure 服務整合,包括變更追蹤和清查更新管理。 在初始強制註冊程式之後,Azure Stack HCI 叢集可以利用 Azure Arc 進行監視和計費。 Azure Arc 整合提供與其他混合式服務的增強整合,例如Azure 原則Log Analytics。 註冊會觸發建立代表 Azure Stack HCI 叢集的 Azure Resource Manager資源,有效地將 Azure 管理平面延伸至 Azure Stack HCI。

效能效率

效能效率可讓您的工作負載進行調整,以有效率的方式符合使用者對其放置的需求。 如需詳細資訊,請參閱效能效率要件概觀

  • 優化的複寫流量。 設計 Azure Stack HCI 延展式叢集的基礎結構時,請考慮在月臺之間流動的其他儲存體複本、即時移轉和儲存體複本叢集效能歷程記錄流量。 同步複寫至少需要 1 Gb 的遠端直接記憶體存取, (RDMA) 或延展式叢集網站之間的乙太網路/TCP 連線。 不過,視複寫流量量而定,您可能需要 更快的 RDMA 連線。 您也應該在月臺之間布建多個連線,以提供復原優點,並可讓您 將儲存體複本流量與 Hyper-V 即時移轉流量分開

警告

預設會針對相同子網上相同月臺中叢集節點之間的所有流量啟用 RDMA。 月臺之間或不同子網之間不支援 RDMA。 您應該停用跨網站流量的 SMB 直接存取,或實作 額外的布建 ,以將它與相同網站內的跨節點流量分開。

  • 支援植入的初始同步處理。 您可以在需要最小化初始同步處理時間或裝載延展式叢集的兩個網站之間有有限的頻寬的情況下,實作植入 的初始同步 處理。

  • 儲存體 I/O 的優化處理。 確保 複寫資料和記錄磁片區的最佳設定,包括其效能層級、磁片區和磁區大小調整、磁片類型和檔案系統。

注意

如果您將其用於布建延展式叢集磁片區,Windows Admin Center會自動指派最佳設定。

下一步