規劃 Azure Stack HCI 和 Windows 伺服器叢集上的磁片區

適用于: Azure Stack HCI、版本21H2 和 20H2;Windows server 2022,Windows server 2019

本文提供如何規劃叢集磁片區以符合工作負載的效能和容量需求的指導方針,包括選擇其檔案系統、復原類型和大小。

檢閱:什麼是磁碟區

磁片區是您放置工作負載所需之檔案的位置,例如 Hyper-v 虛擬機器的 VHD 或 VHDX 檔案。 磁片區會結合存放集區中的磁片磁碟機,以引入 Azure Stack HCI儲存空間直接的軟體定義儲存體技術的容錯、擴充性和效能優勢。

注意

我們會使用「磁片區」詞彙來與磁片區和虛擬磁片互相參考,包括其他內建 Windows 功能所提供的功能,例如叢集共用磁片區 (CSV) 和 ReFS。 成功計劃及順利部署儲存空間直接存取,不需要了解這些實作層級區別。

下圖顯示三個資料夾,分別標示為磁片區,每個都與標示為磁片區的虛擬磁片相關聯,而且全都與一般儲存集區相關聯。

所有磁碟區可以由叢集中所有伺服器同時存取。 一旦建立之後,就會在所有伺服器上的 C:\ClusterStorage\ 中顯示。

螢幕擷取畫面會顯示名為 ClusterStorage 的 [檔案瀏覽器] 視窗,其中包含名為 Volume1、Volume2 和 Volume3 的磁片區。

選擇建立多少磁碟區

我們建議磁碟區數目是您叢集中伺服器數目的倍數。 例如,如果您有4部伺服器,則會經歷與4個磁片區(而不是3或5)更一致的效能。 這可以讓叢集在伺服器之間平均分配磁碟區「擁有權」(針對每個磁碟區,一個伺服器處理中繼資料協調流程)。

建議您將每個叢集的磁片區總數限制為64個磁片區。

選擇檔案系統

我們建議將新的復原檔案系統 (ReFS) 用於儲存空間直接存取。 ReFS 是專為模擬化用途打造的頂級檔案系統,提供許多好處,包括大幅效能加速和內建的資料毀損保護。 它支援幾乎所有的主要 NTFS 功能,包括 Windows Server 1709 版和更新版本中的重復資料刪除。 如需詳細資料,請參閱 ReFS 功能比較表

如果您的工作負載需要 ReFS 尚未支援的功能,您可以改為使用 NTFS。

提示

有不同檔案系統的磁碟區可以同時存在於相同叢集中。

選擇復原類型

儲存空間直接存取中的磁碟區可提供復原能力來防範硬體問題 (例如磁碟機或伺服器故障),以及在整個伺服器維護期間 (例如軟體更新) 支援持續可用性。

注意

可以選擇的復原類型,不受您擁有的磁碟機類型影響。

具有兩部伺服器

使用叢集中的兩部伺服器,您可以使用雙向鏡像,也可以使用嵌套的復原功能。

雙向鏡像會為所有資料保留兩份複本,每部伺服器的磁片磁碟機上都有一個複本。 其儲存效率為 50%;若要寫入 1 TB 的資料,存放集區中至少需要 2 TB 的實體儲存體容量。 雙向鏡像可以一次安全地容忍一個硬體故障 (一部伺服器或磁片磁碟機) 。

圖表顯示標示為數據的磁片區和依圓形箭號連接的複製,而且這兩個磁片區都與伺服器中的磁片 bank 相關聯。

嵌套復原功能可在具有雙向鏡像的伺服器之間提供資料恢復功能,然後在具有雙向鏡像或鏡像加速同位的伺服器內新增復原功能。 即使一部伺服器正在重新開機或無法使用,也會提供資料恢復功能。 其儲存效率是具有嵌套雙向鏡像的25%,以及嵌套鏡像加速同位的大約35-40%。 嵌套復原可以安全地容忍兩個硬體故障 (兩個磁片磁碟機,或是伺服器和其餘伺服器) 的磁片磁碟機。 由於這項新增的資料恢復功能,建議您在兩部伺服器叢集的生產環境部署上使用嵌套復原。 如需詳細資訊,請參閱 嵌套復原

圖表顯示與每個伺服器內對應同位層的每個伺服器之間,與雙向鏡像相關聯之伺服器之間的嵌套鏡像加速同位。

具有三部伺服器

有三種伺服器,您應該使用三向鏡像,以取得更好的容錯和效能。 三向鏡像保留所有資料的三份複本,每個伺服器的磁碟機上各有一份複本。 其儲存效率為 33.3%-若要寫入 1 TB 的資料,存放集區中至少需要 3 TB 的實體儲存體容量。 三向鏡像可以安全地容忍 至少兩個硬體問題 (磁片磁碟機或伺服器) 一次。 如果有2個節點無法使用,儲存集區將會遺失仲裁,因為無法使用2/3 的磁片,且虛擬磁片將會無法存取。 不過,節點可能會關閉,而另一個節點上的一或多個磁片可能會失敗,且虛擬磁片將維持在線上。 例如,如果您在一個磁碟機或伺服器突然故障時重新啟動另一部伺服器,所有資料都將保有安全性,且持續可供存取。

圖表顯示標示為數據的磁片區,以及兩個標示為與包含實體磁片之伺服器相關聯之磁片區的標籤複製。

具有四個以上伺服器

有四部以上的伺服器,您可以選擇每個磁片區是否使用三向鏡像、雙重同位 (通常稱為「抹除編碼」 ) ,或混搭兩者與鏡像加速同位。

雙同位提供與三向鏡像相同的容錯功能,但具有更佳的儲存效率。 有四部伺服器,其儲存效率為 50.0%;若要儲存 2 TB 的資料,您需要在存放集區中有 4 TB 的實體儲存體容量。 這66.7 可增加7部伺服器的儲存效率,並持續提升至80.0% 的儲存效率。 缺點是同位編碼大量耗用運算資源,這可能會限制其效能。

此圖顯示兩個標示為數據的磁片區,以及每個與包含實體磁片之伺服器相關聯的每個磁片區的兩個標示的同位

要使用的復原類型,端視您的工作負載需求。 以下資料表摘要說明哪些工作負載適合每種復原類型,以及每種復原類型的效能和儲存效率。

復原類型 容量效率 速度 工作負載
鏡像 顯示33% 的儲存體效率
三向鏡像:33%
雙向鏡像:50%
顯示100% 的效能
效能最高
虛擬化工作負載
資料庫
其他高效能工作負載
鏡像加速的同位 顯示大約50% 的儲存體效率
取決於鏡像和同位的比例
顯示大約20% 的效能
比鏡像慢很多,但速度最多兩倍雙同位
最適用于大型順序寫入和讀取
封存與備份
虛擬化桌面基礎結構
雙同位 顯示大約80% 的儲存體效率
4部伺服器:50%
16部伺服器:最高80%
顯示大約10% 的效能
寫入時最高的 i/o 延遲 & CPU 使用量
最適用于大型順序寫入和讀取
封存與備份
虛擬化桌面基礎結構

當效能是最重要時

有嚴格延遲需求,或需要很多混合隨機 IOPS (例如 SQL Server 資料庫或重視效能的 Hyper-V 虛擬機器) 的工作負載,應該執行於使用鏡像的磁碟區上,以達到最佳效能。

提示

鏡像比任何其他復原類型都還要快速。 我們幾乎所有的效能範例都會使用鏡像。

當容量最關緊要時

不常寫入的工作負載 (例如資料倉儲或「冷」的儲存空間),應該執行於使用雙同位的磁碟區上,將儲存效率最大化。 某些其他工作負載,例如傳統檔案伺服器、虛擬桌面基礎結構 (VDI),或不會建立許多快速飄移隨機 IO 流量和/或不需要最佳效能的其他項目,在您的審慎考慮後,也可以使用雙同位。 相較於鏡像,同位不可避免地增加 CPU 使用率和 IO 延遲,尤其是在寫入時。

當大量寫入資料時

以大量的連續傳遞(例如封存或備份目標)撰寫的工作負載有另一個選項:一個磁片區可以混合使用鏡像和雙同位。 寫入首先登陸鏡像部分,稍後逐漸移動至同位部分。 當大型寫入到達時,這會加速擷取並減少資源使用,藉由允許大量耗用運算資源的同位編碼以較長的時間發生。 當調整鏡像部分和同位部分大小,請考慮將一次發生的寫入數量(例如一次每日備份)應該會舒適地放在鏡像部分中。 例如,如果您每日一次擷取 100 GB,考慮使用 150 GB 到 200 GB 的鏡像,其他部分則使用雙同位。

結果儲存效率視您選擇的比例而定。 如需範例,請參閱此示範

提示

如果您觀察到透過資料內嵌大幅減少寫入效能中途,可能表示鏡像部分不夠大,或是鏡像加速同位不適合您的使用案例。 例如,如果寫入效能從 400 MB/秒減少為 40 MB/s,請考慮展開鏡像部分或切換至三向鏡像。

關於 NVMe、SSD 和 HDD 部署

在具有兩種磁碟機類型的部署中,較快的磁碟機提供快取,而較慢的磁碟機提供容量。 這是自動發生 – 如需詳細資訊,請參閱了解儲存空間直接存取中的快取。 在這類部署,所有磁碟區最終放在同一個類型的磁碟機 – 容量磁碟機上。

在具有全部三種磁碟機類型的部署中,只有最快的磁碟機 (NVMe) 提供快取,並讓其他兩種類型的磁碟機(SSD 及 HDD)提供容量。 針對每個磁碟區,您可以選擇將它完全放在 SSD 層上、完全放在 HDD 層上,或是它橫跨這兩個。

重要

我們建議使用 SSD 層,將最重視效能的工作負載放在全快閃裝置上。

選擇磁碟區大小

建議您將每個磁片區的大小限制為 Windows Server 2019 中的 64 TB。

提示

如果您使用依賴磁片區陰影複製服務的備份解決方案 (VSS) 和 Volsnap 軟體提供者(檔案伺服器工作負載很常見),將磁片區大小限制為 10 TB 將可改善效能和可靠性。 使用較新 Hyper-V RCT API 和/或 ReFS 區塊複製和/或原生 SQL 備份 API 的備份解決方案,磁碟區大小達到 32 TB 以上時也可以順利執行。

使用量

磁碟區大小是指其可用容量,可以儲存的資料量。 這是由 New-Volume cmdlet 的 -Size 參數提供,然後當您執行 Get-Volume cmdlet 時顯示在 Size 屬性中。

大小不同於磁碟區使用量,它占儲存集區的實體儲存總容量。 使用量視其復原類型而定。 例如,使用三向鏡像的磁碟區有其大小三倍大的使用量。

磁碟區使用量需要放在儲存集區中。

圖表顯示 2 TB 的磁片區,相較于儲存集區中 6 TB 的使用量,有三個指定的乘數。

保留容量

在儲存集區中保留某些容量,提供磁碟空間在磁碟機故障之後「就地」修復,而改進資料安全性與效能。 如果容量充足,立即、就地、平行修復甚至可以在故障的磁碟機更換之前將磁碟區還原為完整復原。 此動作會自動執行。

我們建議每個伺服器保留相當於一個容量磁碟機的容量,最多 4 個磁碟機。 在您的審慎考慮後,您可以保留更多,但這個最低建議保證任何磁碟機故障之後的立即、就地、平行修復成功。

圖表顯示與存放集區中的數個磁片相關聯的磁片區,以及標示為保留的未關聯磁片。

例如,如果您有 2 部伺服器並使用數個 1 TB 容量磁碟機,將集區的 2 x 1 = 2 TB 設定為保留。 如果您有 3 部伺服器和數個 1 TB 容量磁碟機,設定 3 x 1 = 3 TB 為保留。 如果您有 4 部以上伺服器和數個 1 TB 容量磁碟機,設定 4 x 1 = 4 TB 為保留。

注意

在具有全部三種磁碟機類型 (NVMe + SSD + HDD) 的叢集中,我們建議每個伺服器保留相當於一個 SSD 加上一個 HDD 的容量,每個伺服器最多 4 個磁碟機。

範例:容量計劃

請考慮一個有四部伺服器的叢集。 每個伺服器擁有一些快取磁碟機,加上 16 個 2 TB 磁碟機的容量。

4 servers x 16 drives each x 2 TB each = 128 TB

從這個儲存集區的 128 TB 中,我們將保留四個磁碟機 (或 8 TB),以便在磁碟機故障之後進行就地修復,不需要急著更換磁碟。 集區中剩下 120 TB 實體儲存容量,我們可用來建立磁碟區。

128 TB – (4 x 2 TB) = 120 TB

假設我們的部署需要裝載某些高度活躍 Hyper-V 虛擬電腦,但是我們也有很多冷儲存空間儲存寒冷 – 要保留的舊檔案和備份。 因為我們有四部伺服器,我們建立四個磁碟區。

我們將在虛擬機器放在前兩個磁碟區,Volume1Volume2。 我們選擇 ReFS 做為檔案系統(適用於更快速的建立和檢查點)和三向鏡像復原類型以達到最佳效能。 我們將冷儲存空間放在其他兩個磁碟區 Volume 3Volume 4。 我們選擇 NTFS 做為檔案系統 (適用於重複資料刪除) 和雙同位復原類型,將容量最大化。

我們不需要讓所有磁碟區大小相同,但為了簡化,例如我們可以讓它們全部都是 12 TB。

Volume1Volume2 每個都佔用 12 tb x 33.3% 效率 = 36 tb 的實體儲存體容量。

Volume3Volume4 每個都佔用 12 tb x 50.0% 效率 = 24 tb 的實體儲存體容量。

36 TB + 36 TB + 24 TB + 24 TB = 120 TB

四個磁碟區上可完全容納在我們集區中的可用實體儲存空間容量。 完美!

圖表顯示 2 12 TB 的三向鏡像磁片區,每個磁片區都與 36 TB 的儲存空間相關聯,以及 2 12 TB 的雙重同位磁片區,每個磁片區都與 24 TB 相關聯,全都佔用 120 TB 的儲存

提示

您不需要立即建立所有磁碟區。 您隨時可以延伸磁碟區,或稍後建立新的磁碟區。

為了簡化,這整個範例使用十進位 (以 10 為底數) 單位,表示 1 TB = 1,000,000,000,000 位元組。 不過,Windows 中的儲存數量以二進位 (以 2 為底數) 單位表示。 例如,每個 2 TB 磁碟機在 Windows 中顯示為 1.82 TiB。 同樣地,128 TB 儲存集區顯示為 116.41 TiB。 這是預期行為。

使用方式

請參閱 在 Azure Stack HCI 中建立磁片區。

下一步

如需詳細資訊,請參閱: