規劃 Azure Stack HCI 和 Windows Server 叢集上的磁碟區

發行項
02/22/2024

適用於：Azure Stack HCI 版本 22H2 和 21H2;Windows Server 2022、Windows Server 2019

本文將引導您規劃叢集磁碟區，以符合您工作負載的效能和容量需求，包括選擇其檔案系統、復原類型和大小。

注意

「儲存空間直接存取」不支援檔案伺服器進行一般用途。如果您需要在「儲存空間直接存取」上執行檔案伺服器或其他一般服務，請在虛擬機器上加以設定。

檢閱：什麼是磁碟區

磁碟區是您放置工作負載所需檔案的位置，例如 Hyper-V 虛擬機器的 VHD 或 VHDX 檔案。磁碟區會結合存放集區中的磁碟機，以引入 Azure Stack HCI 和 Windows Server 儲存空間直接存取的軟體定義儲存體技術的容錯、擴充性和效能優勢。

注意

我們會使用「磁碟區」一詞來連帶稱呼磁碟區和磁碟區底下的虛擬磁碟，包括叢集共用磁碟區 (CSV) 和 ReFS 等其他內建 Windows 功能所提供的功能。成功計劃及順利部署儲存空間直接存取，不需要了解這些實作層級區別。

所有磁碟區可以由叢集中所有伺服器同時存取。一旦建立之後，這些磁碟區就會顯示在所有伺服器上的 C:\ClusterStorage\。

選擇建立多少磁碟區

我們建議磁碟區數目是您叢集中伺服器數目的倍數。例如，如果您有 4 部伺服器，則比起建立 3 個或 5 個磁碟區，建立 4 個磁碟區的效能會更一致。這可以讓叢集在伺服器之間平均分配磁碟區「擁有權」（針對每個磁碟區，一個伺服器處理中繼資料協調流程）。

我們建議您將磁碟區總數限制為每個叢集最多 64 個磁碟區。

選擇檔案系統

我們建議將新的復原檔案系統 (ReFS) 用於儲存空間直接存取。 ReFS 是專為模擬化用途打造的頂級檔案系統，提供許多好處，包括大幅效能加速和內建的資料毀損保護。支援幾乎所有主要 NTFS 功能，包括 Windows Server 1709 版和更新版本中的重復資料刪除。如需詳細資訊，請參閱 ReFS 功能比較表。

如果您的工作負載需要 ReFS 尚未支援的功能，您可以改為使用 NTFS。

提示

有不同檔案系統的磁碟區可以同時存在於相同叢集中。

選擇復原類型

儲存空間直接存取中的磁碟區可提供復原能力來防範硬體問題 (例如磁碟機或伺服器故障)，以及在整個伺服器維護期間 (例如軟體更新) 支援持續可用性。

注意

可以選擇的復原類型，不受您擁有的磁碟機類型影響。

具有兩部伺服器

使用叢集中的兩部伺服器，您可以使用雙向鏡像，也可以使用巢狀的復原功能。

雙向鏡像會為所有資料保留兩個複本，每部伺服器的磁碟機上都會有一個複本。其儲存效率為 50%；若要寫入 1 TB 的資料，存放集區中至少需要 2 TB 的實體儲存體容量。雙向鏡像每次可安全地容忍一次硬體失敗 (一部伺服器或磁碟機)。

巢狀復原功能會在具有雙向鏡像的伺服器之間提供資料復原功能，然後在具有雙向鏡像或鏡像加速同位的伺服器內新增復原功能。即使其中一部伺服器正在重新啟動或無法使用，巢狀功能也會提供資料復原。具有巢狀雙向鏡像的儲存效率為 25%，而鏡像加速同位的速率約 35-40%。巢狀復原每次可安全地容忍兩次硬體失敗 (兩個磁碟機，或是一個伺服器和一個其餘伺服器上的磁碟機)。基於這項新增的資料復原功能，我們建議您在兩個伺服器叢集的生產部署上使用巢狀復原功能。如需詳細資訊，請參閱巢狀復原。

具有三部伺服器

有三種伺服器，您應該使用三向鏡像，以取得更好的容錯和效能。三向鏡像保留所有資料的三份複本，每個伺服器的磁碟機上各有一份複本。其儲存效率為 33.3%。若要寫入 1 TB 的資料，存放集區中至少需要 3 TB 的實體儲存體容量。三向鏡像在同一時間可容許至少兩個硬體問題 (磁碟機或伺服器)，而且安全無虞。如果有 2 個節點變成無法使用，存放集區將會因為2/3 的磁碟無法使用而失去仲裁，而且將會無法存取虛擬磁碟。不過，您可以關閉一個節點，而另一個節點上的一個或多個磁碟也可失敗，此時虛擬磁碟仍會維持上線狀態。例如，如果您在一個磁碟機或伺服器突然故障時重新啟動另一部伺服器，所有資料都將保有安全性，且持續可供存取。

具有四個以上伺服器

若有四部以上的伺服器，您可以為每個磁碟區選擇使用三向鏡像或雙同位 (通常稱為「抹除碼」)，或以鏡像加速同位來混用這兩個方式。

雙同位提供與三向鏡像相同的容錯功能，但具有更佳的儲存效率。若有四部伺服器，其儲存效率為 50.0%；若要儲存 2 TB 的資料，存放集區中需要 4 TB 的實體儲存體容量。若有七部伺服器，儲存效率會增加到 66.7%，並可持續提升至80.0% 的儲存效率。缺點是同位編碼大量耗用運算資源，這可能會限制其效能。

要使用的復原類型，端視您的工作負載需求。下表摘要說明各種復原類型適用的工作負載，以及每種復原類型的效能和儲存效率。

復原類型	容量效率	速度	工作負載
鏡像	三向鏡像：33% 雙向鏡像：50%	最高效能	虛擬化工作負載資料庫其他高效能工作負載
鏡像加速的同位	取決於鏡像和同位的比例	速度比鏡像慢很多，但可比雙同位快最多兩倍適用於大型循序寫入和讀取	封存和備份虛擬桌面基礎結構
Dual-parity	4 部伺服器：50% 16 部伺服器：最多 80%	寫入時 CPU 使用量最高的 I/O 延遲 & 適用於大型循序寫入和讀取	封存和備份虛擬桌面基礎結構

當效能是最重要時

有嚴格延遲需求，或需要很多混合隨機 IOPS (例如 SQL Server 資料庫或重視效能的 Hyper-V 虛擬機器) 的工作負載，應該執行於使用鏡像的磁碟區上，以達到最佳效能。

提示

鏡像比任何其他復原類型都還要快速。我們幾乎所有的效能範例都會使用鏡像。

當容量最關緊要時

不常寫入的工作負載 (例如資料倉儲或「冷」的儲存空間)，應該執行於使用雙同位的磁碟區上，將儲存效率最大化。其他特定工作負載，例如向外延展檔案伺服器 (SoFS)、虛擬桌面基礎結構 (VDI)，或其他不會建立大量快速飄移隨機 IO 流量及/或不需要最佳效能的其他工作負載，也可以在謹慎考量下使用雙同位。相較於鏡像，同位不可避免地增加 CPU 使用率和 IO 延遲，尤其是在寫入時。

當大量寫入資料時

寫入大量連續傳遞 (例如封存或備份目標) 的工作負載有另一個選項：一個磁碟區可以混合使用鏡像和雙同位。寫入首先登陸鏡像部分，稍後逐漸移動至同位部分。當大型寫入到達時，這會加速擷取並減少資源使用，藉由允許大量耗用運算資源的同位編碼以較長的時間發生。當調整鏡像部分和同位部分大小，請考慮將一次發生的寫入數量（例如一次每日備份）應該會舒適地放在鏡像部分中。例如，如果您每日一次擷取 100 GB，考慮使用 150 GB 到 200 GB 的鏡像，其他部分則使用雙同位。

結果儲存效率視您選擇的比例而定。如需範例，請參閱此示範。

提示

如果您觀察到寫入效能在資料擷取期間突然降低，這可能表示鏡像部分不夠大，或鏡像加速同位不適合您的使用案例。例如，如果寫入效能從 400 MB/s 減少到 40 MB/s，請考慮擴充鏡像部分或切換至三向鏡像。

關於 NVMe、SSD 和 HDD 部署

在具有兩種磁碟機類型的部署中，較快的磁碟機提供快取，而較慢的磁碟機提供容量。這是自動發生 – 如需詳細資訊，請參閱了解儲存空間直接存取中的快取。在這類部署，所有磁碟區最終放在同一個類型的磁碟機 – 容量磁碟機上。

在具有全部三種磁碟機類型的部署中，只有最快的磁碟機 (NVMe) 提供快取，並讓其他兩種類型的磁碟機（SSD 及 HDD）提供容量。針對每個磁碟區，您可以選擇將它完全放在 SSD 層上、完全放在 HDD 層上，或是它橫跨這兩個。

重要

我們建議使用 SSD 層，將最重視效能的工作負載放在全快閃裝置上。

選擇磁碟區大小

在 Azure Stack HCI 中，我們建議您將每個磁碟區的大小限制為 64 TB。

提示

如果您使用的備份解決方案依賴於磁碟區陰影複製服務 (VSS) 和 Volsnap 軟體提供者 (如同檔案伺服器工作負載的常見情況)，則將磁碟區大小限制為 10 TB，可改善效能和可靠性。使用較新 Hyper-V RCT API 和/或 ReFS 區塊複製和/或原生 SQL 備份 API 的備份解決方案，磁碟區大小達到 32 TB 以上時也可以順利執行。

使用量

磁碟區大小是指其可用容量，可以儲存的資料量。這是由 New-Volume cmdlet 的 -Size 參數提供，然後當您執行 Get-Volume cmdlet 時顯示在 Size 屬性中。

大小不同於磁碟區使用量，它占儲存集區的實體儲存總容量。使用量視其復原類型而定。例如，使用三向鏡像的磁碟區有其大小三倍大的使用量。

磁碟區使用量需要放在儲存集區中。

保留容量

在儲存集區中保留某些容量，提供磁碟空間在磁碟機故障之後「就地」修復，而改進資料安全性與效能。如果容量充足，立即、就地、平行修復甚至可以在故障的磁碟機更換之前將磁碟區還原為完整復原。此動作會自動執行。

我們建議每個伺服器保留相當於一個容量磁碟機的容量，最多 4 個磁碟機。在您的審慎考慮後，您可以保留更多，但這個最低建議保證任何磁碟機故障之後的立即、就地、平行修復成功。

例如，如果您有 2 部伺服器並使用數個 1 TB 容量磁碟機，將集區的 2 x 1 = 2 TB 設定為保留。如果您有 3 部伺服器和數個 1 TB 容量磁碟機，設定 3 x 1 = 3 TB 為保留。如果您有 4 部以上伺服器和數個 1 TB 容量磁碟機，設定 4 x 1 = 4 TB 為保留。

注意

在具有全部三種磁碟機類型 (NVMe + SSD + HDD) 的叢集中，我們建議每個伺服器保留相當於一個 SSD 加上一個 HDD 的容量，每個伺服器最多 4 個磁碟機。

範例：容量計劃

請考慮一個有四部伺服器的叢集。每個伺服器擁有一些快取磁碟機，加上 16 個 2 TB 磁碟機的容量。

4 servers x 16 drives each x 2 TB each = 128 TB

從這個儲存集區的 128 TB 中，我們將保留四個磁碟機 (或 8 TB)，以便在磁碟機故障之後進行就地修復，不需要急著更換磁碟。集區中剩下 120 TB 實體儲存容量，我們可用來建立磁碟區。

128 TB – (4 x 2 TB) = 120 TB

假設我們的部署需要裝載某些高度活躍 Hyper-V 虛擬電腦，但是我們也有很多冷儲存空間儲存寒冷 – 要保留的舊檔案和備份。因為我們有四部伺服器，我們建立四個磁碟區。

我們將在虛擬機器放在前兩個磁碟區，Volume1 和 Volume2。我們選擇 ReFS 做為檔案系統（適用於更快速的建立和檢查點）和三向鏡像復原類型以達到最佳效能。我們將冷儲存空間放在其他兩個磁碟區 Volume 3 和 Volume 4。我們選擇 NTFS 做為檔案系統 (適用於重複資料刪除) 和雙同位復原類型，將容量最大化。

我們不需要讓所有磁碟區大小相同，但為了簡化，例如我們可以讓它們全部都是 12 TB。

Volume1 和 Volume2 會各別佔用 12 TB x 33.3% 效率 = 36 TB 的實體儲存體容量。

Volume3 和 Volume4 會各別佔用 12 TB x 50.0% 效率 = 24 TB 的實體儲存體容量。

36 TB + 36 TB + 24 TB + 24 TB = 120 TB

四個磁碟區上可完全容納在我們集區中的可用實體儲存空間容量。完美！

提示

您不需要立即建立所有磁碟區。您隨時可以延伸磁碟區，或稍後建立新的磁碟區。

為了簡化，這整個範例使用十進位 (以 10 為底數) 單位，表示 1 TB = 1,000,000,000,000 位元組。不過，Windows 中的儲存數量以二進位 (以 2 為底數) 單位表示。例如，每個 2 TB 磁碟機在 Windows 中顯示為 1.82 TiB。同樣地，128 TB 儲存集區顯示為 116.41 TiB。這是預期行為。

使用方式

請參閱在 Azure Stack HCI 中建立磁碟區。

後續步驟

如需詳細資訊，請參閱：