Plánování svazků v clusterech Azure Stack HCI a Windows Serveru

Platí pro: Azure Stack HCI verze 22H2 a 21H2; Windows Server 2022, Windows Server 2019

Tento článek obsahuje pokyny, jak naplánovat svazky clusteru tak, aby splňovaly požadavky na výkon a kapacitu vašich úloh, včetně výběru jejich systému souborů, typu odolnosti a velikosti.

Poznámka

Prostory úložiště s přímým přístupem nepodporuje souborový server pro obecné použití. Pokud potřebujete spustit souborový server nebo jiné obecné služby v úložišti s přímým přístupem, nakonfigurujte ho na virtuálních počítačích.

Kontrola: Co jsou svazky

Svazky jsou místo, kam umístíte soubory, které vaše úlohy potřebují, například soubory VHD nebo VHDX pro virtuální počítače Hyper-V. Svazky kombinují jednotky ve fondu úložiště a přinášejí odolnost proti chybám, škálovatelnost a výhody výkonu Prostory úložiště s přímým přístupem, softwarově definované technologie úložiště za Azure Stack HCI a Windows Serverem.

Poznámka

Termínem "svazek" společně odkazujeme na svazek a virtuální disk pod ním, včetně funkcí poskytovaných jinými integrovanými funkcemi Systému Windows, jako jsou sdílené svazky clusteru (CSV) a ReFS. Pochopení těchto rozdílů na úrovni implementace není nutné k úspěšnému plánování a nasazení Prostory úložiště s přímým přístupem.

Diagram znázorňuje tři složky označené jako svazky, z nichž každá je přidružená k virtuálnímu disku označenému jako svazky, všechny přidružené ke společnému fondu disků úložiště.

Všechny svazky jsou přístupné všem serverům v clusteru současně. Po vytvoření se na všech serverech zobrazí ve složce C:\ClusterStorage\ .

Snímek obrazovky ukazuje okno Průzkumníka souborů s názvem ClusterStorage, které obsahuje svazky s názvy Volume1, Volume2 a Volume3.

Volba počtu svazků, které se mají vytvořit

Doporučujeme nastavit počet svazků jako násobek počtu serverů v clusteru. Pokud máte například 4 servery, dosáhnete konzistentnějšího výkonu se 4 celkovými svazky než se 3 nebo 5. To umožňuje clusteru distribuovat "vlastnictví" svazku (jeden server zpracovává orchestraci metadat pro každý svazek) rovnoměrně mezi servery.

Doporučujeme omezit celkový počet svazků na 64 svazků na cluster.

Volba systému souborů

Pro Prostory úložiště s přímým přístupem doporučujeme použít nový odolný systém souborů (ReFS). ReFS je prémiový systém souborů vytvořený pro virtualizaci a nabízí řadu výhod, včetně výrazného zrychlení výkonu a integrované ochrany před poškozením dat. Podporuje téměř všechny klíčové funkce NTFS, včetně odstranění duplicitních dat ve Windows Serveru verze 1709 a novějších verzích. Podrobnosti najdete v tabulce pro porovnání funkcí ReFS.

Pokud vaše úloha vyžaduje funkci, kterou ReFS ještě nepodporuje, můžete místo toho použít NTFS.

Tip

Svazky s různými systémy souborů můžou existovat společně ve stejném clusteru.

Volba typu odolnosti

Svazky v Prostory úložiště s přímým přístupem poskytují odolnost proti problémům s hardwarem, jako jsou selhání jednotky nebo serveru, a umožňují nepřetržitou dostupnost během údržby serveru, jako jsou aktualizace softwaru.

Poznámka

Typy odolnosti, které můžete zvolit, jsou nezávislé na tom, které typy jednotek máte.

Se dvěma servery

Se dvěma servery v clusteru můžete použít obousměrné zrcadlení nebo vnořenou odolnost.

Obousměrné zrcadlení uchovává dvě kopie všech dat, jednu kopii na jednotkách na každém serveru. Jeho efektivita úložiště je 50 procent; k zápisu 1 TB dat potřebujete alespoň 2 TB fyzické kapacity úložiště ve fondu úložiště. Obousměrné zrcadlení může bezpečně tolerovat selhání hardwaru najednou (jeden server nebo jednotka).

Diagram znázorňuje svazky označené daty a kopie spojené kruhovými šipkami a oba svazky jsou přidružené k bance disků na serverech.

Vnořená odolnost poskytuje odolnost dat mezi servery s obousměrným zrcadlením a pak zvyšuje odolnost v rámci serveru s obousměrným zrcadlením nebo zrcadleně akcelerovanou paritou. Vnoření zajišťuje odolnost dat i v případě, že se jeden server restartuje nebo není dostupný. Efektivita úložiště je 25 % s vnořeným obousměrným zrcadlením a přibližně 35–40 % pro vnořenou zrcadlovou akcelerovanou paritu. Vnořená odolnost může bezpečně tolerovat dvě selhání hardwaru najednou (dvě jednotky nebo server a jednotka na zbývajícím serveru). Kvůli této vyšší odolnosti dat doporučujeme používat vnořenou odolnost při produkčních nasazeních clusterů se dvěma servery. Další informace najdete v tématu Vnořená odolnost.

Diagram znázorňuje vnořenou zrcadlovou akcelerovanou paritu s obousměrným zrcadlem mezi servery přidruženými k obousměrnému zrcadlení v rámci každého serveru odpovídající vrstvě parity na každém serveru.

Se třemi servery

Se třemi servery byste měli použít třícestné zrcadlení, aby se zlepšila odolnost proti chybám a výkon. Třícestné zrcadlení uchovává tři kopie všech dat, jednu kopii na jednotkách na každém serveru. Efektivita úložiště je 33,3 % – k zápisu 1 TB dat potřebujete alespoň 3 TB fyzické kapacity úložiště ve fondu úložiště. Trojcestné zrcadlení může bezpečně tolerovat alespoň dva hardwarové problémy (jednotku nebo server) najednou. Pokud budou 2 uzly nedostupné, fond úložiště ztratí kvorum, protože 2/3 disků nejsou k dispozici a virtuální disky budou nedostupné. Uzel ale může být mimo provoz a jeden nebo více disků na jiném uzlu může selhat a virtuální disky zůstanou online. Pokud například restartujete jeden server, když náhle selže jiná jednotka nebo server, všechna data zůstanou v bezpečí a nepřetržitě přístupná.

Diagram znázorňuje svazek označený daty a dvě označené kopie spojené kruhovými šipkami s každým svazkem přidruženým k serveru obsahujícímu fyzické disky.

Se čtyřmi nebo více servery

Se čtyřmi nebo více servery si můžete pro každý svazek vybrat, jestli chcete použít trojcestné zrcadlení, duální paritu (často označovanou jako "kódování mazání"), nebo je kombinovat se zrcadleně akcelerovanou paritou.

Duální parita poskytuje stejnou odolnost proti chybám jako trojcestné zrcadlení, ale s lepší efektivitou úložiště. Se čtyřmi servery je efektivita úložiště 50,0 %; K uložení 2 TB dat potřebujete 4 TB fyzické kapacity úložiště ve fondu úložiště. To zvyšuje efektivitu úložiště na 66,7 % se sedmi servery a pokračuje až na 80%, a to až na 80%. Nevýhodou je, že paritní kódování je náročnější na výpočetní prostředky, což může omezit jeho výkon.

Diagram znázorňuje dva svazky označené daty a dva označené parity spojené kruhovými šipkami s každým svazkem přidruženým k serveru obsahujícímu fyzické disky.

Typ odolnosti, který se má použít, závisí na potřebách vaší úlohy. Tady je tabulka, která shrnuje, které úlohy jsou vhodné pro každý typ odolnosti, a také výkon a efektivitu úložiště jednotlivých typů odolnosti.

Typ odolnosti Efektivita kapacity Rychlost Úlohy
Zrcadlo Efektivita úložiště ukazuje 33 %
Trojcestné zrcadlo: 33 %
Obousměrné zrcadlo: 50 %
Výkon zobrazující 100 %
Nejvyšší výkon
Virtualizované úlohy
Databáze
Další úlohy s vysokým výkonem
Zrcadlově akcelerovaná parita Efektivita úložiště se zobrazuje kolem 50 %
Závisí na poměru zrcadla a parity.
Výkon se zobrazuje kolem 20 %
Mnohem pomalejší než zrcadlo, ale až dvakrát rychlejší než duální parita
Nejlepší pro velké sekvenční zápisy a čtení
Archivace a zálohování
Virtualizovaná infrastruktura desktopových počítačů
Duální parita Efektivita úložiště se zobrazuje kolem 80 %
4 servery: 50 %
16 serverů: až 80 %
Výkon se zobrazuje kolem 10 %
Nejvyšší latence vstupně-výstupních operací & využití procesoru při zápisu
Nejlepší pro velké sekvenční zápisy a čtení
Archivace a zálohování
Virtualizovaná infrastruktura desktopových počítačů

Když na výkonu nejvíce záleží

Úlohy, které mají přísné požadavky na latenci nebo vyžadují velké množství smíšených náhodných vstupně-výstupních operací za sekundu, jako jsou databáze SQL Server nebo virtuální počítače Hyper-V citlivé na výkon, by měly běžet na svazcích, které k maximalizaci výkonu používají zrcadlení.

Tip

Zrcadlení je rychlejší než jakýkoli jiný typ odolnosti. Zrcadlení používáme pro téměř všechny příklady výkonu.

Když nejvíce záleží na kapacitě

Úlohy, které píší zřídka, jako jsou datové sklady nebo "studené" úložiště, by měly běžet na svazcích, které používají duální paritu, aby se maximalizovala efektivita úložiště. Některé další úlohy, jako jsou Scale-Out souborový server (SoFS), infrastruktura virtuálních klientských počítačů (VDI) nebo jiné, které nevytváří velké množství náhodného vstupně-výstupního provozu s rychlým posunem nebo nevyžadují nejlepší výkon, můžou také podle vašeho uvážení používat duální paritu. Parita v porovnání se zrcadlením nevyhnutelně zvyšuje využití procesoru a latenci vstupně-výstupních operací, zejména u zápisů.

Při hromadném zápisu dat

Úlohy, které zapisují velké sekvenční průchody, jako jsou archivní nebo zálohovací cíle, mají další možnost: jeden svazek může kombinovat zrcadlení a duální paritu. Zápisy přistane nejprve v zrcadlené části a jsou postupně přesunuty do paritní části později. Tím se zrychlí příjem dat a sníží se využití prostředků při příchodu velkých zápisů tím, že se paritní kódování náročné na výpočetní prostředky může provádět po delší dobu. Při nastavování velikosti porcí vezměte v úvahu, že množství zápisů, ke kterým dochází najednou (například jedna denní záloha), by se mělo pohodlně vejít do zrcadlené části. Pokud například ingestujete 100 GB jednou denně, zvažte použití zrcadlení pro 150 AŽ 200 GB a duální paritu pro zbytek.

Výsledná efektivita úložiště závisí na poměru, který zvolíte. Některé příklady najdete v této ukázce .

Tip

Pokud během příjmu dat zaznamenáte náhlé snížení výkonu zápisu, může to znamenat, že zrcadlená část není dostatečně velká nebo že zrcadleně akcelerovaná parita není pro váš případ použití vhodná. Pokud se například výkon zápisu sníží z 400 MB/s na 40 MB/s, zvažte rozšíření zrcadlové části nebo přepnutí na trojcestné zrcadlení.

O nasazeních s NVMe, SSD a HDD

V nasazeních se dvěma typy jednotek poskytují rychlejší jednotky ukládání do mezipaměti, zatímco pomalejší jednotky poskytují kapacitu. K tomu dochází automaticky – další informace najdete v tématu Principy mezipaměti v Prostory úložiště s přímým přístupem. V takových nasazeních se všechny svazky nakonec nacházejí na stejném typu jednotek – na jednotkách kapacity.

V nasazeních se všemi třemi typy jednotek zajišťují ukládání do mezipaměti pouze nejrychlejší jednotky (NVMe), takže dva typy jednotek (SSD a HDD) poskytují kapacitu. Pro každý svazek si můžete vybrat, jestli se nachází zcela na úrovni SSD, zcela na úrovni HDD, nebo jestli bude překlenovat oba svazky.

Důležité

K umístění úloh nejvíce citlivých na výkon na čistě flash doporučujeme použít úroveň SSD.

Volba velikosti svazků

V Azure Stack HCI doporučujeme omezit velikost každého svazku na 64 TB.

Tip

Pokud používáte řešení zálohování, které spoléhá na službu Stínová kopie svazku (VSS) a poskytovatele softwaru Volsnap – což je běžné u úloh souborového serveru – omezení velikosti svazku na 10 TB zvýší výkon a spolehlivost. Řešení zálohování, která používají novější rozhraní HYPER-V RCT API nebo klonování bloků ReFS nebo nativní rozhraní API zálohování SQL, fungují dobře až do 32 TB a více.

Stopa

Velikost svazku odpovídá jeho využitelné kapacitě, tedy množství dat, která může uložit. To je poskytováno parametrem -Size rutiny New-Volume a pak se zobrazí ve vlastnosti Size při spuštění rutiny Get-Volume .

Velikost se liší od nároků svazku a celkové fyzické kapacity úložiště, které zabírá ve fondu úložiště. Nároky závisí na typu odolnosti. Například svazky, které používají trojcestné zrcadlení, mají trojnásobek své velikosti.

Nároky vašich svazků se musí vejít do fondu úložiště.

Diagram znázorňuje svazek o velikosti 2 TB oproti 6 TB ve fondu úložiště se zadaným násobitelem tří.

Záložní kapacita

Ponechání určité kapacity ve fondu úložiště bez přidělení poskytne svazkům prostor pro místní opravu v případě selhání jednotek, což zlepší bezpečnost a výkon dat. Pokud je k dispozici dostatečná kapacita, okamžitá místní paralelní oprava může obnovit svazky na plnou odolnost ještě před nahrazením vadných jednotek. K tomu dochází automaticky.

Doporučujeme vyhraďte si ekvivalent jedné jednotky kapacity na server, a to až 4 jednotky. Můžete si rezervovat více podle vlastního uvážení, ale toto minimální doporučení zaručuje okamžitou místní paralelní opravu, která může být úspěšná po selhání jakékoli jednotky.

Diagram znázorňuje svazek přidružený k několika diskům ve fondu úložiště a nepřidružené disky označené jako rezerva.

Pokud máte například 2 servery a používáte 1TB kapacitní jednotky, vyhraďte si jako rezervu 2 × 1 = 2 TB fondu. Pokud máte 3 servery a 1TB kapacitní jednotky, vyhraďte si jako rezervu 3 × 1 = 3 TB. Pokud máte 4 nebo více serverů a jednotky s kapacitou 1 TB, vyhraďte si jako rezervu 4 × 1 = 4 TB.

Poznámka

V clusterech s jednotkami všech tří typů (NVMe + SSD + HDD) doporučujeme, abyste si rezervoval ekvivalent jednoho disku SSD a jednoho pevného disku na server, z každého až 4 jednotek.

Příklad: Plánování kapacity

Představte si jeden cluster se čtyřmi servery. Každý server má několik jednotek mezipaměti plus šestnáct 2TB jednotek pro kapacitu.

4 servers x 16 drives each x 2 TB each = 128 TB

Z těchto 128 TB ve fondu úložiště jsme vyhradili čtyři jednotky nebo 8 TB, aby místní opravy mohly proběhnout bez spěchu na výměnu jednotek po jejich selhání. Ve fondu zůstane 120 TB fyzické úložné kapacity, pomocí které můžeme vytvářet svazky.

128 TB – (4 x 2 TB) = 120 TB

Předpokládejme, že naše nasazení potřebujeme k hostování některých vysoce aktivních virtuálních počítačů Hyper-V, ale máme také velké množství studeného úložiště – staré soubory a zálohy, které potřebujeme zachovat. Protože máme čtyři servery, vytvoříme čtyři svazky.

Pojďme virtuální počítače umístit na první dva svazky: Svazek1 a Svazek2. Jako systém souborů (pro rychlejší vytváření a kontrolní body) zvolíme Odolný systém souborů (ReFS) a trojcestné zrcadlení pro zajištění odolnosti, abychom maximalizovali výkon. Pojďme umístit studené úložiště na zbylé dva svazky, Svazek 3 a Svazek 4. Jako systém souborů (pro odstranění duplicitních dat) zvolíme systém souborů NTFS a pro zajištění odolnosti proti chybám zvolíme duální paritu, abychom maximalizovali kapacitu.

Nemusíme mít všechny svazky stejnou velikost, ale pro jednoduchost to uděláme – můžeme je například nastavit tak, aby všechny byly 12 TB.

Svazky1 a Svazek2 zabírají 12 TB × 33,3% efektivitu = 36 TB fyzické úložné kapacity.

Svazky 3 a Volume4 zabírají 12 TB × 50,0% efektivitu = 24 TB fyzické úložné kapacity.

36 TB + 36 TB + 24 TB + 24 TB = 120 TB

Čtyři svazky přesně odpovídají fyzické úložné kapacitě, která je k dispozici v našem fondu. Skvělé!

Diagram znázorňuje dva 12TB svazky s trojcestným zrcadlem, každý přidružený k úložišti o kapacitě 36 TB, a dva svazky s duální paritou o kapacitě 12 TB, každý s 24 TB, které ve fondu úložiště zabírají až 120 TB.

Tip

Nemusíte vytvářet všechny svazky hned. Svazky můžete kdykoli rozšířit nebo vytvořit nové svazky později.

Pro zjednodušení se v tomto příkladu používají desetinné jednotky (základ 10), což znamená 1 TB = 1 000 000 000 000 bajtů. Množství úložiště v systému Windows se však zobrazuje v binárních jednotkách (base-2). Například každá 2TB jednotka se ve Windows zobrazí jako 1,82 TiB. Podobně se fond úložiště o kapacitě 128 TB zobrazí jako 116,41 TiB. To se očekává.

Využití

Viz Vytváření svazků v Azure Stack HCI.

Další kroky

Další informace najdete také v tématech: