odolnost proti chybám a efektivita úložiště u Azure Stackch clusterů HCI a Windows serverů
Platí pro: Azure Stack HCI, verze 21H2 a 20H2; Windows server 2022, Windows server 2019
Tento článek vysvětluje dostupné možnosti odolnosti a popisuje požadavky na škálování, efektivitu úložiště a obecné výhody a kompromisy každého z nich.
Přehled
Prostory úložiště Direct poskytuje odolnost proti chybám, která se často označuje jako "odolnost", pro vaše data. Jeho implementace je podobná RAID, kromě distribuovaných napříč servery a implementována v softwaru.
stejně jako u RAID existuje několik různých způsobů, jak to Prostory úložiště udělat, což vede k různým kompromisům mezi odolností proti chybám, efektivitou úložiště a složitostí výpočtů. Mezi ně patří například "zrcadlení" a "parita", druhé, někdy označované jako "mazání kódu".
Zrcadlení
Zrcadlení zajišťuje odolnost proti chybám tím, že udržuje více kopií všech dat. To je velmi podobné jako RAID-1. Způsob, jakým jsou data rozložená a umístěná, jsou netriviální (Další informace najdete v tomto blogovém příspěvku ), ale v plném rozsahu platí, že všechna data uložená pomocí zrcadlení se zapisují v celých případech několikrát. Každá kopie je zapsána na jiný fyzický hardware (různé jednotky na různých serverech), u kterých se předpokládá nezávisle na selhání.
Můžete zvolit mezi dvěma typy zrcadlení – "obousměrný" a "třícestný".
Dvoucestný zrcadlový svazek
Obousměrné zrcadlení zapisuje dvě kopie všeho. Efektivita úložiště je 50% – pro zápis 1 TB dat potřebujete alespoň 2 TB kapacity fyzického úložiště. podobně potřebujete alespoň dvě "domény selhání hardwaru" – s Prostory úložiště Direct, což znamená dva servery.

Upozornění
Pokud máte více než dva servery, doporučujeme místo toho použít trojrozměrné zrcadlení.
Třícestný zrcadlový svazek
Třícestný zrcadlení zapisuje tři kopie všeho. Efektivita úložiště je 33,3% – pro zápis 1 TB dat potřebujete aspoň 3 TB kapacity fyzického úložiště. podobně potřebujete alespoň tři domény selhání hardwaru – pomocí Prostory úložiště Direct, což znamená tři servery.
Třícestný zrcadlení může bezpečně tolerovat alespoň dva problémy s hardwarem (na disku nebo na serveru). Pokud například restartujete jeden server, když dojde k výpadku jiné jednotky nebo serveru, všechna data zůstanou bezpečná a nepřetržitě dostupná.

Parity
Kódování parity, často označované jako "mazání kódu", zajišťuje odolnost proti chybám pomocí bitových aritmetických výpočtů, což může mít výjimečně komplikované. Způsob, jak to funguje, je méně zřejmý než zrcadlení a existuje mnoho skvělých online prostředků (například Tento průvodce Dummies třetí strany pro mazání kódu), který vám pomůže získat nápad. Je nám stačit, když je lepší efektivita úložiště, aniž by došlo k narušení odolnosti proti chybám.
Prostory úložiště nabízí dva typy parity – "jednotná" parita a "duální" parita, druhá používá pokročilou techniku nazvanou "místní rekonstrukce kódu" při větších škálováních.
Důležité
Pro většinu úloh citlivých na výkon doporučujeme použití zrcadlení. Další informace o tom, jak vyrovnávat výkon a kapacitu v závislosti na vašich úlohách, najdete v tématu plánování svazků.
Jednoduchá parita
Jednoduchá parita uchovává pouze jeden logický paritový symbol, který poskytuje odolnost proti chybám proti jednomu selhání současně. Nejlépe se podobá RAID-5. chcete-li použít jednoduchou paritu, potřebujete alespoň tři domény selhání hardwaru – pomocí Prostory úložiště Direct, což znamená tři servery. Vzhledem k tomu, že třícestný zrcadlení poskytuje větší odolnost proti chybám ve stejném měřítku, nebudeme používat jednoduchou paritu. Ale pokud si ho nebudete používat a plně se podporuje, je tam.
Upozornění
Nemůžeme používat jednoduchou paritu, protože může bezpečně tolerovat jenom jedno selhání hardwaru: Pokud provádíte restartování jednoho serveru, když dojde k výpadku jiné jednotky nebo serveru, dojde k výpadku. Pokud máte jenom tři servery, doporučujeme použít třícestný způsob zrcadlení. Pokud máte čtyři nebo více, přečtěte si další část.
Duální parita
Duální parita implementuje Reed-Solomon chybově opravených kódů, aby zachovala dva bitové paritní symboly, čímž zajišťuje stejnou odolnost proti chybám jako třícestný zrcadlení (tj. až dvě selhání najednou), ale s lepší efektivitou úložiště. Nejlépe se podobá RAID-6. pro použití duální parity potřebujete alespoň čtyři domény selhání hardwaru – pomocí Prostory úložiště Direct, což znamená čtyři servery. V této škále je efektivita úložiště 50% – Pokud chcete ukládat 2 TB dat, budete potřebovat 4 TB kapacity fyzického úložiště.

Efektivita úložiště s duální paritou zvyšuje více domén selhání hardwaru, od 50% do 80 procent. například na sedm (s Prostory úložiště Direct, což znamená sedm serverů) se efektivita blíží 66,7% – pokud chcete ukládat 4 tb dat, budete potřebovat jenom 6 tb fyzické kapacity úložiště.

V části Shrnutí najdete efektivitu kódů dvojí a místní rekonstrukce v každé škále.
Místní kódy rekonstrukce
Prostory úložiště zavádí pokročilou techniku vyvinutou Microsoft Research s názvem "místní rekonstrukce codes" nebo LRC. Ve velkém měřítku používá duální parita LRC k rozdělení kódování/dekódování do několika menších skupin, aby se snížila režie potřebná k zápisu nebo obnovení při selhání.
S pevnými disky (HDD) je velikost skupiny čtyři symboly; u jednotek SSD (Solid-State Drive) je velikost skupiny šest symbolů. Například toto rozložení vypadá jako u pevných disků a 12 domén selhání hardwaru (tzn. 12 serverů) – existují dvě skupiny čtyř datových symbolů. Dosahuje 72,7 procent efektivity úložiště.

Doporučujeme, abyste si zatím eminentlyi přehledně, jak místní kódy rekonstrukce zpracovávají různé scénáře selhání, a proč jsouna základě Claus Joergensenvyžádané.
Zrcadlení – urychlené parity
Prostory úložiště přímý svazek může být součástí zrcadlení a parity částí. Zapisuje první pozemky do zrcadlené části a postupně se přesunou do paritní části později. To efektivně používá zrcadlení ke zrychlení mazání kódu.
Ke smíchání trojrozměrného zrcadlení a duální parity potřebujete alespoň čtyři domény selhání, což znamená čtyři servery.
Efektivita úložiště parity podporující zrcadlení je mezi tím, co byste se dostali z použití všech zrcadlení nebo všech parit, a závisí na tom, jaké proporce zvolíte. Například ukázka na značce 37-minut v této prezentaci ukazuje různé směsi, které dosahují 46 procent, 54 procent 65 a% efektivitu s 12 servery.
Důležité
Pro většinu úloh citlivých na výkon doporučujeme použití zrcadlení. Další informace o tom, jak vyrovnávat výkon a kapacitu v závislosti na vašich úlohách, najdete v tématu plánování svazků.
Souhrn
v této části jsou shrnuty typy odolnosti dostupné v Prostory úložiště přímých, minimální požadavky na škálování pro použití každého typu, počet chyb, které každý typ může tolerovat, a odpovídající efektivita úložiště.
Typy odolnosti
| Odolnost | Odolnost proti chybám | Storage efektivita |
|---|---|---|
| Dvoucestný zrcadlový svazek | 1 | 50,0% |
| Třícestný zrcadlový svazek | 2 | 33,3% |
| Duální parita | 2 | 50,0%-80,0% |
| Smíšené | 2 | 33,3%-80,0% |
Minimální požadavky na škálování
| Odolnost | Minimální požadované domény selhání |
|---|---|
| Dvoucestný zrcadlový svazek | 2 |
| Třícestný zrcadlový svazek | 3 |
| Duální parita | 4 |
| Smíšené | 4 |
Tip
Pokud používáte odolnost skříně nebo stojanu proti chybám,počet domén selhání odkazuje na počet serverů. Počet jednotek na jednotlivých serverech nemá vliv na typy odolnosti, které můžete použít, pokud splňujete minimální požadavky pro Prostory úložiště Direct.
Efektivita duální parity pro hybridní nasazení
Tato tabulka ukazuje efektivitu úložiště kódů duální parity a místních obnovování v každém měřítku pro hybridní nasazení, která obsahují jak pevné disky (HDD), tak i jednotky SSD (solid-state drives).
| Domény selhání | Layout | Efektivita |
|---|---|---|
| 2 | – | – |
| 3 | – | – |
| 4 | RS 2+2 | 50.0% |
| 5 | RS 2+2 | 50.0% |
| 6 | RS 2+2 | 50.0% |
| 7 | RS 4+2 | 66.7% |
| 8 | RS 4+2 | 66.7% |
| 9 | RS 4+2 | 66.7% |
| 10 | RS 4+2 | 66.7% |
| 11 | RS 4+2 | 66.7% |
| 12 | LRC (8, 2, 1) | 72.7% |
| 13 | LRC (8, 2, 1) | 72.7% |
| 14 | LRC (8, 2, 1) | 72.7% |
| 15 | LRC (8, 2, 1) | 72.7% |
| 16 | LRC (8, 2, 1) | 72.7% |
Efektivita duální parity pro nasazení typu all-flash
Tato tabulka ukazuje efektivitu úložiště kódů duální parity a místních obnovování v každém měřítku pro všechna nasazení typu flash, která obsahují jenom jednotky SSD (solid-state drives). Rozložení parity může používat větší velikosti skupin a dosáhnout lepší efektivity úložiště v konfiguraci flash disku.
| Domény selhání | Layout | Efektivita |
|---|---|---|
| 2 | – | – |
| 3 | – | – |
| 4 | RS 2+2 | 50.0% |
| 5 | RS 2+2 | 50.0% |
| 6 | RS 2+2 | 50.0% |
| 7 | RS 4+2 | 66.7% |
| 8 | RS 4+2 | 66.7% |
| 9 | RS 6+2 | 75.0% |
| 10 | RS 6+2 | 75.0% |
| 11 | RS 6+2 | 75.0% |
| 12 | RS 6+2 | 75.0% |
| 13 | RS 6+2 | 75.0% |
| 14 | RS 6+2 | 75.0% |
| 15 | RS 6+2 | 75.0% |
| 16 | LRC (12, 2, 1) | 80.0% |
Příklady
Pokud nemáte jenom dva servery, doporučujeme použít trojrozměrné zrcadlení nebo duální paritu, protože nabízejí lepší odolnost proti chybám. Konkrétně zajišťují, aby všechna data zůstala bezpečná a nepřetržitě přístupná i v případě, že dvě domény selhání – Prostory úložiště Direct, což znamená dva servery – jsou ovlivněny souběžným selháním.
Příklady, kde všechno zůstává online
Těchto šest příkladů znázorňuje, co může tolerovat trojrozměrné zrcadlení nebo duální parita.
- 1. Ztráta jedné jednotky (včetně jednotek mezipaměti)
- 2. Jeden server se ztratil

- 3. Jeden server a jedna jednotka se ztratily
- 4. Ztráta dvou jednotek na různých serverech

- 5. Ztráta více než dvou jednotek, pokud jsou ovlivněny nejdél dva servery
- 6. Ztráta dvou serverů

... V každém případě zůstanou všechny svazky online. (Ujistěte se, že cluster udržuje kvorum.)
Příklady, kdy všechno přejde do režimu offline
Během své životnosti může Prostory úložiště tolerovat libovolný počet selhání, protože po každém z nich obnoví úplnou odolnost, a to za dostatečně dlouhou dobu. Selhání ale mohou být v libovolném okamžiku bezpečně ovlivněny většinou dvěma doménami selhání. Následuje příklad toho, co trojrozměrné zrcadlení a/nebo duální parita není možné tolerovat.
- 7. Ztráta jednotek na třech nebo více serverech najednou
- 8. Ztráta tří nebo více serverů najednou

Využití
Podívejte se na vytvoření svazků.
Další kroky
Další informace o tématech uvedených v tomto článku najdete v následujících tématech: