Hibatűrés és a tárolási hatékonyság a Azure Stack HCI-benFault tolerance and storage efficiency in Azure Stack HCI

A következőkre vonatkozik: Azure Stack HCI, Version 20H2; Windows Server 2019Applies to: Azure Stack HCI, version 20H2; Windows Server 2019

Ez a témakör bemutatja a Közvetlen tárolóhelyek rendelkezésre álló rugalmassági lehetőségeket, és ismerteti a méretezési követelményeket, a tárolási hatékonyságot, valamint az egyes eszközök általános előnyeit és kompromisszumait.This topic introduces the resiliency options available in Storage Spaces Direct and outlines the scale requirements, storage efficiency, and general advantages and tradeoffs of each. Emellett néhány használati útmutatót is tartalmaz a kezdéshez, és néhány nagyszerű dokumentumra, blogra és további tartalomra hivatkozik, ahol további információt talál.It also presents some usage instructions to get you started, and references some great papers, blogs, and additional content where you can learn more.

Ha már ismeri a tárolóhelyeket, akkor érdemes lehet kihagyni az Összefoglalás szakaszt.If you are already familiar with Storage Spaces, you may want to skip to the Summary section.

ÁttekintésOverview

A tárolóhelyek feladata a hibatűrés biztosítása, amelyet gyakran "rugalmasságnak" nevezünk az adataihoz.At its heart, Storage Spaces is about providing fault tolerance, often called "resiliency," for your data. A megvalósítás hasonló a RAID szolgáltatáshoz, kivéve a kiszolgálókon elosztott és a szoftverben megvalósított szoftverek között.Its implementation is similar to RAID, except distributed across servers and implemented in software.

Ahogy a RAID esetében, a tárolóhelyek többféleképpen is megtehetik ezt, ami különböző kompromisszumokat tesz a hibatűrés, a tárolási hatékonyság és a számítási komplexitás között.As with RAID, there are a few different ways Storage Spaces can do this, which make different tradeoffs between fault tolerance, storage efficiency, and compute complexity. Ezek nagyjából két kategóriába sorolhatók: "tükrözés" és "paritás", az utóbbi más néven "törlési kódolás".These broadly fall into two categories: "mirroring" and "parity," the latter sometimes called "erasure coding."

TükrözésMirroring

A tükrözések hibatűrést biztosítanak, ha az összes adattal több példányt tart.Mirroring provides fault tolerance by keeping multiple copies of all data. Ez leginkább hasonlít a RAID-1-re.This most closely resembles RAID-1. Az adatszalagos tárolás és az azokhoz tartozó információk nem triviálisak ( ebben a blogban további információkat talál), de feltétlenül igaz, hogy a tükrözést használó összes tárolt információ teljes egészében, többször is megírásra kerül.How that data is striped and placed is non-trivial (see this blog to learn more), but it is absolutely true to say that any data stored using mirroring is written, in its entirety, multiple times. A rendszer minden egyes példányt különböző fizikai hardverre (különböző kiszolgálókon lévő különböző meghajtókra) ír, amelyeket feltételez, hogy egymástól függetlenül meghibásodik.Each copy is written to different physical hardware (different drives in different servers) that are assumed to fail independently.

A tárolóhelyek a tükrözés két változatát kínálja – "kétirányú" és "háromutas".Storage Spaces offers two flavors of mirroring – "two-way" and "three-way."

Kétutas tükrözésTwo-way mirror

A kétirányú tükrözés mindenből két másolatot ír.Two-way mirroring writes two copies of everything. A tárterület hatékonysága 50 százalék – 1 TB adat írásához legalább 2 TB fizikai tárolókapacitás szükséges.Its storage efficiency is 50 percent – to write 1 TB of data, you need at least 2 TB of physical storage capacity. Ehhez hasonlóan legalább két hardveres "tartalék tartományra" van szükség, közvetlen tárolóhelyek, és ez két kiszolgálót jelent.Likewise, you need at least two hardware 'fault domains' – with Storage Spaces Direct, that means two servers.

Kétirányú tükrözés

Figyelmeztetés

Ha kettőnél több kiszolgáló is van, javasoljuk, hogy használjon háromutas tükrözést.If you have more than two servers, we recommend using three-way mirroring instead.

Háromutas tükrözésThree-way mirror

A háromutas tükrözés mindenből három másolatot ír.Three-way mirroring writes three copies of everything. A tárterület hatékonysága 33,3 százalék – 1 TB adat írásához legalább 3 TB fizikai tárolókapacitás szükséges.Its storage efficiency is 33.3 percent – to write 1 TB of data, you need at least 3 TB of physical storage capacity. Ehhez hasonlóan legalább három hardveres tartalék tartományra van szükség – Közvetlen tárolóhelyek, amely három kiszolgálót jelent.Likewise, you need at least three hardware fault domains – with Storage Spaces Direct, that means three servers.

A háromutas tükrözés képes biztonságosan elviselni legalább két hardveres problémát (meghajtó vagy kiszolgáló)egyszerre.Three-way mirroring can safely tolerate at least two hardware problems (drive or server) at a time. Ha például egy kiszolgáló újraindításakor hirtelen egy másik meghajtó vagy kiszolgáló meghibásodik, az összes adat biztonságban és folyamatosan elérhető marad.For example, if you're rebooting one server when suddenly another drive or server fails, all data remains safe and continuously accessible.

háromutas tükrözés

ParityParity

A paritásos kódolás, amelyet gyakran "törlési kódolásnak" neveznek, a bitenkénti aritmetika használatával biztosít hibatűrést, ami rendkívül bonyolultlehet.Parity encoding, often called "erasure coding," provides fault tolerance using bitwise arithmetic, which can get remarkably complicated. A működés kevésbé nyilvánvaló, mint a tükrözés, és számos nagyszerű online erőforrás létezik (például a harmadik féltől származó , a kódolás törlésére vonatkozó útmutató), amely segítséget nyújt az ötlet megszerzésében.The way this works is less obvious than mirroring, and there are many great online resources (for example, this third-party Dummies Guide to Erasure Coding) that can help you get the idea. Elég azt mondani, hogy jobb tárolási hatékonyságot biztosít anélkül, hogy a hibatűrést veszélyeztetné.Sufficed to say it provides better storage efficiency without compromising fault tolerance.

A tárolóhelyek két paritásos, "single" paritásos és "kettős" paritást biztosítanak, az utóbbi pedig a "helyi újraépítési kódok" nevű speciális technikát alkalmazza nagyobb léptékben.Storage Spaces offers two flavors of parity – "single" parity and "dual" parity, the latter employing an advanced technique called "local reconstruction codes" at larger scales.

Fontos

Javasoljuk, hogy a legtöbb teljesítményre érzékeny számítási feladathoz használjon tükrözést.We recommend using mirroring for most performance-sensitive workloads. Ha többet szeretne megtudni a teljesítmény és a kapacitás kiegyensúlyozásáról a munkaterhelés alapján, tekintse meg a kötetek megtervezésecímű témakört.To learn more about how to balance performance and capacity depending on your workload, see Plan volumes.

Egyetlen paritásSingle parity

Az egyszeres paritás csak egy bitenkénti-paritásos szimbólumot tart fenn, amely egyszerre csak egy hibához biztosít hibatűrést.Single parity keeps only one bitwise parity symbol, which provides fault tolerance against only one failure at a time. A legszorosabban hasonlít a RAID-5-re.It most closely resembles RAID-5. Ha egyetlen paritást szeretne használni, legalább három hardveres tartalék tartományra van szüksége – Közvetlen tárolóhelyek, amely három kiszolgálót jelent.To use single parity, you need at least three hardware fault domains – with Storage Spaces Direct, that means three servers. Mivel a háromutas tükrözések nagyobb hibatűrést biztosítanak ugyanazon a skálán, az egyetlen paritás használatának visszatartása.Because three-way mirroring provides more fault tolerance at the same scale, we discourage using single parity. Itt azonban ott van, ha ragaszkodik a használathoz, és teljes mértékben támogatott.But, it's there if you insist on using it, and it is fully supported.

Figyelmeztetés

Az egyetlen paritás használatának megakadályozása, mert az csak egyetlen hardverhiba esetén képes biztonságosan elviselni egyszerre: Ha egy kiszolgáló újraindításakor hirtelen egy másik meghajtó vagy kiszolgáló meghibásodik, a rendszer leállást tapasztal.We discourage using single parity because it can only safely tolerate one hardware failure at a time: if you're rebooting one server when suddenly another drive or server fails, you will experience downtime. Ha csak három kiszolgálóval rendelkezik, javasoljuk, hogy háromutas tükrözést használjon.If you only have three servers, we recommend using three-way mirroring. Ha négy vagy több van, tekintse meg a következő szakaszt.If you have four or more, see the next section.

Kettős paritásDual parity

A kettős paritás a Reed-Salamon hibáját alkalmazza – a kódok kijavításával két bitenkénti paritásos szimbólumot biztosít, így ugyanazt a hibatűrést biztosítja, mint a háromutas tükrözés (akár két hiba egyszerre), de a jobb tárolási hatékonyság érdekében.Dual parity implements Reed-Solomon error-correcting codes to keep two bitwise parity symbols, thereby providing the same fault tolerance as three-way mirroring (i.e. up to two failures at once), but with better storage efficiency. Ez a leginkább hasonlít a RAID-6-ra.It most closely resembles RAID-6. A kettős paritás használatához legalább négy hardveres tartalék tartományra van szükség – Közvetlen tárolóhelyek, amely négy kiszolgálót jelent.To use dual parity, you need at least four hardware fault domains – with Storage Spaces Direct, that means four servers. Ezen a skálán a tárterület hatékonysága 50% – 2 TB-nyi adat tárolásához 4 TB-os fizikai tárolókapacitásra van szükség.At that scale, the storage efficiency is 50% – to store 2 TB of data, you need 4 TB of physical storage capacity.

kettős paritású

A kettős paritás tárolási hatékonysága növeli a további hardveres tartalék tartományokat, 50%-kal, akár 80%-kal.The storage efficiency of dual parity increases the more hardware fault domains you have, from 50 percent up to 80 percent. Ha például hét (Közvetlen tárolóhelyek, azaz hét kiszolgáló), a hatékonyság 66,7 százalékra ugrik – 4 TB-nyi adat tárolására, mindössze 6 TB fizikai tárolókapacitásra van szüksége.For example, at seven (with Storage Spaces Direct, that means seven servers) the efficiency jumps to 66.7 percent – to store 4 TB of data, you need just 6 TB of physical storage capacity.

kettős paritás – széles

Tekintse meg az Összefoglalás szakaszt a kettős és a helyi újjáépítési kódok hatékonyságának növeléséhez minden méretben.See the Summary section for the efficiency of dual party and local reconstruction codes at every scale.

Helyi újjáépítési kódokLocal reconstruction codes

A tárolóhelyek szolgáltatás a Microsoft Research által fejlesztett, "helyi újraépítési kódok" vagy a FORRÁSKÖZPONT által kifejlesztett fejlett technikát mutatja be.Storage Spaces introduces an advanced technique developed by Microsoft Research called "local reconstruction codes," or LRC. Nagy méretekben a kettős paritás a FORRÁSKÖZPONT használatával osztja fel a kódolást/dekódolást néhány kisebb csoportba, hogy csökkentse a hibákból való íráshoz vagy helyreállításhoz szükséges terhelést.At large scale, dual parity uses LRC to split its encoding/decoding into a few smaller groups, to reduce the overhead required to make writes or recover from failures.

A merevlemez-meghajtók (HDD) esetében a csoport mérete négy szimbólum; a szilárdtest-meghajtók (SSD) esetében a csoport mérete hat szimbólum.With hard disk drives (HDD) the group size is four symbols; with solid-state drives (SSD), the group size is six symbols. Tegyük fel például, hogy az elrendezés úgy néz ki, mint a merevlemez-meghajtók és 12 hardverhiba-tartomány (azaz 12 kiszolgáló) – a négy adatszimbólum két csoportja létezik.For example, here's what the layout looks like with hard disk drives and 12 hardware fault domains (meaning 12 servers) – there are two groups of four data symbols. Ez 72,7%-os tárolási hatékonyságot érhet el.It achieves 72.7 percent storage efficiency.

helyi újjáépítés – kódok

Azt javasoljuk, hogy ezt a részletesen olvasható , a helyi újjáépítési kódok különböző meghibásodási forgatókönyveket kezelő, és miért vonzó, a saját Claus Joergensen.We recommend this in-depth yet eminently readable walk-through of how local reconstruction codes handle various failure scenarios, and why they're appealing, by our very own Claus Joergensen.

Tükrözött, gyorsított paritásMirror-accelerated parity

Egy Közvetlen tárolóhelyek kötet lehet a Mirror és a part paritás.A Storage Spaces Direct volume can be part mirror and part parity. Először a tükrözött részbe írja a földet, és később fokozatosan áthelyezi a paritási részbe.Writes land first in the mirrored portion and are gradually moved into the parity portion later. Ennek hatására a tükrözés a törlési kódolás felgyorsítására használatos.Effectively, this is using mirroring to accelerate erasure coding.

A háromutas tükrözés és a kettős paritás együttes létrehozásához legalább négy tartalék tartományra van szükség, amely négy kiszolgálót jelent.To mix three-way mirror and dual parity, you need at least four fault domains, meaning four servers.

A tükrözött felgyorsított paritás tárolási hatékonysága az összes tükrözés vagy az összes paritás használata esetén, és a választott aránytól függ.The storage efficiency of mirror-accelerated parity is in between what you'd get from using all mirror or all parity, and depends on the proportions you choose. A bemutató 37 perces jelzése például különböző mixekből áll, amelyek a 46 százalékát, a 54 százalékát és a 65 százalékos hatékonyságot teszik elérhetővé 12 kiszolgálóval.For example, the demo at the 37-minute mark of this presentation shows various mixes achieving 46 percent, 54 percent, and 65 percent efficiency with 12 servers.

Fontos

Javasoljuk, hogy a legtöbb teljesítményre érzékeny számítási feladathoz használjon tükrözést.We recommend using mirroring for most performance-sensitive workloads. Ha többet szeretne megtudni a teljesítmény és a kapacitás kiegyensúlyozásáról a munkaterhelés alapján, tekintse meg a kötetek megtervezésecímű témakört.To learn more about how to balance performance and capacity depending on your workload, see Plan volumes.

ÖsszefoglalásSummary

Ez a szakasz összefoglalja a Közvetlen tárolóhelyek rendelkezésre álló rugalmassági típusokat, az egyes típusok használatának minimális méretezési követelményeit, az egyes típusokhoz tartozó hibák számát, valamint a megfelelő tárolási hatékonyságot.This section summarizes the resiliency types available in Storage Spaces Direct, the minimum scale requirements to use each type, how many failures each type can tolerate, and the corresponding storage efficiency.

Rugalmassági típusokResiliency types

RugalmasságResiliency Meghibásodási toleranciaFailure tolerance Tárolási hatékonyságStorage efficiency
Kétutas tükrözésTwo-way mirror 11 50,0%50.0%
Háromutas tükrözésThree-way mirror 22 33,3%33.3%
Kettős paritásDual parity 22 50,0% – 80,0%50.0% - 80.0%
VegyesMixed 22 33,3% – 80,0%33.3% - 80.0%

Minimális skálázási követelményekMinimum scale requirements

RugalmasságResiliency Minimálisan szükséges tartalék tartományokMinimum required fault domains
Kétutas tükrözésTwo-way mirror 22
Háromutas tükrözésThree-way mirror 33
Kettős paritásDual parity 44
VegyesMixed 44

Tipp

Hacsak nem használ váz-vagy rack-hibatűrést, a tartalék tartományok száma a kiszolgálók számára utal.Unless you are using chassis or rack fault tolerance, the number of fault domains refers to the number of servers. Az egyes kiszolgálókon található meghajtók száma nem befolyásolja, hogy mely rugalmassági típusok használhatók, ha megfelel a Közvetlen tárolóhelyek minimális követelményeinek.The number of drives in each server does not affect which resiliency types you can use, as long as you meet the minimum requirements for Storage Spaces Direct.

Kettős paritású hatékonyság a hibrid üzembe helyezésekhezDual parity efficiency for hybrid deployments

Ez a táblázat a kettős paritású és a helyi újjáépítési kódok tárolási hatékonyságát mutatja a hibrid telepítések esetében, amelyek merevlemez-meghajtókat (HDD) és SSD-meghajtókat egyaránt tartalmaznak.This table shows the storage efficiency of dual parity and local reconstruction codes at each scale for hybrid deployments which contain both hard disk drives (HDD) and solid-state drives (SSD).

Tartalék tartományokFault domains LayoutLayout HatékonyságEfficiency
22
33
44 RS 2 + 2RS 2+2 50,0%50.0%
55 RS 2 + 2RS 2+2 50,0%50.0%
66 RS 2 + 2RS 2+2 50,0%50.0%
77 RS 4 + 2RS 4+2 66,7%66.7%
88 RS 4 + 2RS 4+2 66,7%66.7%
99 RS 4 + 2RS 4+2 66,7%66.7%
1010 RS 4 + 2RS 4+2 66,7%66.7%
1111 RS 4 + 2RS 4+2 66,7%66.7%
1212 FORRÁSKÖZPONT (8, 2, 1)LRC (8, 2, 1) 72,7%72.7%
1313 FORRÁSKÖZPONT (8, 2, 1)LRC (8, 2, 1) 72,7%72.7%
1414 FORRÁSKÖZPONT (8, 2, 1)LRC (8, 2, 1) 72,7%72.7%
1515 FORRÁSKÖZPONT (8, 2, 1)LRC (8, 2, 1) 72,7%72.7%
1616 FORRÁSKÖZPONT (8, 2, 1)LRC (8, 2, 1) 72,7%72.7%

Kettős paritású hatékonyság az összes Flash-telepítéshezDual parity efficiency for all-flash deployments

Ez a táblázat a kettős paritású és helyi újraépítési kódok tárolási hatékonyságát mutatja minden olyan Flash-telepítés esetén, amely kizárólag SSD-meghajtókat tartalmaz.This table shows the storage efficiency of dual parity and local reconstruction codes at each scale for all-flash deployments which contain only solid-state drives (SSD). A paritásos elrendezés nagyobb méretű csoportokat használhat, és jobb tárolási hatékonyságot érhet el egy teljes Flash konfigurációban.The parity layout can use larger group sizes and achieve better storage efficiency in an all-flash configuration.

Tartalék tartományokFault domains LayoutLayout HatékonyságEfficiency
22
33
44 RS 2 + 2RS 2+2 50,0%50.0%
55 RS 2 + 2RS 2+2 50,0%50.0%
66 RS 2 + 2RS 2+2 50,0%50.0%
77 RS 4 + 2RS 4+2 66,7%66.7%
88 RS 4 + 2RS 4+2 66,7%66.7%
99 RS 6 + 2RS 6+2 75,0%75.0%
1010 RS 6 + 2RS 6+2 75,0%75.0%
1111 RS 6 + 2RS 6+2 75,0%75.0%
1212 RS 6 + 2RS 6+2 75,0%75.0%
1313 RS 6 + 2RS 6+2 75,0%75.0%
1414 RS 6 + 2RS 6+2 75,0%75.0%
1515 RS 6 + 2RS 6+2 75,0%75.0%
1616 FORRÁSKÖZPONT (12, 2, 1)LRC (12, 2, 1) 80,0%80.0%

PéldákExamples

Ha csak két kiszolgálóval rendelkezik, javasoljuk, hogy használjon háromutas tükrözést és/vagy kettős paritást, mert jobb hibatűrést biztosítanak.Unless you have only two servers, we recommend using three-way mirroring and/or dual parity, because they offer better fault tolerance. Pontosabban gondoskodnak arról, hogy az összes adatbázis biztonságban maradjon, és folyamatosan elérhető legyen, még akkor is, ha két tartalék tartomány – Közvetlen tárolóhelyek esetén – két kiszolgálót jelent – egyidejű hibák érintik.Specifically, they ensure that all data remains safe and continuously accessible even when two fault domains – with Storage Spaces Direct, that means two servers - are affected by simultaneous failures.

Például minden online állapotban maradExamples where everything stays online

Ez a hat példa azt mutatja be, hogy milyen háromutas tükrözést és/vagy kettős paritást tud viselni.These six examples show what three-way mirroring and/or dual parity can tolerate.

  • 1. egy meghajtó elveszett (beleértve a gyorsítótár-meghajtókat is)1. One drive lost (includes cache drives)
  • 2. egy kiszolgáló elveszett2. One server lost

hibatűrés – példák-1 és-2

  • 3. egy kiszolgáló és egy meghajtó elveszett3. One server and one drive lost
  • 4. két meghajtó elveszett különböző kiszolgálókon4. Two drives lost in different servers

hibatűrési példák – 3 és 4 közötti

  • 5. a kettőnél több meghajtó is elveszett, amíg a legtöbb esetben a két kiszolgáló érintett5. More than two drives lost, so long as at most two servers are affected
  • 6. két kiszolgáló elveszett6. Two servers lost

hibatűrés – példák-5 és-6

... minden esetben a kötetek online maradnak....in every case, all volumes will stay online. (Győződjön meg arról, hogy a fürt fenntartja a kvórumot.)(Make sure your cluster maintains quorum.)

Például, hogy minden offline állapotúExamples where everything goes offline

Élettartama alatt a tárolóhelyek tetszőleges számú meghibásodást okozhatnak, mivel a teljes rugalmasságot visszaállítja a megfelelő idő elteltével.Over its lifetime, Storage Spaces can tolerate any number of failures, because it restores to full resiliency after each one, given sufficient time. Azonban a legtöbb esetben a hibák egy adott pillanatban is biztonságosan befolyásolhatják a hibákat.However, at most two fault domains can safely be affected by failures at any given moment. A következőkben néhány példa arra, hogy milyen háromutas tükrözést és/vagy kettős paritást nem lehet tolerálni.The following are therefore examples of what three-way mirroring and/or dual parity cannot tolerate.

  • 7. a három vagy több kiszolgálón elveszett meghajtók egyszerre7. Drives lost in three or more servers at once
  • 8. három vagy több kiszolgáló elvész egyszerre8. Three or more servers lost at once

hibatűrés – példák – 7 és 8

HasználatUsage

Tekintse meg a kötetek létrehozásaeszközt.Check out Create volumes.

Következő lépésekNext steps

A cikkben említett témakörökkel kapcsolatos további információkért tekintse meg a következőket:For further reading on subjects mentioned in this article, see the following: