Förstå kluster-och pool-kvorum på Azure Stack HCIUnderstanding cluster and pool quorum on Azure Stack HCI

Gäller för: Azure Stack HCI, version 20H2; Windows Server 2019Applies to: Azure Stack HCI, version 20H2; Windows Server 2019

Kluster för växling vid fel i Windows Server ger hög tillgänglighet för arbets belastningar.Windows Server Failover Clustering provides high availability for workloads. De här resurserna anses ha hög tillgänglighet om noderna som är värdar för resurserna är uppdaterade. klustret kräver dock i allmänhet mer än hälften av noderna som ska köras, vilket kallas för kvorum.These resources are considered highly available if the nodes that host resources are up; however, the cluster generally requires more than half the nodes to be running, which is known as having quorum.

Kvorum är utformat för att förhindra delade hjärna- scenarier som kan inträffa när det finns en partition i nätverket och del mängder av noder inte kan kommunicera med varandra.Quorum is designed to prevent split-brain scenarios which can happen when there is a partition in the network and subsets of nodes cannot communicate with each other. Detta kan orsaka att både del mängder av noder försöker äga arbets belastningen och skriver till samma disk som kan leda till flera problem.This can cause both subsets of nodes to try to own the workload and write to the same disk which can lead to numerous problems. Detta kan dock förhindras med redundanskluster som endast tvingar en av dessa noder att fortsätta att köra, så att endast en av dessa grupper förblir online.However, this is prevented with Failover Clustering's concept of quorum which forces only one of these groups of nodes to continue running, so only one of these groups will stay online.

Kvorum avgör hur många fel som klustret kan hantera medan fortfarande återstår online.Quorum determines the number of failures that the cluster can sustain while still remaining online. Kvorum är utformat för att hantera scenariot om det uppstår problem med kommunikationen mellan del mängder av klusternoder, så att flera servrar inte försöker samtidigt vara värdar för en resurs grupp och skriva till samma disk samtidigt.Quorum is designed to handle the scenario when there is a problem with communication between subsets of cluster nodes, so that multiple servers don't try to simultaneously host a resource group and write to the same disk at the same time. Genom att ha det här syftet med kvorum tvingar klustret kluster tjänsten att stoppas i en av under uppsättningarna av noder för att säkerställa att det bara finns en sann ägare till en viss resurs grupp.By having this concept of quorum, the cluster will force the cluster service to stop in one of the subsets of nodes to ensure that there is only one true owner of a particular resource group. När noder som har stoppats kan återigen kommunicera med huvud gruppen av noder, kommer de automatiskt att ansluta till klustret igen och starta kluster tjänsten.Once nodes which have been stopped can once again communicate with the main group of nodes, they will automatically rejoin the cluster and start their cluster service.

I Windows Server 2019 finns det två komponenter i systemet som har sina egna kvorumresurser:In Windows Server 2019, there are two components of the system that have their own quorum mechanisms:

  • Klusterkvorum: Detta fungerar på kluster nivå (dvs. du kan förlora noder och låta klustret vara igång)Cluster Quorum: This operates at the cluster level (i.e. you can lose nodes and have the cluster stay up)
  • Pool-kvorum: Detta fungerar på Poolnivå när Lagringsdirigering aktive ras (dvs. du kan förlora noder och enheter och låta poolen vara igång).Pool Quorum: This operates on the pool level when Storage Spaces Direct is enabled (i.e. you can lose nodes and drives and have the pool stay up). Lagringspooler har utformats för att användas i både klustrade och icke-klustrade scenarier, vilket är anledningen till att de har olika kvorum.Storage pools were designed to be used in both clustered and non-clustered scenarios, which is why they have a different quorum mechanism.

Översikt över klusterkvorumCluster quorum overview

Tabellen nedan ger en översikt över klustrets kvorum resultat per scenario:The table below gives an overview of the Cluster Quorum outcomes per scenario:

Noder i ServerServer nodes Kan överleva ett problem med en servernodCan survive one server node failure Kan överleva en servernod, sedan en annanCan survive one server node failure, then another Kan överleva två samtidiga Server nodfelCan survive two simultaneous server node failures
22 50/5050/50 IngaNo IngaNo
2 + vittne2 + Witness JaYes IngaNo IngaNo
33 JaYes 50/5050/50 IngaNo
3-vittne3 + Witness JaYes JaYes IngaNo
44 JaYes JaYes 50/5050/50
4-vittne4 + Witness JaYes JaYes JaYes
5 och senare5 and above JaYes JaYes JaYes

Rekommendationer för klusterkvorumCluster quorum recommendations

  • Om du har två noder krävsett vittne.If you have two nodes, a witness is required.
  • Om du har tre eller fyra noder rekommenderas vittne starkt.If you have three or four nodes, witness is strongly recommended.
  • Om du har Internet åtkomst använder du ett ** moln vittne**If you have Internet access, use a cloud witness
  • Om du befinner dig i en IT-miljö med andra datorer och fil resurser använder du ett fil resurs vittneIf you're in an IT environment with other machines and file shares, use a file share witness

Så här fungerar klusterkvorumHow cluster quorum works

När noderna slutar fungera, eller om vissa noder förlorar kontakt med en annan delmängd, måste kvarvarande noder verifiera att de utgör majoriteten av klustret för att förbli online.When nodes fail, or when some subset of nodes loses contact with another subset, surviving nodes need to verify that they constitute the majority of the cluster to remain online. Om de inte kan verifiera så kommer de att gå offline.If they can't verify that, they'll go offline.

Men begreppet majoritet fungerar bara när det totala antalet noder i klustret är udda (till exempel tre noder i ett kluster med fem noder).But the concept of majority only works cleanly when the total number of nodes in the cluster is odd (for example, three nodes in a five node cluster). Så, vad gäller kluster med ett jämnt antal noder (t. ex. ett kluster med fyra noder)?So, what about clusters with an even number of nodes (say, a four node cluster)?

Klustret kan göra det totala antalet röster udda på två sätt:There are two ways the cluster can make the total number of votes odd:

  1. Först kan den gå upp en genom att lägga till ett vittne med en extra röst.First, it can go up one by adding a witness with an extra vote. Detta kräver användar konfiguration.This requires user set-up.
  2. Eller så går det nedåt en genom att noll i en Unlucky-nods röst (sker automatiskt efter behov).Or, it can go down one by zeroing one unlucky node's vote (happens automatically as needed).

När de kvarvarande noderna har verifierat att de är de flestauppdateras definitionen av majoriteten så att den bara är bland de efterlevande.Whenever surviving nodes successfully verify they are the majority, the definition of majority is updated to be among just the survivors. Detta gör det möjligt för klustret att förlora en nod, sedan en annan, och så vidare.This allows the cluster to lose one node, then another, then another, and so forth. Det här syftet med det totala antalet röster som kan anpassas efter efterföljande haverier kallas dynamiskt kvorum.This concept of the total number of votes adapting after successive failures is known as Dynamic quorum.

Dynamiskt vittneDynamic witness

Dynamiskt vittne växlar rösten för vittnet för att se till att det totala antalet röster är ojämnt.Dynamic witness toggles the vote of the witness to make sure that the total number of votes is odd. Om det finns ett udda antal röster har vittnet inte någon röst.If there are an odd number of votes, the witness doesn't have a vote. Om det finns ett jämnt antal röster har vittnet en röst.If there is an even number of votes, the witness has a vote. Dynamiskt vittne minskar avsevärt risken för att klustret ska gå nedåt på grund av ett vittnes fel.Dynamic witness significantly reduces the risk that the cluster will go down because of witness failure. Klustret bestämmer om vittnets röstning ska användas baserat på antalet röstnings noder som är tillgängliga i klustret.The cluster decides whether to use the witness vote based on the number of voting nodes that are available in the cluster.

Dynamiskt kvorum fungerar med dynamiskt vittne på det sätt som beskrivs nedan.Dynamic quorum works with Dynamic witness in the way described below.

Beteende för dynamiskt kvorumDynamic quorum behavior

  • Om du har ett jämnt antal noder och inget vittne får en nod sin röst noll.If you have an even number of nodes and no witness, one node gets its vote zeroed. Till exempel får bara tre av de fyra noderna röster, så det totala antalet röster är tre och två efterlevande med röster anses vara en majoritet.For example, only three of the four nodes get votes, so the total number of votes is three, and two survivors with votes are considered a majority.
  • Om du har ett udda antal noder och inget vittne får alla röster.If you have an odd number of nodes and no witness, they all get votes.
  • Om du har ett jämnt antal noder plus vittnets röster, så att summan blir udda.If you have an even number of nodes plus witness, the witness votes, so the total is odd.
  • Om du har ett udda antal noder plus vittnet rösterar inte vittnet.If you have an odd number of nodes plus witness, the witness doesn't vote.

Med dynamiskt kvorum kan du tilldela en röst till en nod dynamiskt för att undvika att de flesta röster går förlorade och att klustret kan köras med en nod (kallat senaste man står).Dynamic quorum enables the ability to assign a vote to a node dynamically to avoid losing the majority of votes and to allow the cluster to run with one node (known as last-man standing). Låt oss ta ett kluster med fyra noder som exempel.Let's take a four-node cluster as an example. Anta att kvorumet kräver tre röster.Assume that quorum requires 3 votes.

I det här fallet skulle klustret ha gått ner om du förlorade två noder.In this case, the cluster would have gone down if you lost two nodes.

Diagram över fyra klusternoder, som var och en röst får en röst

Men dynamiska kvorum förhindrar att detta sker.However, dynamic quorum prevents this from happening. Det totala antalet röster som krävs för kvorumet bestäms nu baserat på antalet tillgängliga noder.The total number of votes required for quorum is now determined based on the number of nodes available. Med det dynamiska kvorumet förblir klustret även om du förlorar tre noder.So, with dynamic quorum, the cluster will stay up even if you lose three nodes.

Diagram som visar fyra klusternoder, där noderna Miss lyckas en i taget och antalet röster som krävs för att justera efter varje misslyckande.

Scenariot ovan gäller för ett allmänt kluster som inte har Lagringsdirigering aktiverat.The above scenario applies to a general cluster that doesn't have Storage Spaces Direct enabled. Men när Lagringsdirigering har Aktiver ATS kan klustret bara ha stöd för två nodfel.However, when Storage Spaces Direct is enabled, the cluster can only support two node failures. Detta är förklarat mer i avsnittet pool-kvorum.This is explained more in the pool quorum section.

ExempelExamples

Två noder utan ett vittne.Two nodes without a witness.

Rösten för en nod nollställs, så majoritets röstningen bestäms av totalt 1 röst.One node's vote is zeroed, so the majority vote is determined out of a total of 1 vote. Om den icke-röstnings noden slutar fungera, har efterlevande 1/1 och klustret överleva.If the non-voting node goes down unexpectedly, the survivor has 1/1 and the cluster survives. Om röstnings noden slutar att fungera har efterlevande 0/1 och klustret stängs ned.If the voting node goes down unexpectedly, the survivor has 0/1 and the cluster goes down. Om röstningen stängs av korrekt överförs rösten till den andra noden och klustret överleva.If the voting node is gracefully powered down, the vote is transferred to the other node, and the cluster survives. Det är därför det är viktigt att konfigurera ett vittne.This is why it's critical to configure a witness.

Kvorum som förklaras i fallet med två noder utan ett vittne

  • Kan överleva ett Server haveri: 50 procents chans.Can survive one server failure: Fifty percent chance.
  • Kan överleva ett Server haveri, sedan en annan: Nej.Can survive one server failure, then another: No.
  • Kan överleva två server haverier på en gång: Nej.Can survive two server failures at once: No.

Två noder med ett vittne.Two nodes with a witness.

Båda noderna rösta, plus vittnes rösterna, så majoriteten bestäms av totalt tre röster.Both nodes vote, plus the witness votes, so the majority is determined out of a total of 3 votes. Om någon av noderna kraschar har efterlevande 2/3 och klustret överleva.If either node goes down, the survivor has 2/3 and the cluster survives.

Kvorum som förklaras i fallet med två noder med ett vittne

  • Kan överleva ett Server haveri: Ja.Can survive one server failure: Yes.
  • Kan överleva ett Server haveri, sedan en annan: Nej.Can survive one server failure, then another: No.
  • Kan överleva två server haverier på en gång: Nej.Can survive two server failures at once: No.

Tre noder utan ett vittne.Three nodes without a witness.

Alla noder röstar, så majoriteten bestäms av totalt 3 röster.All nodes vote, so the majority is determined out of a total of 3 votes. Om en nod kraschar är efterlevande 2/3 och klustret överleva.If any node goes down, the survivors are 2/3 and the cluster survives. Klustret blir två noder utan vittne – vid den tidpunkten är du i Scenario 1.The cluster becomes two nodes without a witness – at that point, you're in Scenario 1.

Kvorum som förklaras i fallet med tre noder utan ett vittne

  • Kan överleva ett Server haveri: Ja.Can survive one server failure: Yes.
  • Kan överleva ett Server haveri, sedan en annan: 50 procents chans.Can survive one server failure, then another: Fifty percent chance.
  • Kan överleva två server haverier på en gång: Nej.Can survive two server failures at once: No.

Tre noder med ett vittne.Three nodes with a witness.

Alla noder röstar, så att vittnet inte första gången rösta.All nodes vote, so the witness doesn't initially vote. Majoriteten bestäms av totalt 3 röster.The majority is determined out of a total of 3 votes. Efter ett fel har klustret två noder med ett vittne – vilket är tillbaka till scenario 2.After one failure, the cluster has two nodes with a witness – which is back to Scenario 2. Därför är de två noderna och röstningen i vittnet.So, now the two nodes and the witness vote.

Kvorum som förklaras i fallet med tre noder med ett vittne

  • Kan överleva ett Server haveri: Ja.Can survive one server failure: Yes.
  • Kan överleva ett Server haveri, sedan en annan: Ja.Can survive one server failure, then another: Yes.
  • Kan överleva två server haverier på en gång: Nej.Can survive two server failures at once: No.

Fyra noder utan ett vittneFour nodes without a witness

Rösten för en nod nollställs, så majoriteten bestäms av totalt tre röster.One node's vote is zeroed, so the majority is determined out of a total of 3 votes. Efter ett fel blir klustret tre noder och du är i scenario 3.After one failure, the cluster becomes three nodes, and you're in Scenario 3.

Kvorum som förklaras i fallet med fyra noder utan ett vittne

  • Kan överleva ett Server haveri: Ja.Can survive one server failure: Yes.
  • Kan överleva ett Server haveri, sedan en annan: Ja.Can survive one server failure, then another: Yes.
  • Kan överleva två server haverier på en gång: 50 procents förstoring.Can survive two server failures at once: Fifty percent chance.

Fyra noder med ett vittne.Four nodes with a witness.

Alla noder röster och vittnets röster, så majoriteten bestäms av totalt 5 röster.All nodes votes and the witness votes, so the majority is determined out of a total of 5 votes. Efter ett haveri är du i Scenario 4.After one failure, you're in Scenario 4. Efter två samtidiga haverier hoppar du nedåt till scenario 2.After two simultaneous failures, you skip down to Scenario 2.

Kvorum som förklaras i fallet med fyra noder med ett vittne

  • Kan överleva ett Server haveri: Ja.Can survive one server failure: Yes.
  • Kan överleva ett Server haveri, sedan en annan: Ja.Can survive one server failure, then another: Yes.
  • Kan överleva två server haverier på en gång: Ja.Can survive two server failures at once: Yes.

Fem noder och mer.Five nodes and beyond.

Alla noder röstar, eller alla utom en röst, som gör den totala udda.All nodes vote, or all but one vote, whatever makes the total odd. Lagringsdirigering kan inte hantera fler än två noder i det här läget, så det behövs inget vittne eller användbart.Storage Spaces Direct cannot handle more than two nodes down anyway, so at this point, no witness is needed or useful.

Kvorum som beskrivits i fallet med fem noder och mer

  • Kan överleva ett Server haveri: Ja.Can survive one server failure: Yes.
  • Kan överleva ett Server haveri, sedan en annan: Ja.Can survive one server failure, then another: Yes.
  • Kan överleva två server haverier på en gång: Ja.Can survive two server failures at once: Yes.

Nu när vi förstår hur kvorum fungerar kan vi titta på typerna av kvorumresurser.Now that we understand how quorum works, let's look at the types of quorum witnesses.

Typer av attributtyperQuorum witness types

Kluster för växling vid fel stöder tre typer av kvorumresurser:Failover Clustering supports three types of Quorum Witnesses:

  • Moln vittne – Blob Storage i Azure som är tillgängligt för alla noder i klustret.Cloud Witness - Blob storage in Azure accessible by all nodes of the cluster. Den upprätthåller kluster informationen i en vittne. log-fil, men lagrar inte en kopia av kluster databasen.It maintains clustering information in a witness.log file, but doesn't store a copy of the cluster database.
  • Fil resurs vittne – en SMB-filresurs som är konfigurerad på en fil server som kör Windows Server.File Share Witness – A SMB file share that is configured on a file server running Windows Server. Den upprätthåller kluster informationen i en vittne. log-fil, men lagrar inte en kopia av kluster databasen.It maintains clustering information in a witness.log file, but doesn't store a copy of the cluster database.
  • Disk vittne – en liten klustrad disk som finns i gruppen kluster tillgängligt lagrings utrymme.Disk Witness - A small clustered disk which is in the Cluster Available Storage group. Disken är hög tillgänglig och kan redundansväxla mellan noder.This disk is highly-available and can failover between nodes. Den innehåller en kopia av kluster databasen.It contains a copy of the cluster database. Ett disk vittne stöds inte med Lagringsdirigering.A Disk Witness isn't supported with Storage Spaces Direct.

Översikt över anslutningspoolenPool quorum overview

Vi har precis talat om klusterkvorum, som fungerar på kluster nivå.We just talked about Cluster Quorum, which operates at the cluster level. Nu ska vi gå in på pool-kvorum, som fungerar på Poolnivå (dvs. du kan förlora noder och enheter och låta poolen vara igång).Now, let's dive into Pool Quorum, which operates on the pool level (i.e. you can lose nodes and drives and have the pool stay up). Lagringspooler har utformats för att användas i både klustrade och icke-klustrade scenarier, vilket är anledningen till att de har olika kvorum.Storage pools were designed to be used in both clustered and non-clustered scenarios, which is why they have a different quorum mechanism.

Tabellen nedan ger en översikt över poolens kvorum-resultat per scenario:The table below gives an overview of the Pool Quorum outcomes per scenario:

Noder i ServerServer nodes Kan överleva ett problem med en servernodCan survive one server node failure Kan överleva en servernod, sedan en annanCan survive one server node failure, then another Kan överleva två samtidiga Server nodfelCan survive two simultaneous server node failures
22 NejNo IngaNo IngaNo
2 + vittne2 + Witness JaYes IngaNo IngaNo
33 JaYes IngaNo IngaNo
3-vittne3 + Witness JaYes IngaNo IngaNo
44 JaYes IngaNo IngaNo
4-vittne4 + Witness JaYes JaYes JaYes
5 och senare5 and above JaYes JaYes JaYes

Så här fungerar poolens kvorumHow pool quorum works

När enheterna slutar fungera, eller om vissa enheter tappar kontakt med en annan del av enheterna, behöver de fortfarande verifiera att de utgör majoriteten av poolen för att förbli online.When drives fail, or when some subset of drives loses contact with another subset, surviving drives need to verify that they constitute the majority of the pool to remain online. Om de inte kan verifiera så kommer de att gå offline.If they can't verify that, they'll go offline. Poolen är den entitet som kopplas från eller hålls online baserat på om det finns tillräckligt med diskar för kvorum (50% + 1).The pool is the entity that goes offline or stays online based on whether it has enough disks for quorum (50% + 1). Pool resurs ägaren (den aktiva klusternoden) kan vara + 1.The pool resource owner (active cluster node) can be the +1.

Men pool-kvorum fungerar annorlunda än klustrets kvorum på följande sätt:But pool quorum works differently from cluster quorum in the following ways:

  • poolen använder en nod i klustret som ett vittne som en ansvars brytare för att överleva hälften av enheter (den här noden är poolens resurs ägare)the pool uses one node in the cluster as a witness as a tie-breaker to survive half of drives gone (this node that is the pool resource owner)
  • poolen har inget dynamiskt kvorumthe pool does NOT have dynamic quorum
  • poolen implementerar inte en egen version av att ta bort en röstthe pool does NOT implement its own version of removing a vote

ExempelExamples

Fyra noder med en symmetrisk layout.Four nodes with a symmetrical layout.

Var och en av de 16 enheterna har en röst och nod två har också en röst (eftersom det är poolens resurs ägare).Each of the 16 drives has one vote and node two also has one vote (since it's the pool resource owner). Majoriteten bestäms av totalt 16 röster.The majority is determined out of a total of 16 votes. Om noderna är tre och fyra går den kvarvarande del mängden med 8 enheter och ägarens resurs ägare, som är 9/16 röster.If nodes three and four go down, the surviving subset has 8 drives and the pool resource owner, which is 9/16 votes. Därför överleva poolen.So, the pool survives.

Kvorum 1 för pool

  • Kan överleva ett Server haveri: Ja.Can survive one server failure: Yes.
  • Kan överleva ett Server haveri, sedan en annan: Ja.Can survive one server failure, then another: Yes.
  • Kan överleva två server haverier på en gång: Ja.Can survive two server failures at once: Yes.

Fyra noder med ett symmetriskt layout-och enhets haveri.Four nodes with a symmetrical layout and drive failure.

Var och en av de 16 enheterna har en röst och nod 2 har också en röst (eftersom det är poolens resurs ägare).Each of the 16 drives has one vote and node 2 also has one vote (since it's the pool resource owner). Majoriteten bestäms av totalt 16 röster.The majority is determined out of a total of 16 votes. Först försvinner enhet 7.First, drive 7 goes down. Om noderna är tre och fyra går de kvarvarande del mängden till 7 enheter och resursens resurs ägare, som är 8/16 röster.If nodes three and four go down, the surviving subset has 7 drives and the pool resource owner, which is 8/16 votes. Därför har poolen ingen majoritet och försvinner.So, the pool doesn't have majority and goes down.

Kvorum för pool 2

  • Kan överleva ett Server haveri: Ja.Can survive one server failure: Yes.
  • Kan överleva ett Server haveri, sedan en annan: Nej.Can survive one server failure, then another: No.
  • Kan överleva två server haverier på en gång: Nej.Can survive two server failures at once: No.

Fyra noder med en icke-symmetrisk layout.Four nodes with a non-symmetrical layout.

Var och en av de 24 enheterna har en röst och nod två har också en röst (eftersom det är poolens resurs ägare).Each of the 24 drives has one vote and node two also has one vote (since it's the pool resource owner). Majoriteten bestäms av totalt 24 röster.The majority is determined out of a total of 24 votes. Om noderna är tre och fyra går den kvarvarande del mängden med 8 enheter och ägarens resurs ägare, som är 9/24 röster.If nodes three and four go down, the surviving subset has 8 drives and the pool resource owner, which is 9/24 votes. Därför har poolen ingen majoritet och försvinner.So, the pool doesn't have majority and goes down.

Pool-kvorum 3

  • Kan överleva ett Server haveri: Ja.Can survive one server failure: Yes.
  • Kan överleva ett Server haveri, sedan en annan: * * beror * * (det går inte att överleva om båda noderna är på tre och fyra sätt, men kan överleva alla andra scenarier.Can survive one server failure, then another: **Depends **(cannot survive if both nodes three and four go down, but can survive all other scenarios.
  • Kan överleva två server haverier på en gång: * * beror * * (det går inte att överleva om båda noderna är tre och fyra gå nedåt, men kan överleva alla andra scenarier.Can survive two server failures at once: **Depends **(cannot survive if both nodes three and four go down, but can survive all other scenarios.

Rekommendationer för pool-kvorumPool quorum recommendations

  • Se till att varje nod i klustret är symmetrisk (varje nod har samma antal enheter)Ensure that each node in your cluster is symmetrical (each node has the same number of drives)
  • Aktivera en dubbelriktad spegling eller dubbel paritet så att du kan tolerera ett nodfel och behålla de virtuella diskarna online.Enable three-way mirror or dual parity so that you can tolerate a node failures and keep the virtual disks online.
  • Om fler än två noder är nere, eller om två noder och en disk på en annan nod är nere, kanske volymerna inte har åtkomst till alla tre kopior av sina data, och därför tas offline och är inte tillgänglig.If more than two nodes are down, or two nodes and a disk on another node are down, volumes may not have access to all three copies of their data, and therefore be taken offline and be unavailable. Vi rekommenderar att du återställer servrarna eller byter ut diskarna snabbt för att säkerställa den mest återhämtningen för alla data i volymen.It's recommended to bring the servers back or replace the disks quickly to ensure the most resiliency for all the data in the volume.

Nästa stegNext steps

Mer information finns i följande:For more information, see the following: