Режимы кворума WSFC и участвующая в голосовании конфигурация (SQL Server)WSFC Quorum Modes and Voting Configuration (SQL Server)

ОБЛАСТЬ ПРИМЕНЕНИЯ: даSQL Server нетБаза данных SQL AzureнетХранилище данных SQL AzureнетParallel Data WarehouseAPPLIES TO: yesSQL Server noAzure SQL Database noAzure SQL Data Warehouse noParallel Data Warehouse

И SQL ServerSQL ServerГруппы доступности AlwaysOnAlways On availability groups , и экземпляры отказоустойчивого кластера (FCI) в режиме AlwaysOn используют платформу отказоустойчивых кластеров Windows Server (WSFC).Both SQL ServerSQL ServerГруппы доступности AlwaysOnAlways On availability groups and Always On Failover Cluster Instances (FCI) take advantage of Windows Server Failover Clustering (WSFC) as a platform technology. В WSFC для мониторинга общей исправности кластера и обеспечения максимальной отказоустойчивости на уровне узлов используется подход, основанный на кворуме.WSFC uses a quorum-based approach to monitoring overall cluster health and maximize node-level fault tolerance. Для проектирования, эксплуатации и устранения неполадок решений высокого уровня доступности режима AlwaysOn и решений аварийного восстановления требуется отличное знание режимов кворума WSFC и конфигурации голосования узлов.A fundamental understanding of WSFC quorum modes and node voting configuration is very important to designing, operating, and troubleshooting your Always On high availability and disaster recovery solution.

В этом разделе:In this topic:

Определение исправности кластера по кворумуCluster Health Detection by Quorum

Все узлы в кластере WSFC участвуют в периодической передаче тактового импульса, сообщающего состояние исправности узла другим узлам.Each node in a WSFC cluster participates in periodic heartbeat communication to share the node's health status with the other nodes. Неотвечающие узлы считаются неисправными.Unresponsive nodes are considered to be in a failed state.

Набор узлов кворума — это большинство узлов с правом голоса и следящих объектов в кластере WSFC.A quorum node set is a majority of the voting nodes and witnesses in the WSFC cluster. Общая исправность и состояние кластера WSFC определяется периодическим голосованием с кворумом.The overall health and status of a WSFC cluster is determined by a periodic quorum vote. Наличие кворума означает, что кластер работоспособен и может обеспечивать отказоустойчивость на уровне узла.The presence of a quorum means that the cluster is healthy and able to provide node-level fault tolerance.

Отсутствие кворума указывает, что кластер неработоспособен.The absence of a quorum indicates that the cluster is not healthy. Необходимо поддерживать общую исправность кластера WSFC, чтобы обеспечить доступность и работоспособность вторичных узлов, на которые смогут переключаться первичные узлы в случае сбоя.Overall WSFC cluster health must be maintained in order to ensure that healthy secondary nodes are available for primary nodes to fail over to. Если голосование с кворумом завершается неудачей, кластер WSFC переводится в режим «вне сети» в качестве меры предосторожности.If the quorum vote fails, the WSFC cluster will be set offline as a precautionary measure. При этом также останавливаются все экземпляры SQL ServerSQL Server , зарегистрированные в кластере.This will also cause all SQL ServerSQL Server instances registered with the cluster to be stopped.

Важно!

Если кластер WSFC переводится в режим «вне сети» из-за отсутствия кворума, перевести его обратно в оперативный режим потребуется вручную.If a WSFC cluster is set offline because of quorum failure, manual intervention is required to bring it back online.

Дополнительные сведения см. в разделе: Аварийное восстановление WSFC через принудительный кворум (SQL Server).For more information, see: WSFC Disaster Recovery through Forced Quorum (SQL Server).

Режимы кворумаQuorum Modes

Режим кворума настраивается на уровне кластера WSFC, который определяет метод проведения голосования с кворумом.A quorum mode is configured at the WSFC cluster level that dictates the methodology used for quorum voting. Диспетчер отказоустойчивого кластера рекомендует режим кворума на основании количества узлов в кластере.The Failover Cluster Manager utility will recommend a quorum mode based on the number of nodes in the cluster.

Для определения кворума голосов можно использовать следующие режимы кворума:The following quorum modes can be used to determine what constitutes a quorum of votes:

  • Большинство узлов.Node Majority. Кластер признается работоспособным, если больше половины узлов подтверждают работоспособность кластера.More than one-half of the voting nodes in the cluster must vote affirmatively for the cluster to be healthy.

  • Большинство узлов и общих папок.Node and File Share Majority. Аналогичен режиму кворума большинства узлов, за исключением того, что удаленная общая папка также настраивается в качестве следящей папки с правом голоса, и подключения от любого узла к этой папке также считаются голосами, подтверждающими работоспособность.Similar to Node Majority quorum mode, except that a remote file share is also configured as a voting witness, and connectivity from any node to that share is also counted as an affirmative vote. Кластер признается работоспособным, если больше половины возможных голосов подтверждают работоспособность кластера.More than one-half of the possible votes must be affirmative for the cluster to be healthy.

    Рекомендуется, чтобы следящая общая папка не размещалась ни на одном узле в кластере и была видима для всех узлов в кластере.As a best practice, the witness file share should not reside on any node in the cluster, and it should be visible to all nodes in the cluster.

  • Большинство узлов и дисков.Node and Disk Majority. Аналогичен режиму кворума большинства узлов, за исключением того, что общий дисковый кластерный ресурс также признается следящим объектом с правом голоса, а все подключения от любого узла к этому общему диску считаются голосами, подтверждающими работоспособность.Similar to Node Majority quorum mode, except that a shared disk cluster resource is also designated as a voting witness, and connectivity from any node to that shared disk is also counted as an affirmative vote. Кластер признается работоспособным, если больше половины возможных голосов подтверждают работоспособность кластера.More than one-half of the possible votes must be affirmative for the cluster to be healthy.

  • только диск.Disk Only. Общий дисковый кластерный ресурс признается следящим, а подключение от любого узла к этому общему диску считается голосом, подтверждающим работоспособность.A shared disk cluster resource is designated as a witness, and connectivity by any node to that shared disk is counted as an affirmative vote.

Совет

При использовании асимметричной системы хранения для Группы доступности AlwaysOnAlways On availability groupsв общем случае следует использовать режим кворума «Большинство узлов» при нечетном числе узлов с правом голоса и режим кворума «Большинство узлов и общих папок» при четном числе узлов с правом голоса.When using an asymmetric storage configuration for Группы доступности AlwaysOnAlways On availability groups, you should generally use the Node Majority quorum mode when you have an odd number of voting nodes, or the Node and File Share Majority quorum mode when you have an even number of voting nodes.

Узлы с правом и без права голосаVoting and Non-Voting Nodes

По умолчанию каждый узел в кластере WSFC включается в качестве члена кворума кластера. Каждый узел имеет один голос, который учитывается при определении общей исправности кластера, и каждый узел постоянно пытается образовать кворум.By default, each node in the WSFC cluster is included as a member of the cluster quorum; each node has a single vote in determining the overall cluster health, and each node will continuously attempt to establish a quorum. На данный момент были четко определены узлы кластера WSFC, принимающие участие в голосовании по исправности кластера, которые называются узлами с правом голоса.The quorum discussion to this point has carefully qualified the set of WSFC cluster nodes that vote on cluster health as voting nodes.

Ни один отдельный узел в кластере WSFC не может окончательно определить, является ли кластер в целом работоспособным.No individual node in a WSFC cluster can definitively determine that the cluster as a whole is healthy or unhealthy. В любой момент времени с точки зрения любого узла может казаться, что некоторые другие узлы не работают, находятся в процессе отработки отказа или не отвечают из-за сбоя сетевого подключения.At any given moment, from the perspective of each node, some of the other nodes may appear to be offline, or appear to be in the process of failover, or appear unresponsive due to a network communication failure. Главная задача голосования с кворумом — определить, является ли видимое состояние каждого узла в кластере WSFC фактическим состоянием этих узлов.A key function of the quorum vote is to determine whether the apparent state of each of node in the WSFC cluster is indeed that actual state of those nodes.

Для всех режимов кворума, кроме "только диски", эффективность голосования кворума зависит от надежности соединений между всеми узлами с правом голоса в кластере.For all of the quorum models except 'Disk Only', the effectiveness of a quorum vote depends on reliable communications between all of the voting nodes in the cluster. Сетевые соединения между узлами в одной физической подсети следует считать надежными, и голосование кворума следует считать надежным.Network communications between nodes on the same physical subnet should be considered reliable; the quorum vote should be trusted.

Однако если в голосовании кворума кажется, что узел или другая подсеть не отвечают, но на самом деле они находятся в рабочем состоянии, то, скорее всего, это происходит из-за сбоя соединения между подсетями.However, if a node on another subnet is seen as non-responsive in a quorum vote, but it is actually online and otherwise healthy, that is most likely due to a network communications failure between subnets. В зависимости от топологии кластера, режима кворума и конфигурации политики отработки отказа, сбой сетевого соединения может приводить к созданию более одного набора узлов с правом голоса.Depending upon the cluster topology, quorum mode, and failover policy configuration, that network communications failure may effectively create more than one set (or subset) of voting nodes.

Если свой собственный кворум могут организовать несколько наборов узлов с правом голоса, это называется сценарием с дроблением.When more than one subset of voting nodes is able to establish a quorum on its own, that is known as a split-brain scenario. В этом случае узлы в отдельных кворумах могут вести себя по-разному и находиться в конфликте друг с другом.In such a scenario, the nodes in the separate quorums may behave differently, and in conflict with one another.

Примечание

Сценарий с дроблением возможен только в случаях, когда системный администратор вручную организует принудительную работу кворума или в очень редких случаях принудительной отработки отказа при явном разделении набора узлов кворума.The split-brain scenario is only possible when a system administrator manually performs a forced quorum operation, or in very rare circumstances, a forced failover; explicitly subdividing the quorum node set.

Чтобы упростить настройку кворума и увеличить время безотказной работы, можно задать параметр NodeWeight каждого узла, который указывает, учитывается ли голос этого узла при определении кворума.In order to simplify your quorum configuration and increase up-time, you may want to adjust each node's NodeWeight setting so that the node's vote is not counted towards the quorum.

Важно!

Для использования параметров NodeWeight необходимо применить следующее исправление ко всем серверам в кластере WSFC:In order to use NodeWeight settings, the following hotfix must be applied to all servers in the WSFC cluster:

KB2494036: Доступно исправление, позволяющее настраивать узел кластера, не имеющий голосов кворума, в Windows Server 2008Windows Server 2008 и Windows Server 2008 R2Windows Server 2008 R2KB2494036: A hotfix is available to let you configure a cluster node that does not have quorum votes in Windows Server 2008Windows Server 2008 and in Windows Server 2008 R2Windows Server 2008 R2

Рекомендуемые настройки для голосования с кворумомRecommended Adjustments to Quorum Voting

При включении или отключении голоса конкретного узла WSFC соблюдайте следующие правила.When enabling or disabling a given WSFC node's vote, follow these guidelines:

  • Отсутствие голосования по умолчанию.No vote by default. Предполагается, что каждый узел не должен голосовать без явного выравнивания.Assume that each node should not vote without explicit justification.

  • Охватите все основные реплики.Include all primary replicas. Каждый узел WSFC, на котором размещена первичная реплика группы доступности или предпочитаемый владелец FCI, должен иметь голос.Each WSFC node that hosts an availability group primary replica or is the preferred owner of an FCI should have a vote.

  • Включайте возможных владельцев автоматического перехода на другой ресурс.Include possible automatic failover owners. Каждый узел, на котором в результате автоматического перехода группы доступности или экземпляра отказоустойчивого кластера на другой ресурс может размещаться первичная реплика доступности, должен иметь голос.Each node that could host a primary replica, as the result of an automatic availability group failover or FCI failover, should have a vote. Если имеется только одна группа доступности в кластере WSFC, а реплики доступности размещаются только на автономных экземплярах, то это правило охватывает только вторичную реплику, которая является целью автоматического перехода на другой ресурс.If there is only one availability group in the WSFC cluster and availability replicas are hosted only by standalone instances, this rule includes only the secondary replica that is the automatic failover target.

  • Исключайте узлы вторичного сайта.Exclude secondary site nodes. В общем случае не давайте голоса узлам WSFC, которые находятся на вторичном сайте аварийного восстановления.In general, do not give votes to WSFC nodes that reside at a secondary disaster recovery site. Не следует, чтобы узлы на вторичном сайте могли принимать участие в решение о переводе кластера в режим «вне сети», когда на первичном сайте нет никаких проблем.You do not want nodes in the secondary site to contribute to a decision to take the cluster offline when there is nothing wrong with the primary site.

  • Нечетное число голосов.Odd number of votes. Если необходимо, добавьте в кластер следящую общую папку, следящий узел или следящий диск и измените режим кворума, чтобы избежать возможного разделения голосов пополам при голосовании с кворумом.If necessary, add a witness file share, a witness node, or a witness disk to the cluster and adjust the quorum mode to prevent possible ties in the quorum vote.

  • Перераспределяйте назначение голосов после отработки отказа.Re-assess vote assignments post-failover. Не следует допускать отработку отказа с переходом на конфигурацию кластера, которая не поддерживает работоспособность кворума.You do not want to fail over into a cluster configuration that does not support a healthy quorum.

Важно!

При проверке конфигурации кворума голосования WSFC мастер создания групп доступности в режиме AlwaysOn отображает предупреждение, если выполняется любое из следующих условий:When validating WSFC quorum vote configuration, the Always On Availability Group Wizard shows a warning if any of the following conditions are true:

  • Узел кластера, на котором размещена первичная реплика, не имеет голоса.The cluster node that hosts the primary replica does not have a vote
  • Вторичная реплика настроена для автоматического перехода на другой ресурс, а ее узел кластера не имеет голоса.A secondary replica is configured for automatic failover and its cluster node does not have a vote.
  • KB2494036 не установлено на всех узлах кластера, на которых размещены реплики доступности.KB2494036 is not installed on all cluster nodes that host availability replicas. Это обновление необходимо для добавления или удаления голосов для узлов кластера в многосайтовых развертываниях.This patch is required to add or remove votes for cluster nodes in multi-site deployments. Однако в односайтовых развертываниях это обычно не требуется, поэтому можно безопасно пропустить предупреждение.However, in single-site deployments, it is usually not required and you may safely ignore the warning.

Совет

SQL ServerSQL Server предлагает несколько системных динамических административных представлений, которые могут помочь в управлении параметрами конфигурации кластера WSFC и голосовании с кворумом узлов.exposes several system dynamic management views (DMVs) that can help you manage settings related WSFC cluster configuration and node quorum voting.

Дополнительные сведения можно найти в разделах: sys.dm_hadr_cluster, sys.dm_hadr_cluster_members, sys.dm_os_cluster_nodes, sys.dm_hadr_cluster_networksFor more information, see: sys.dm_hadr_cluster, sys.dm_hadr_cluster_members, sys.dm_os_cluster_nodes, sys.dm_hadr_cluster_networks

Связанные задачиRelated Tasks

См. такжеRelated Content

См. также:See Also

Аварийное восстановление WSFC через принудительный кворум (SQL Server) WSFC Disaster Recovery through Forced Quorum (SQL Server)
Отказоустойчивая кластеризация Windows Server (WSFC) с SQL ServerWindows Server Failover Clustering (WSFC) with SQL Server