Экземпляры отказоустойчивого кластера AlwaysOn (SQL Server)Always On Failover Cluster Instances (SQL Server)

Применимо к:Applies to: даSQL ServerSQL Server (все поддерживаемые версии) yesSQL ServerSQL Server (all supported versions) Применимо к:Applies to: даSQL ServerSQL Server (все поддерживаемые версии) yesSQL ServerSQL Server (all supported versions)

В рамках SQL ServerSQL Server AlwaysOn экземпляры отказоустойчивой кластеризации AlwaysOn используют функциональные возможности отказоустойчивой кластеризации Windows Server (WSFC) для обеспечения высокого уровня доступности локальных ресурсов за счет избыточности на уровне экземпляра сервера — экземпляра отказоустойчивого кластера (FCI).As part of the SQL ServerSQL Server Always On offering, Always On Failover Cluster Instances leverages Windows Server Failover Clustering (WSFC) functionality to provide local high availability through redundancy at the server-instance level-a failover cluster instance (FCI). Экземпляр отказоустойчивого кластера (FCI) является единственным экземпляром SQL ServerSQL Server , установленным на всех узлах отказоустойчивой кластеризации Windows Server (WSFC) и, возможно, в нескольких подсетях.An FCI is a single instance of SQL ServerSQL Server that is installed across Windows Server Failover Clustering (WSFC) nodes and, possibly, across multiple subnets. Экземпляр отказоустойчивого кластера выглядит в сети как экземпляр SQL ServerSQL Server , запущенный на одном компьютере, но экземпляр отказоустойчивого кластера обеспечивает отработку отказа с переходом одного узла WSFC на другой узел, если текущий узел становится недоступным.On the network, an FCI appears to be an instance of SQL ServerSQL Server running on a single computer, but the FCI provides failover from one WSFC node to another if the current node becomes unavailable.

Экземпляр отказоустойчивого кластера (FCI) может эффективно использовать группы доступности для удаленного аварийного восстановления на уровне базы данных.An FCI can leverage Availability Groups to provide remote disaster recovery at the database level. Дополнительные сведения см. в статье Failover Clustering and Always On Availability Groups (SQL Server) (Отказоустойчивая кластеризация и группы доступности AlwaysOn (SQL Server)).For more information, see Failover Clustering and Availability Groups (SQL Server).

Примечание

В версии Windows Server 2016 Datacenter добавлена поддержка локальных дисковых пространств (S2D).Windows Server 2016 Datacenter edition introduces support for Storage Spaces Direct (S2D). Экземпляры отказоустойчивого кластера SQL Server поддерживают S2D для ресурсов хранилища кластера.SQL Server Failover Cluster Instances support S2D for cluster storage resources. Дополнительные сведения см. в статье Локальные дисковые пространства в Windows Server 2016.For more information, see Storage Spaces Direct in Windows Server 2016.

Также экземпляры отказоустойчивого кластера поддерживают кластеризованные общие тома (CSV).Failover Cluster Instances also support Clustered Shared Volumes (CSV). Дополнительные сведения см. в разделе Основные сведения о кластерных общих томах в отказоустойчивом кластере.For more information, see Understanding Cluster Shared Volumes in a Failover Cluster.

В этом разделе.In this Topic:

Преимущества экземпляра отказоустойчивого кластераBenefits of a Failover Cluster Instance

При сбое оборудования или программного обеспечения сервера приложения или клиенты, связывающиеся с сервером, будут простаивать.When there is hardware or software failure of a server, the applications or clients connecting to the server will experience downtime. Если экземпляр SQL ServerSQL Server настроен как отказоустойчивый кластер (а не как независимый экземпляр), высокий уровень доступности такого экземпляра SQL ServerSQL Server защищен наличием избыточных узлов в отказоустойчивом кластере.When a SQL ServerSQL Server instance is configured to be an FCI (instead of a standalone instance), the high availability of that SQL ServerSQL Server instance is protected by the presence of redundant nodes in the FCI. Только один из узлов в FCI принадлежит группе ресурсов WSFC одновременно.Only one of the nodes in the FCI owns the WSFC resource group at a time. В случае сбоя (отказа оборудования, сбоя операционной системы, приложений или служб) либо при выполнении запланированного обновления группа передается во владение другому узлу отказоустойчивого кластера.In case of a failure (hardware failures, operating system failures, application or service failures), or a planned upgrade, the resource group ownership is moved to another WSFC node. Данный процесс не заметен для клиента или приложения, соединяющегося с SQL ServerSQL Server , и сводит к минимуму время ожидания приложения или клиента во время сбоя.This process is transparent to the client or application connecting to SQL ServerSQL Server and this minimize the downtime the application or clients experience during a failure. Ниже перечислены некоторые ключевые преимущества, которые обеспечивают экземпляры отказоустойчивого кластера SQL ServerSQL Server :The following lists some key benefits that SQL ServerSQL Server failover cluster instances provide:

  • Защита на уровне экземпляра через избыточностьProtection at the instance level through redundancy

  • Автоматический переход на другой ресурс в случае сбоя (отказа оборудования, сбоя операционной системы, приложений или служб)Automatic failover in the event of a failure (hardware failures, operating system failures, application or service failures)

    Важно!

    В группе доступности не поддерживается автоматический переход с FCI на другие узлы в пределах группы доступности.In an availability group, automatic failover from an FCI to other nodes within the availability group is not supported. Это означает, что отказоустойчивые кластеры и независимые узлы не следует объединять внутри одной группы доступности, если автоматический переход на другой ресурс является важным компонентом решения высокого уровня доступности.This means that FCIs and standalone nodes should not be coupled together within an availability group if automatic failover is an important component your high availability solution. Однако такое объединение можно сделать для решения аварийного восстановления .However, this coupling can be made for your disaster recovery solution.

  • Поддержка широкого массива решения хранения, включая диски кластеров WSFC (iSCSI, Fiber Channel и т. д.) и общие папки протокола SMB.Support for a broad array of storage solutions, including WSFC cluster disks (iSCSI, Fiber Channel, and so on) and server message block (SMB) file shares.

  • Решения аварийного восстановления с использованием нескольких подсетей FCI или запуска базы данных на FCI внутри группы доступности.Disaster recovery solution using a multi-subnet FCI or running an FCI-hosted database inside an availability group. Благодаря новой поддержке большого числа подсетей в среде MicrosoftMicrosoftSQL Server 2012 (11.x)SQL Server 2012 (11.x)кластеру FCI с большим количеством подсетей больше не нужна виртуальная локальная сеть, что повышает управляемость и безопасность кластера FCI с большим числом подсетей.With the new multi-subnet support in MicrosoftMicrosoftSQL Server 2012 (11.x)SQL Server 2012 (11.x), a multi-subnet FCI no longer requires a virtual LAN, increasing the manageability and security of a multi-subnet FCI.

  • Нулевая реконфигурация приложений и клиентов при сбоеZero reconfiguration of applications and clients during failovers

  • Гибкая политика отработки отказа для гранулированных событий триггера для автоматической отработки отказаFlexible failover policy for granular trigger events for automatic failovers

  • Надежная отработка отказа посредством периодического подробного отслеживания исправности системы с помощью выделенных и постоянных соединенийReliable failovers through periodic and detailed health detection using dedicated and persisted connections

  • Возможность настройки и предсказуемость во время отработки отказа посредством косвенных контрольных точекConfigurability and predictability in failover time through indirect background checkpoints

  • Использование регулируемых ресурсов при отработке отказаThrottled resource usage during failovers

РекомендацииRecommendations

В рабочей среде рекомендуется использовать статические IP-адреса в сочетании с виртуальным IP-адресом экземпляра отказоустойчивого кластера.In a production environment, we recommend that you use static IP addresses in conjunction the virtual IP address of a Failover Cluster Instance. Не рекомендуется использовать протокол DHCP в рабочей среде.We recommend against using DHCP in a production environment. В случае простоя, если время действия IP-адреса протокола DHCP истекло, на регистрацию нового сетевого IP-адреса протокола DHCP, связанного с DNS-именем, уйдет дополнительное время.In the event of down time, if the DHCP IP lease expires, extra time is required to re-register the new DHCP IP address associated with the DNS name.

Общие сведения об экземпляре отказоустойчивого кластераFailover Cluster Instance Overview

FCI работает в группе ресурсов WSFC вместе с одним или несколькими узлами WSFC.An FCI runs in a WSFC resource group with one or more WSFC nodes. Когда экземпляр FCI запускается, один из узлов принимает владение группой ресурсов и выводит свой экземпляр служб SQL ServerSQL Server в сеть.When the FCI starts up, one of the nodes assume ownership of the resource group and brings its SQL ServerSQL Server instance online. Ресурсы, принадлежащие данному узлу включают в себя:The resources owned by this node include:

  • Сетевое имяNetwork name

  • IP-адресIP address

  • Общие дискиShared disks

  • SQL ServerSQL Server Служба компонента Database EngineDatabase Engine service

  • SQL ServerSQL Server Служба агентаAgent service

  • SQL ServerSQL Server Analysis Services, если эти служб установленыAnalysis Services service, if installed

  • Один файловый ресурс общего доступа, если установлен компонент FILESTREAMOne file share resource, if the FILESTREAM feature is installed

В любое время только владелец группы ресурсов (и никакой другой узел в FCI) запускает соответствующие службы SQL ServerSQL Server в группе ресурсов.At any time, only the resource group owner (and no other node in the FCI) is running its respective SQL ServerSQL Server services in the resource group. Когда происходит переход на другой ресурс, будь то автоматический или запланированный переход на другой ресурс, происходит следующая последовательность событий.When a failover occurs, whether it be an automatic failover or a planned failover, the following sequence of events happen:

  1. Если событие не является сбоем оборудования или системы, все «грязные» страницы в буферном кэше записываются на диск.Unless a hardware or system failure occurs, all dirty pages in the buffer cache are written to disk.

  2. Все соответствующие службы SQL ServerSQL Server в группе ресурсов останавливаются на активном узле.All respective SQL ServerSQL Server services in the resource group are stopped on the active node.

  3. Права владения группой ресурсов переносятся на другой узел в FCI.The resource group ownership is transferred to another node in the FCI.

  4. Новый владелец группы ресурсов запускает свои службы SQL ServerSQL Server .The new resource group owner starts its SQL ServerSQL Server services.

  5. Клиентские запросы на подключение приложения автоматически перенаправляются на новый активный узел, используя то же имя виртуальной сети (VNN).Client application connection requests are automatically directed to the new active node using the same virtual network name (VNN).

FCI находится в сети, если его базовый кластер WSFC находится в исправном состоянии (большая часть узлов кворума WSFC доступны в качестве целей автоматического перехода на другой ресурс).The FCI is online as long as its underlying WSFC cluster is in good quorum health (the majority of the quorum WSFC nodes are available as automatic failover targets). Когда кластер WSFC теряет кворум из-за сбоя аппаратной части, программного обеспечения, сети или неверной настройки кворума, весь кластер WSFC вместе с FCI выводится из сети.When the WSFC cluster loses its quorum, whether due to hardware, software, network failure, or improper quorum configuration, the entire WSFC cluster, along with the FCI, is brought offline. Для этого незапланированного сценария отработки отказа требуется вмешательство пользователя, который должен переустановить кворум для оставшихся доступных узлов, чтобы вернуть кластер WSFC и FCI обратно в сеть.Manual intervention is then required in this unplanned failover scenario to reestablish quorum in the remaining available nodes in order to bring the WSFC cluster and FCI back online. Дополнительные сведения см. в статье Режимы кворума и конфигурация голосования WSFC (SQL Server).For more information, see WSFC Quorum Modes and Voting Configuration (SQL Server).

Прогнозируемое время отработки отказаPredictable Failover Time

В зависимости от того, когда экземпляр SQL ServerSQL Server в последний раз выполнил операцию контрольной точки, в кэше буфера может быть достаточное число «грязных» страниц.Depending on when your SQL ServerSQL Server instance last performed a checkpoint operation, there can be a substantial amount of dirty pages in the buffer cache. Последующая отработка отказа длится столько, сколько потребуется времени для записи оставшихся «грязных» страниц на диск, что может увеличить время отработки отказа непредсказуемым образом.Consequently, failovers last as long as it takes to write the remaining dirty pages to disk, which can lead to long and unpredictable failover time. Начиная с MicrosoftMicrosoftSQL Server 2012 (11.x)SQL Server 2012 (11.x)FCI может использовать косвенные контрольные точки для регулирования числа "грязных" страниц, хранимых в кэше буфера.Beginning with MicrosoftMicrosoftSQL Server 2012 (11.x)SQL Server 2012 (11.x), the FCI can use indirect checkpoints to throttle the amount of dirty pages kept in the buffer cache. Несмотря на то что это занимает дополнительные ресурсы при нормальной рабочей нагрузке, время отработки отказа становится более прогнозируемым и регулируемым.While this does consume additional resources under regular workload, it makes the failover time more predictable as well as more configurable. Это очень полезно, когда в соглашении об уровне обслуживания в организации указана цель времени восстановления (RTO) для решения высокого уровня доступности.This is very useful when the service-level agreement in your organization specifies the recovery time objective (RTO) for your high availability solution. Дополнительные сведения о косвенных контрольных точках см. в разделе Indirect Checkpoints.For more information on indirect checkpoints, see Indirect Checkpoints.

Надежный мониторинг исправности и гибкая политика отработки отказаReliable Health Monitoring and Flexible Failover Policy

После успешного запуска FCI служба WSFC мониторит состояние базового кластера WSFC, а также состояние экземпляра SQL ServerSQL Server .After the FCI starts successfully, the WSFC service monitors both the health of the underlying WSFC cluster, as well as the health of the SQL ServerSQL Server instance. Начиная с MicrosoftMicrosoftSQL Server 2012 (11.x)SQL Server 2012 (11.x)служба WSFC использует выделенную линию для обращения к экземпляру SQL ServerSQL Server и получения подробной диагностики компонентов посредством системной хранимой процедуры.Beginning with MicrosoftMicrosoftSQL Server 2012 (11.x)SQL Server 2012 (11.x), the WSFC service uses a dedicated connection to poll the active SQL ServerSQL Server instance for detailed component diagnostics through a system stored procedure. Это имеет три последствия.The implication of this is three-fold:

  • Выделенное соединение с экземпляром SQL ServerSQL Server позволяет получать надежную диагностику компонентов в любое время, даже когда FCI испытывает перегрузку.The dedicated connection to the SQL ServerSQL Server instance makes it possible to reliably poll for component diagnostics all the time, even when the FCI is under heavy load. В результате можно выделить систему, испытывающую большую нагрузку, и систему, которая находится на грани отработки отказа, позволяя избежать проблем, связанных с ложной отработкой отказа.This makes it possible to distinguish between a system that is under heavy load and a system that actually has failure conditions, thus preventing issues such as false failovers.

  • Подробная диагностика компонентов позволяет настроить более гибкую политику отработки отказа, с помощью которой вы можете выбрать, какие условия отказа запускают отработку отказа, а какие нет.The detailed component diagnostics makes it possible to configure a more flexible failover policy, whereby you can choose what failure conditions trigger failovers and which failure conditions do not.

  • Подробная диагностика компонентов также позволяет лучше устранять ошибки автоматической отработки отказа.The detailed component diagnostics also enables better troubleshooting of automatic failovers retroactively. Сведения диагностики сохраняются в файлы журналов, связанные с журналами ошибок SQL ServerSQL Server .The diagnostic information is stored to log files, which are collocated with the SQL ServerSQL Server error logs. Файлы можно загрузить в средство просмотра файлов журнала для изучения состояний компонентов, которые привели к отработке отказа, чтобы определить причину сбоя.You can load them into the Log File Viewer to inspect the component states leading up to the failover occurrence in order to determine what cause that failover.

Дополнительные сведения см. в разделе Failover Policy for Failover Cluster Instances.For more information, see Failover Policy for Failover Cluster Instances

Элементы экземпляра отказоустойчивого кластераElements of a Failover Cluster Instance

FCI включает набор физических серверов (узлов), которые имеют схожую аппаратную и программную конфигурацию, в том числе версию операционной системы и уровень обновления, версию SQL ServerSQL Server , ее уровень обновления, компоненты и имя экземпляра.An FCI consists of a set of physical servers (nodes) that contain similar hardware configuration as well as identical software configuration that includes operating system version and patch level, and SQL ServerSQL Server version, patch level, components, and instance name. Идентичная программная конфигурация необходима для того, чтобы FCI смог работать после отработки отказа между двумя узлами.Identical software configuration is necessary to ensure that the FCI can be fully functional as it fails over between the nodes.

Группа ресурсов WSFCWSFC Resource Group
FCI SQL ServerSQL Server работает в группе ресурсов WSFC.A SQL ServerSQL Server FCI runs in a WSFC resource group. Каждый узел в группе ресурсов поддерживает синхронизированную копию параметров конфигурации и разделов реестра для того, чтобы сохранить полную функциональность FCI после отработки отказа, при этом только один узел в кластере владеет группой ресурсов одновременно (активный узел).Each node in the resource group maintains a synchronized copy of the configuration settings and check-pointed registry keys to ensure full functionality of the FCI after a failover, and only one of the nodes in the cluster owns the resource group at a time (the active node). Служба WSFC управляет кластером сервера, конфигурацией кворума, политикой и операциями отработки отказа, а также именем виртуальной сети и виртуальными IP-адресами для FCI.The WSFC service manages the server cluster, quorum configuration, failover policy, and failover operations, as well as the VNN and virtual IP addresses for the FCI. В случае сбоя (аппаратной части, операционной системы, приложения или службы) или запланированного обновления права владения группой ресурсов перемещаются на другой узел в FCI. Число узлов, поддерживаемых в группе ресурсов WSFC, зависит от выпуска SQL ServerSQL Server .In case of a failure (hardware failures, operating system failures, application or service failures) or a planned upgrade, the resource group ownership is moved to another node in the FCI.The number of nodes that are supported in a WSFC resource group depends on your SQL ServerSQL Server edition. Также один кластер WSFC может запускать несколько FCI (множественные группы ресурсов), в зависимости от возможностей оборудования, например ЦП, памяти и числа дисков.Also, the same WSFC cluster can run multiple FCIs (multiple resource groups), depending on your hardware capacity, such as CPUs, memory, and number of disks.

Двоичные файлы SQL ServerSQL Server Binaries
Двоичные файлы устанавливаются локально на каждом узле FCI, так же как и в случае изолированной установки SQL ServerSQL Server .The product binaries are installed locally on each node of the FCI, a process similar to SQL ServerSQL Server stand-alone installations. Однако во время запуска службы не запускаются автоматически, а управляются службой WSFC.However, during startup, the services are not started automatically, but managed by WSFC.

ПамятьStorage
В отличие от группы доступности, на всех узлах FCI должно использоваться общее хранилище для базы данных и журналов.Contrary to the availability group, an FCI must use shared storage between all nodes of the FCI for database and log storage. Это общее хранилище может быть организовано в форме дисков кластера WSFC, дисков в сети хранения данных (SAN), локальных дисковых пространств (S2D) или общих папок SMB.The shared storage can be in the form of WSFC cluster disks, disks on a SAN, Storage Spaces Direct (S2D), or file shares on an SMB. Таким образом, все узлы в FCI имеют одинаковое представление данных экземпляра всегда, когда происходит отработка отказа.This way, all nodes in the FCI have the same view of instance data whenever a failover occurs. Однако в этом случае общее хранилище может стать единственной точкой сбоя, в то время как FCI зависит от базового решения хранилища для обеспечения защиты данных.This does mean, however, that the shared storage has the potential of being the single point of failure, and FCI depends on the underlying storage solution to ensure data protection.

Сетевое имяNetwork Name
VNN для FCI предоставляет единую точку соединения для FCI.The VNN for the FCI provides a unified connection point for the FCI. Это позволяет приложениям подключаться к VNN без необходимости знать текущий активный узел.This allows applications to connect to the VNN without the need to know the currently active node. Когда происходит отработка отказа, VNN регистрируется на новом активном узле после его запуска.When a failover occurs, the VNN is registered to the new active node after it starts. Данный процесс не заметен для клиента или приложения, соединяющегося с SQL ServerSQL Server , и сводит к минимуму время ожидания приложения или клиента во время сбоя.This process is transparent to the client or application connecting to SQL ServerSQL Server and this minimize the downtime the application or clients experience during a failure.

Виртуальные IP-адресаVirtual IPs
В случае многоподсетевого кластера FCI виртуальный IP-адрес присваивается каждой подсети FCI.In the case of a multi-subnet FCI, a virtual IP address is assigned to each subnet in the FCI. В ходе отработки отказа VNN-имя DNS-сервера обновляется и указывает на виртуальный IP-адрес соответствующей подсети.During a failover, the VNN on the DNS server is updated to point to the virtual IP address for the respective subnet. Приложения и клиенты могут подключиться к FCI, используя то же самое имя VNN после многоподсетевой отработки отказа.Applications and clients can then connect to the FCI using the same VNN after a multi-subnet failover.

Основные понятия и задачи отработки отказа SQL ServerSQL Server Failover Concepts and Tasks

Основные понятия и задачиConcepts and Tasks РазделTopic
Описывает механизм обнаружения сбоя и гибкую политику отработки отказа.Describes the failure detection mechanism and the flexible failover policy. Failover Policy for Failover Cluster InstancesFailover Policy for Failover Cluster Instances
Описание основных понятий в управлении и обслуживании экземпляров отказоустойчивых кластеров.Describes concepts in FCI administration and maintenance. Администрирование и обслуживание экземпляров отказоустойчивого кластераFailover Cluster Instance Administration and Maintenance
Описание и понятия конфигурации с несколькими подсетямиDescribes multi-subnet configuration and concepts Кластеры SQL Server с несколькими подсетями (SQL Server)SQL Server Multi-Subnet Clustering (SQL Server)
Описание разделаTopic descriptions РазделTopic
Описывает, как установить новый FCI SQL ServerSQL Server .Describes how to install a new SQL ServerSQL Server FCI. Создание отказоустойчивого кластера SQL Server (программа установки)Create a New SQL Server Failover Cluster (Setup)
Описывает, как выполнить обновление до отказоустойчивого кластера SQL Server 2019 (15.x)SQL Server 2019 (15.x) .Describes how to upgrade to a SQL Server 2019 (15.x)SQL Server 2019 (15.x) failover cluster. Обновление экземпляра отказоустойчивого кластера SQL Server.Upgrade a SQL Server Failover Cluster Instance
Описание основных понятий отказоустойчивых кластеров Windows, а также ссылки на связанные с ними задачи.Describes Windows Failover Clustering Concepts and provides links to tasks related to Windows Failover Clustering Windows Server 2008Windows Server 2008: обзор отказоустойчивых кластеров: Overview of Failover Clusters

Windows Server 2008Windows Server 2008 R2: обзор отказоустойчивых кластеровR2: Overview of Failover Clusters
Описывает различия в основных понятиях между узлами в экземпляре отказоустойчивого кластера и репликами внутри группы доступности, а также содержит рекомендации по использованию экземпляра отказоустойчивого кластера для размещения реплики для группы доступности.Describes the distinctions in concepts between nodes in an FCI and replicas within an availability group and considerations for using an FCI to host a replica for an availability group. Отказоустойчивая кластеризация и группы доступности (SQL Server)Failover Clustering and Availability Groups (SQL Server)