Экземпляры отказоустойчивого кластера AlwaysOn (SQL Server)

Применимо к:SQL Server

В рамках предложения AlwaysOn SQL Server экземпляры отказоустойчивого кластера AlwaysOn используют функции отказоустойчивости кластеров Windows Server (WSFC) для обеспечения локальной высокой доступности с помощью избыточности на уровне отказоустойчивого кластера сервера (FCI). FCI — это один экземпляр SQL Server, установленный в узлах отказоустойчивой кластеризации Windows Server (WSFC) и, возможно, в нескольких подсетях. В сети FCI, как представляется, экземпляр SQL Server, работающий на одном компьютере, но FCI обеспечивает отработку отказа с одного узла WSFC на другой, если текущий узел становится недоступным.

Экземпляр отказоустойчивого кластера (FCI) может эффективно использовать группы доступности для удаленного аварийного восстановления на уровне базы данных. Дополнительные сведения см. в статье Failover Clustering and Availability Groups (SQL Server) (Отказоустойчивая кластеризация и группы доступности (SQL Server)).

Примечание.

В версии Windows Server 2016 Datacenter добавлена поддержка локальных дисковых пространств (S2D). Экземпляры отказоустойчивого кластера SQL Server поддерживают S2D для ресурсов хранилища кластера. Дополнительные сведения можно найти в статье о локальных дисковых пространствах в Windows Server.

Также экземпляры отказоустойчивого кластера поддерживают кластеризованные общие тома (CSV). Дополнительные сведения см. в разделе Основные сведения о кластерных общих томах в отказоустойчивом кластере.

В этой статье вы найдете:

Преимущества экземпляра отказоустойчивого кластера

При сбое оборудования или программного обеспечения сервера приложения или клиенты, связывающиеся с сервером, будут простаивать. Если экземпляр SQL Server настроен как FCI (вместо автономного экземпляра), высокий уровень доступности этого экземпляра SQL Server защищен наличием избыточных узлов в FCI. Только один из узлов в FCI принадлежит группе ресурсов WSFC одновременно. В случае сбоя (отказа оборудования, сбоя операционной системы, приложений или служб) либо при выполнении запланированного обновления группа передается во владение другому узлу отказоустойчивого кластера. Этот процесс является прозрачным для клиента или приложения, подключающегося к SQL Server, и это сокращает время простоя приложения или клиентов во время сбоя. Ниже перечислены некоторые ключевые преимущества, предоставляемые экземплярами отказоустойчивого кластера SQL Server:

  • Защита на уровне экземпляра через избыточность

  • Автоматический переход на другой ресурс в случае сбоя (отказа оборудования, сбоя операционной системы, приложений или служб)

    Важно!

    В группе доступности не поддерживается автоматический переход с FCI на другие узлы в пределах группы доступности. Это означает, что отказоустойчивые кластеры и независимые узлы не следует объединять внутри одной группы доступности, если автоматический переход на другой ресурс является важным компонентом решения высокого уровня доступности. Однако такое объединение можно сделать для решения аварийного восстановления .

  • Поддержка широкого массива решения хранения, включая диски кластеров WSFC (iSCSI, Fiber Channel и т. д.) и общие папки протокола SMB.

  • Решения аварийного восстановления с использованием нескольких подсетей FCI или запуска базы данных на FCI внутри группы доступности. Благодаря новой поддержке нескольких подсетей в Microsoft SQL Server 2012 (11.x) многосеть FCI больше не требует виртуальной локальной сети, повышая управляемость и безопасность FCI с несколькими подсетями.

  • Нулевая реконфигурация приложений и клиентов при сбое

  • Гибкая политика отработки отказа для гранулированных событий триггера для автоматической отработки отказа

  • Надежная отработка отказа посредством периодического подробного отслеживания исправности системы с помощью выделенных и постоянных соединений

  • Возможность настройки и предсказуемость во время отработки отказа посредством косвенных контрольных точек

  • Использование регулируемых ресурсов при отработке отказа

Рекомендации

В рабочей среде рекомендуется использовать статические IP-адреса в сочетании с виртуальным IP-адресом экземпляра отказоустойчивого кластера. Не рекомендуется использовать протокол DHCP в рабочей среде. В случае простоя, если время действия IP-адреса протокола DHCP истекло, на регистрацию нового сетевого IP-адреса протокола DHCP, связанного с DNS-именем, уйдет дополнительное время.

Общие сведения об экземпляре отказоустойчивого кластера

FCI работает в группе ресурсов WSFC вместе с одним или несколькими узлами WSFC. При запуске FCI один из узлов берет на себя ответственность за группу ресурсов и переносит его экземпляр SQL Server в режим "в сети". Ресурсы, принадлежащие данному узлу включают в себя:

  • Имя сети

  • IP-адрес

  • Общие диски

  • Служба ядро СУБД SQL Server

  • служба агента SQL Server

  • Служба SQL Server Analysis Services, если она установлена

  • Один файловый ресурс общего доступа, если установлен компонент FILESTREAM

В любое время только владелец группы ресурсов (и ни один другой узел в FCI) выполняет соответствующие службы SQL Server в группе ресурсов. При автоматическом или запланированном переходе на другой ресурс происходит следующая последовательность событий.

  1. Если событие не является сбоем оборудования или системы, все «грязные» страницы в буферном кэше записываются на диск.

  2. Все соответствующие службы SQL Server в группе ресурсов остановлены на активном узле.

  3. Права владения группой ресурсов переносятся на другой узел в FCI.

  4. Новый владелец группы ресурсов запускает службы SQL Server.

  5. Клиентские запросы на подключение приложения автоматически перенаправляются на новый активный узел, используя то же имя виртуальной сети (VNN).

FCI находится в сети, если его базовый кластер WSFC находится в исправном состоянии (большая часть узлов кворума WSFC доступны в качестве целей автоматического перехода на другой ресурс). Когда кластер WSFC теряет кворум из-за сбоя аппаратной части, программного обеспечения, сети или неверной настройки кворума, весь кластер WSFC вместе с FCI выводится из сети. Для этого незапланированного сценария отработки отказа требуется вмешательство пользователя, который должен переустановить кворум для оставшихся доступных узлов, чтобы вернуть кластер WSFC и FCI обратно в сеть. Дополнительные сведения см. в разделе Режим кворума и участвующая в голосовании конфигурация WSFC (SQL Server).

Прогнозируемое время отработки отказа

В зависимости от того, когда экземпляр SQL Server последний раз выполнял операцию проверка point, в кэше буфера может быть значительное количество страниц грязное. Последующая отработка отказа длится столько, сколько потребуется времени для записи оставшихся «грязных» страниц на диск, что может увеличить время отработки отказа непредсказуемым образом. Начиная с Microsoft SQL Server 2012 (11.x), FCI может использовать косвенные проверка точки для регулирования количества страниц грязное, хранящихся в кэше буфера. Несмотря на то что это занимает дополнительные ресурсы при нормальной рабочей нагрузке, время отработки отказа становится более прогнозируемым и регулируемым. Это очень полезно, когда в соглашении об уровне обслуживания в организации указана цель времени восстановления (RTO) для решения высокого уровня доступности. Дополнительные сведения о косвенных контрольных точках см. в разделе Indirect Checkpoints.

Надежный мониторинг исправности и гибкая политика отработки отказа

После успешного запуска FCI служба WSFC отслеживает работоспособность базового кластера WSFC, а также работоспособность экземпляра SQL Server. Начиная с Microsoft SQL Server 2012 (11.x), служба WSFC использует выделенное подключение для опроса активного экземпляра SQL Server для получения подробных диагностика компонентов с помощью системной хранимой процедуры. Это имеет три последствия.

  • Выделенное подключение к экземпляру SQL Server позволяет надежно опрашивать компонент диагностика все время, даже если FCI находится под тяжелой нагрузкой. В результате можно выделить систему, испытывающую большую нагрузку, и систему, которая находится на грани отработки отказа, позволяя избежать проблем, связанных с ложной отработкой отказа.

  • Подробная диагностика компонентов позволяет настроить более гибкую политику отработки отказа, с помощью которой вы можете выбрать, какие условия отказа запускают отработку отказа, а какие нет.

  • Подробная диагностика компонентов также позволяет лучше устранять ошибки автоматической отработки отказа. Диагностические сведения хранятся в файлах журналов, которые сопоставляются с журналами ошибок SQL Server. Файлы можно загрузить в средство просмотра файлов журнала для изучения состояний компонентов, которые привели к отработке отказа, чтобы определить причину сбоя.

Дополнительные сведения см. в разделе Failover Policy for Failover Cluster Instances.

Элементы экземпляра отказоустойчивого кластера

FCI состоит из набора физических серверов (узлов), содержащих аналогичную конфигурацию оборудования, а также идентичную конфигурацию программного обеспечения, которая включает версию операционной системы и уровень исправлений, а также версию SQL Server, уровень исправлений, компоненты и имя экземпляра. Идентичная программная конфигурация необходима для того, чтобы FCI смог работать после отработки отказа между двумя узлами.

Группа ресурсов WSFC
FCI SQL Server выполняется в группе ресурсов WSFC. Каждый узел в группе ресурсов поддерживает синхронизированную копию параметров конфигурации и разделов реестра для того, чтобы сохранить полную функциональность FCI после отработки отказа, при этом только один узел в кластере владеет группой ресурсов одновременно (активный узел). Служба WSFC управляет кластером сервера, конфигурацией кворума, политикой и операциями отработки отказа, а также именем виртуальной сети и виртуальными IP-адресами для FCI. В случае сбоя (сбоев оборудования, сбоев операционной системы, приложений или служб) либо при выполнении запланированного обновления группа ресурсов передается во владение другому узлу в FCI. Количество узлов, поддерживаемых в группе ресурсов WSFC, зависит от выпуска SQL Server. Также один кластер WSFC может запускать несколько FCI (множественные группы ресурсов), в зависимости от возможностей оборудования, например ЦП, памяти и числа дисков.

Двоичные файлы SQL Server
Двоичные файлы продукта устанавливаются локально на каждом узле FCI, как и в автономных установках SQL Server. Однако во время запуска службы не запускаются автоматически, а управляются службой WSFC.

Хранилище
В отличие от группы доступности, на всех узлах FCI должно использоваться общее хранилище для базы данных и журналов. Это общее хранилище может быть организовано в форме дисков кластера WSFC, дисков в сети хранения данных (SAN), локальных дисковых пространств (S2D) или общих папок SMB. Таким образом, все узлы в FCI имеют одинаковое представление данных экземпляра всегда, когда происходит отработка отказа. Однако в этом случае общее хранилище может стать единственной точкой сбоя, в то время как FCI зависит от базового решения хранилища для обеспечения защиты данных.

Сетевое имя
VNN для FCI предоставляет единую точку соединения для FCI. Это позволяет приложениям подключаться к VNN без необходимости знать текущий активный узел. Когда происходит отработка отказа, VNN регистрируется на новом активном узле после его запуска. Этот процесс является прозрачным для клиента или приложения, подключающегося к SQL Server, и это сокращает время простоя приложения или клиентов во время сбоя.

Виртуальные IP-адреса
В случае многоподсетевого кластера FCI виртуальный IP-адрес присваивается каждой подсети FCI. В ходе отработки отказа VNN-имя DNS-сервера обновляется и указывает на виртуальный IP-адрес соответствующей подсети. Приложения и клиенты могут подключиться к FCI, используя то же самое имя VNN после многоподсетевой отработки отказа.

Основные понятия и задачи отработки отказа SQL Server

Основные понятия и задачи Статья
Описывает механизм обнаружения сбоя и гибкую политику отработки отказа. Failover Policy for Failover Cluster Instances
Описание основных понятий в управлении и обслуживании экземпляров отказоустойчивых кластеров. Администрирование и обслуживание экземпляров отказоустойчивого кластера
Описание и понятия конфигурации с несколькими подсетями Кластеры SQL Server с несколькими подсетями (SQL Server)

См. также

Описание раздела Статья
Описывает установку нового FCI SQL Server. Создание нового отказоустойчивого кластера SQL Server (программа установки)
Описывает обновление до отказоустойчивого кластера SQL Server. Обновление экземпляра отказоустойчивого кластера SQL Server.
Описание основных понятий отказоустойчивых кластеров Windows, а также ссылки на связанные с ними задачи. Отказоустойчивый кластер Windows Server с SQL Server
Описывает различия в основных понятиях между узлами в экземпляре отказоустойчивого кластера и репликами внутри группы доступности, а также содержит рекомендации по использованию экземпляра отказоустойчивого кластера для размещения реплики для группы доступности. Отказоустойчивая кластеризация и группы доступности (SQL Server)