Instâncias do cluster de failover do AlwaysOn (SQL Server)Always On Failover Cluster Instances (SQL Server)

APLICA-SE A: simSQL Server nãoBanco de Dados SQL do Azure nãoSQL Data Warehouse do Azure nãoParallel Data Warehouse APPLIES TO: yesSQL Server noAzure SQL Database noAzure SQL Data Warehouse noParallel Data Warehouse

Como parte da oferta do SQL ServerSQL Server Always On, as Instâncias de Cluster de Failover do Always On aproveitam a funcionalidade WSFC (Windows Server Failover Clustering) para fornecer alta disponibilidade local por meio de redundância no nível da instância de servidor, uma FCI (instância de cluster de failover).As part of the SQL ServerSQL Server Always On offering, Always On Failover Cluster Instances leverages Windows Server Failover Clustering (WSFC) functionality to provide local high availability through redundancy at the server-instance level-a failover cluster instance (FCI). Uma FCI é uma instância única do SQL ServerSQL Server que é instalada em nós de WSFC (Windows Server Failover Clustering) e, possivelmente, em várias sub-redes.An FCI is a single instance of SQL ServerSQL Server that is installed across Windows Server Failover Clustering (WSFC) nodes and, possibly, across multiple subnets. Na rede, uma FCI aparece ser uma instância do SQL ServerSQL Server sendo executada em um único computador, mas proporciona failover de um nó do WSFC para outro se o nó atual se tornar indisponível.On the network, an FCI appears to be an instance of SQL ServerSQL Server running on a single computer, but the FCI provides failover from one WSFC node to another if the current node becomes unavailable.

Uma FCI pode aproveitar os Grupos de Disponibilidade para fornecer recuperação remota de desastres no nível do banco de dados.An FCI can leverage Availability Groups to provide remote disaster recovery at the database level. Para obter mais informações, consulte Clustering de failover e Grupos de Disponibilidade (SQL Server).For more information, see Failover Clustering and Availability Groups (SQL Server).

Observação

O Windows Server 2016 Datacenter Edition apresenta suporte para S2D (Espaços de Armazenamento Diretos).Windows Server 2016 Datacenter edition introduces support for Storage Spaces Direct (S2D). As instâncias de cluster de failover do SQL Server dão suporte ao S2D para recursos de armazenamento de cluster.SQL Server Failover Cluster Instances support S2D for cluster storage resources. Para obter mais informações, consulte Espaços de Armazenamento Diretos no Windows Server 2016.For more information, see Storage Spaces Direct in Windows Server 2016.

As instâncias de cluster de failover também dão suporte ao CSVs (Volumes Compartilhados de Cluster).Failover Cluster Instances also support Clustered Shared Volumes (CSV). Para obter mais informações, veja Noções básicas sobre volumes compartilhados clusterizados em um cluster de failover.For more information, see Understanding Cluster Shared Volumes in a Failover Cluster.

Neste tópico:In this Topic:

Benefícios de uma instância de cluster de failoverBenefits of a Failover Cluster Instance

Quando há falha de hardware ou de software de um servidor, os aplicativos ou clientes que conectam ao servidor enfrentam um tempo de inatividade.When there is hardware or software failure of a server, the applications or clients connecting to the server will experience downtime. Quando uma instância do SQL ServerSQL Server é configurada para ser uma FCI (em vez de uma instância autônoma), a alta disponibilidade dessa instância do SQL ServerSQL Server é protegida pela presença de nós redundantes na FCI.When a SQL ServerSQL Server instance is configured to be an FCI (instead of a standalone instance), the high availability of that SQL ServerSQL Server instance is protected by the presence of redundant nodes in the FCI. Somente um dos nós na FCI tem o grupo de recursos do WSFC de cada vez.Only one of the nodes in the FCI owns the WSFC resource group at a time. No caso de uma falha (problemas de hardware, falhas de sistema operacional, aplicativo ou falhas de serviço) ou de uma atualização planejada, a propriedade do grupo de recursos é movida para outro nó do WSFC.In case of a failure (hardware failures, operating system failures, application or service failures), or a planned upgrade, the resource group ownership is moved to another WSFC node. Este processo é transparente ao cliente ou aplicativo que se conecta ao SQL ServerSQL Server e isso minimiza o tempo de inatividade pelo qual passa o aplicativo ou os clientes durante uma falha.This process is transparent to the client or application connecting to SQL ServerSQL Server and this minimize the downtime the application or clients experience during a failure. Alguns dos principais benefícios que instâncias de cluster de failover do SQL ServerSQL Server oferecem:The following lists some key benefits that SQL ServerSQL Server failover cluster instances provide:

  • Proteção em nível de instância por redundânciaProtection at the instance level through redundancy

  • Failover automático no caso de uma falha (problemas de hardware, falhas de sistema operacional, aplicativo ou falhas de serviço)Automatic failover in the event of a failure (hardware failures, operating system failures, application or service failures)

    Importante

    Em um grupo de disponibilidade, não há suporte para o failover automático de uma FCI para outros nós dentro do grupo de disponibilidade.In an availability group, automatic failover from an FCI to other nodes within the availability group is not supported. Isto significa que os nós das FCIs e autônomos não deverão ser acoplados dentro de um grupo de disponibilidade se o failover automático for um componente importante de sua solução de alta disponibilidade.This means that FCIs and standalone nodes should not be coupled together within an availability group if automatic failover is an important component your high availability solution. Porém, este acoplamento pode ser feito para sua solução de recuperação de desastres .However, this coupling can be made for your disaster recovery solution.

  • Suporte para uma matriz ampla de soluções de armazenamento, inclusive discos de cluster do WSFC (iSCSI, Fiber Channel e assim por diante) e compartilhamentos de arquivos de protocolo SMB.Support for a broad array of storage solutions, including WSFC cluster disks (iSCSI, Fiber Channel, and so on) and server message block (SMB) file shares.

  • Solução de recuperação de desastres usando uma FCI de várias sub-redes ou executando um banco de dados hospedado por FCI dentro de um grupo de disponibilidade.Disaster recovery solution using a multi-subnet FCI or running an FCI-hosted database inside an availability group. Com o novo suporte a várias sub-redes no MicrosoftMicrosoftSQL Server 2012 (11.x)SQL Server 2012 (11.x), uma FCI de várias sub-redes não mais exigirá uma LAN virtual, aumentando a capacidade de gerenciamento e a segurança de uma FCI de várias sub-redes.With the new multi-subnet support in MicrosoftMicrosoftSQL Server 2012 (11.x)SQL Server 2012 (11.x), a multi-subnet FCI no longer requires a virtual LAN, increasing the manageability and security of a multi-subnet FCI.

  • Zero reconfiguração de aplicativos e clientes durante failoversZero reconfiguration of applications and clients during failovers

  • Política de failover flexível para eventos de gatilho granulares para failovers automáticosFlexible failover policy for granular trigger events for automatic failovers

  • Failovers confiáveis por meio de detecção de integridade periódica e detalhada usando conexões dedicadas e persistidasReliable failovers through periodic and detailed health detection using dedicated and persisted connections

  • Capacidade de configuração e previsibilidade em tempo de failover por meio de pontos de verificação indiretos em segundo planoConfigurability and predictability in failover time through indirect background checkpoints

  • Uso acelerado de recurso durante failoversThrottled resource usage during failovers

RecomendaçõesRecommendations

Em um ambiente de produção, é recomendável usar endereços IP estáticos juntamente com o endereço IP virtual de uma instância de cluster de failover.In a production environment, we recommend that you use static IP addresses in conjunction the virtual IP address of a Failover Cluster Instance. Não é recomendável o uso do DHCP em um ambiente de produção.We recommend against using DHCP in a production environment. No caso de tempo de inatividade, se a concessão do IP DHCP expirar, será necessário tempo adicional para registrar novamente o endereço IP DHCP novo associado ao nome DNS.In the event of down time, if the DHCP IP lease expires, extra time is required to re-register the new DHCP IP address associated with the DNS name.

Visão geral da instância de cluster de failoverFailover Cluster Instance Overview

Uma FCI é executada em um grupo de recursos do WSFC com um ou mais nós do WSFC.An FCI runs in a WSFC resource group with one or more WSFC nodes. Quando a FCI é iniciada, um dos nós assume a propriedade do grupo de recursos e coloca sua instância do SQL ServerSQL Server online.When the FCI starts up, one of the nodes assume ownership of the resource group and brings its SQL ServerSQL Server instance online. Os recursos de propriedade deste nó incluem:The resources owned by this node include:

  • Nome da redeNetwork name

  • Endereço IPIP address

  • Discos compartilhadosShared disks

  • SQL ServerSQL Server Serviço do Mecanismo de Banco de DadosDatabase Engine service

  • SQL ServerSQL Server AgentAgent service

  • SQL ServerSQL Server Analysis Services, se estiver instaladoAnalysis Services service, if installed

  • Um recurso de compartilhamento de arquivos, se o recurso FILESTREAM estiver instaladoOne file share resource, if the FILESTREAM feature is installed

A qualquer momento, somente o proprietário do grupo de recursos (e nenhum outro nó na FCI) está executando os respectivos serviços do SQL ServerSQL Server no grupo de recursos.At any time, only the resource group owner (and no other node in the FCI) is running its respective SQL ServerSQL Server services in the resource group. Quando um failover ocorrer, se é um failover automático ou um failover planejado, esta sequência de eventos acontece:When a failover occurs, whether it be an automatic failover or a planned failover, the following sequence of events happen:

  1. A menos que ocorra uma falha de hardware ou de sistema, todas as páginas sujas no cache do buffer serão gravadas no disco.Unless a hardware or system failure occurs, all dirty pages in the buffer cache are written to disk.

  2. Todos os respectivos serviços do SQL ServerSQL Server no grupo de recursos são parados no nó ativo.All respective SQL ServerSQL Server services in the resource group are stopped on the active node.

  3. A propriedade de grupo de recursos é transferida para outro nó na FCI.The resource group ownership is transferred to another node in the FCI.

  4. O novo proprietário do grupo de recursos inicia seus serviços do SQL ServerSQL Server .The new resource group owner starts its SQL ServerSQL Server services.

  5. As solicitações de conexão de aplicativo cliente são automaticamente direcionadas para o novo nó ativo usando o mesmo VNN (nome de rede virtual).Client application connection requests are automatically directed to the new active node using the same virtual network name (VNN).

A FCI fica online contanto que seu cluster WSFC subjacente esteja com boa integridade de quorum (a maioria dos nós do quorum WSFC estão disponíveis como destinos de failover automáticos).The FCI is online as long as its underlying WSFC cluster is in good quorum health (the majority of the quorum WSFC nodes are available as automatic failover targets). Quando o cluster do WSFC perde seu quorum, devido a falha de hardware, software, rede ou configuração de quorum imprópria, o cluster do WSFC inteiro, junto com o FCI, é colocado offline.When the WSFC cluster loses its quorum, whether due to hardware, software, network failure, or improper quorum configuration, the entire WSFC cluster, along with the FCI, is brought offline. É necessário realizar uma intervenção manual neste cenário de failover não planejado para restabelecer o quorum nos nós disponíveis restantes para colocar o cluster do WSFC e da FCI online novamente.Manual intervention is then required in this unplanned failover scenario to reestablish quorum in the remaining available nodes in order to bring the WSFC cluster and FCI back online. Para obter mais informações, veja Configuração de modos de quorum WSFC e votação (SQL Server).For more information, see WSFC Quorum Modes and Voting Configuration (SQL Server).

Hora de failover previsívelPredictable Failover Time

Dependendo de quando sua instância do SQL ServerSQL Server executou uma operação de ponto de verificação pela última vez, pode haver uma quantidade significativa de páginas sujas no cache do buffer.Depending on when your SQL ServerSQL Server instance last performed a checkpoint operation, there can be a substantial amount of dirty pages in the buffer cache. Por consequência, os failovers duram o suficiente para gravar as páginas sujas restantes no disco, o que pode levar a um tempo de failover longo e imprevisível.Consequently, failovers last as long as it takes to write the remaining dirty pages to disk, which can lead to long and unpredictable failover time. A partir do MicrosoftMicrosoftSQL Server 2012 (11.x)SQL Server 2012 (11.x), a FCI pode usar pontos de verificação indiretos para limitar a quantidade de páginas sujas mantidas no cache do buffer.Beginning with MicrosoftMicrosoftSQL Server 2012 (11.x)SQL Server 2012 (11.x), the FCI can use indirect checkpoints to throttle the amount of dirty pages kept in the buffer cache. Embora consuma recursos adicionais sob carga de trabalho normal, isto torna o failover mais previsível e também mais configurável.While this does consume additional resources under regular workload, it makes the failover time more predictable as well as more configurable. Isto é muito útil quando o acordo do nível de serviço em sua organização especifica o RTO (objetivo de tempo de recuperação) para sua solução de alta disponibilidade.This is very useful when the service-level agreement in your organization specifies the recovery time objective (RTO) for your high availability solution. Para obter mais informações sobre pontos de verificação indiretos, consulte Indirect Checkpoints.For more information on indirect checkpoints, see Indirect Checkpoints.

Monitoramento de integridade confiável e política de failover flexívelReliable Health Monitoring and Flexible Failover Policy

Depois que a FCI é iniciada com sucesso, o serviço do WSFC monitora a integridade do cluster do WSFC subjacente e também a integridade da instância do SQL ServerSQL Server .After the FCI starts successfully, the WSFC service monitors both the health of the underlying WSFC cluster, as well as the health of the SQL ServerSQL Server instance. A partir do MicrosoftMicrosoftSQL Server 2012 (11.x)SQL Server 2012 (11.x), o serviço do WSFC usa uma conexão dedicada para sondar a instância do SQL ServerSQL Server ativa em busca de diagnóstico de componente detalhados por meio de um procedimento armazenado de sistema.Beginning with MicrosoftMicrosoftSQL Server 2012 (11.x)SQL Server 2012 (11.x), the WSFC service uses a dedicated connection to poll the active SQL ServerSQL Server instance for detailed component diagnostics through a system stored procedure. São três implicações:The implication of this is three-fold:

  • A conexão dedicada para a instância do SQL ServerSQL Server possibilita sondar diagnóstico de componente com confiança o tempo todo, mesmo quando a FCI está sob carga pesada.The dedicated connection to the SQL ServerSQL Server instance makes it possible to reliably poll for component diagnostics all the time, even when the FCI is under heavy load. Isto possibilita distinguir entre um sistema que está sob carga pesada e um sistema que de fato tem condições de falha, impedindo, portanto, problemas como falsos failovers.This makes it possible to distinguish between a system that is under heavy load and a system that actually has failure conditions, thus preventing issues such as false failovers.

  • Os diagnóstico de componente detalhado possibilita configurar uma política de failover mais flexível, por meio da qual você pode escolher quais condições de falha acionam failovers e quais condições de falha não acionam.The detailed component diagnostics makes it possible to configure a more flexible failover policy, whereby you can choose what failure conditions trigger failovers and which failure conditions do not.

  • O diagnóstico de componente detalhado também permite uma melhor solução de problemas de failovers automáticos retroativamente.The detailed component diagnostics also enables better troubleshooting of automatic failovers retroactively. As informações de diagnóstico são armazenadas em arquivos de log que são colocados com os logs de erros do SQL ServerSQL Server .The diagnostic information is stored to log files, which are collocated with the SQL ServerSQL Server error logs. Você pode carregá-los no Visualizador do Arquivo de Log para inspecionar os estados do componente que levam até a ocorrência de failover para determinar o que causa o failover.You can load them into the Log File Viewer to inspect the component states leading up to the failover occurrence in order to determine what cause that failover.

Para obter mais informações, consulte Failover Policy for Failover Cluster Instances.For more information, see Failover Policy for Failover Cluster Instances

Elementos de uma instância de cluster de failoverElements of a Failover Cluster Instance

Uma FCI consiste em um conjunto de servidores físicos (nós) que contêm configuração de hardware semelhante e também configuração de software idêntica, que inclui versão de sistema operacional e nível de patch e versão do SQL ServerSQL Server , nível de patch, componentes e nome de instância.An FCI consists of a set of physical servers (nodes) that contain similar hardware configuration as well as identical software configuration that includes operating system version and patch level, and SQL ServerSQL Server version, patch level, components, and instance name. A configuração de software idêntica é necessária para assegurar que a FCI possa ser completamente funcional porque ocorre o failover entre os nós.Identical software configuration is necessary to ensure that the FCI can be fully functional as it fails over between the nodes.

Grupo de recursos do WSFCWSFC Resource Group
Uma FCI do SQL ServerSQL Server é executada em um grupo de recursos do WSFC.A SQL ServerSQL Server FCI runs in a WSFC resource group. Cada nó no grupo de recursos mantém uma cópia sincronizada dos parâmetros de configuração e chave do Registro como pontos de verificação para assegurar a funcionalidade completa da FCI depois de um failover e somente um dos nós no cluster possui o grupo de recursos de cada vez (o nó ativo).Each node in the resource group maintains a synchronized copy of the configuration settings and check-pointed registry keys to ensure full functionality of the FCI after a failover, and only one of the nodes in the cluster owns the resource group at a time (the active node). O serviço do WSFC gerencia o cluster de servidores, a configuração de quorum, a política de failover e as operações de failover, assim como os endereços de VNN e IP virtuais para a FCI.The WSFC service manages the server cluster, quorum configuration, failover policy, and failover operations, as well as the VNN and virtual IP addresses for the FCI. No caso de uma falha (problemas de hardware, falhas de sistema operacional, aplicativo ou falhas de serviço) ou de uma atualização planejada, a propriedade do grupo de recursos é movida para outro nó na FCI. O número de nós que têm suporte em um grupo de recursos do WSFC depende de sua edição do SQL ServerSQL Server .In case of a failure (hardware failures, operating system failures, application or service failures) or a planned upgrade, the resource group ownership is moved to another node in the FCI.The number of nodes that are supported in a WSFC resource group depends on your SQL ServerSQL Server edition. Além disso, o mesmo cluster do WSFC pode executar várias FCIs (vários grupos de recursos), dependendo de sua capacidade de hardware, como CPUs, memória e número de discos.Also, the same WSFC cluster can run multiple FCIs (multiple resource groups), depending on your hardware capacity, such as CPUs, memory, and number of disks.

Binários do SQL ServerSQL Server Binaries
Os binários de produto são instalados localmente em cada nó da FCI, um processo semelhante a instalações autônomas do SQL ServerSQL Server .The product binaries are installed locally on each node of the FCI, a process similar to SQL ServerSQL Server stand-alone installations. Porém, durante a inicialização, os serviços não são iniciados automaticamente, mas são gerenciados pelo WSFC.However, during startup, the services are not started automatically, but managed by WSFC.

ArmazenamentoStorage
Ao contrário do grupo de disponibilidade, uma FCI deve usar armazenamento compartilhado entre todos os nós da FCI para o armazenamento do banco de dados e do log.Contrary to the availability group, an FCI must use shared storage between all nodes of the FCI for database and log storage. O armazenamento compartilhado pode ser na forma de discos de cluster do WSFC, discos em uma rede SAN, S2D (Espaços de Armazenamento Diretos) ou compartilhamentos de arquivos em um SMB.The shared storage can be in the form of WSFC cluster disks, disks on a SAN, Storage Spaces Direct (S2D), or file shares on an SMB. Deste modo, todos os nós na FCI têm a mesma exibição dos dados de instância sempre que um failover ocorre.This way, all nodes in the FCI have the same view of instance data whenever a failover occurs. No entanto, isto significa que o armazenamento compartilhado tem o potencial de ser o único ponto de falha, e a FCI depende da solução de armazenamento subjacente para assegurar a proteção de dados.This does mean, however, that the shared storage has the potential of being the single point of failure, and FCI depends on the underlying storage solution to ensure data protection.

Nome da redeNetwork Name
O VNN para a FCI fornece um ponto de conexão unificado para a FCI.The VNN for the FCI provides a unified connection point for the FCI. Isto permite que aplicativos conectem-se ao VNN sem a necessidade de conhecer o nó ativo atualmente.This allows applications to connect to the VNN without the need to know the currently active node. Quando um failover ocorre, o VNN é registrado para o novo nó ativo depois de iniciar.When a failover occurs, the VNN is registered to the new active node after it starts. Este processo é transparente ao cliente ou aplicativo que se conecta ao SQL ServerSQL Server e isso minimiza o tempo de inatividade pelo qual passa o aplicativo ou os clientes durante uma falha.This process is transparent to the client or application connecting to SQL ServerSQL Server and this minimize the downtime the application or clients experience during a failure.

IP virtuaisVirtual IPs
No caso de uma FCI de várias sub-redes, um endereço IP virtual é atribuído a cada sub-rede na FCI.In the case of a multi-subnet FCI, a virtual IP address is assigned to each subnet in the FCI. Durante um failover, o VNN no servidor DNS é atualizado para apontar para o endereço IP virtual para a respectiva sub-rede.During a failover, the VNN on the DNS server is updated to point to the virtual IP address for the respective subnet. Aplicativos e clientes podem então se conectar ao FCI usando o mesmo VNN depois de um failover de várias sub-redes.Applications and clients can then connect to the FCI using the same VNN after a multi-subnet failover.

Conceitos e tarefas de failover do SQL ServerSQL Server Failover Concepts and Tasks

Conceitos e tarefasConcepts and Tasks TópicoTopic
Descreve o mecanismo de detecção de falha e a política de failover flexível.Describes the failure detection mechanism and the flexible failover policy. Failover Policy for Failover Cluster InstancesFailover Policy for Failover Cluster Instances
Descreve os conceitos na administração e na manutenção da FCI.Describes concepts in FCI administration and maintenance. Administração e manutenção da instância de cluster de failoverFailover Cluster Instance Administration and Maintenance
Descreve a configuração e os conceitos de várias sub-redesDescribes multi-subnet configuration and concepts Clustering de várias sub-redes do SQL Server (SQL Server)SQL Server Multi-Subnet Clustering (SQL Server)

Tópicos relacionadosRelated Topics

Descrições do tópicoTopic descriptions TópicoTopic
Descreve como instalar uma nova FCI do SQL ServerSQL Server .Describes how to install a new SQL ServerSQL Server FCI. Criar um novo cluster de failover do SQL Server (Instalação)Create a New SQL Server Failover Cluster (Setup)
Descreve como atualizar para um cluster de failover do SQL Server 2017SQL Server 2017 .Describes how to upgrade to a SQL Server 2017SQL Server 2017 failover cluster. Atualizar uma instância de cluster de failover do SQL ServerUpgrade a SQL Server Failover Cluster Instance
Descreve conceitos de clustering de failover do Windows e fornece links para tarefas relativas ao clustering de failover do Windows.Describes Windows Failover Clustering Concepts and provides links to tasks related to Windows Failover Clustering Windows Server 2008Windows Server 2008: Visão geral de clusters de failover: Overview of Failover Clusters

Windows Server 2008Windows Server 2008 R2: Visão geral de clusters de failoverR2: Overview of Failover Clusters
Descreve as distinções em conceitos entre nós em uma FCI e réplicas dentro de um grupo de disponibilidade e considerações para usar uma FCI para hospedar uma réplica para um grupo de disponibilidade.Describes the distinctions in concepts between nodes in an FCI and replicas within an availability group and considerations for using an FCI to host a replica for an availability group. Clustering de failover e Grupos de Disponibilidade (SQL Server)Failover Clustering and Availability Groups (SQL Server)