Instancias de clúster de conmutación por error de AlwaysOn (SQL Server)Always On Failover Cluster Instances (SQL Server)

SE APLICA A: síSQL Server noAzure SQL Database noAzure SQL Data Warehouse noAlmacenamiento de datos paralelos APPLIES TO: yesSQL Server noAzure SQL Database noAzure SQL Data Warehouse noParallel Data Warehouse

Como parte de la oferta de SQL ServerSQL Server Always On, las instancias de clúster de conmutación por error de Always On aprovechan la funcionalidad de Clústeres de conmutación por error de Windows Server (WSFC) para proporcionar alta disponibilidad local mediante la redundancia en el nivel de instancias de servidor, una instancia de clúster de conmutación por error (FCI).As part of the SQL ServerSQL Server Always On offering, Always On Failover Cluster Instances leverages Windows Server Failover Clustering (WSFC) functionality to provide local high availability through redundancy at the server-instance level-a failover cluster instance (FCI). Una FCI es una instancia de SQL ServerSQL Server que se instala a través de los nodos de Clústeres de conmutación por error de Windows Server (WSFC) y, posiblemente, a través de varias subredes.An FCI is a single instance of SQL ServerSQL Server that is installed across Windows Server Failover Clustering (WSFC) nodes and, possibly, across multiple subnets. En la red, una FCI aparece como una instancia de SQL ServerSQL Server que se ejecuta en un equipo individual, pero proporciona la conmutación por error entre nodos de WSFC si el nodo actual deja de estar disponible.On the network, an FCI appears to be an instance of SQL ServerSQL Server running on a single computer, but the FCI provides failover from one WSFC node to another if the current node becomes unavailable.

Una FCI puede aprovechar los Grupos de disponibilidad para proporcionar una recuperación ante desastres remota en el nivel de base de datos.An FCI can leverage Availability Groups to provide remote disaster recovery at the database level. Para obtener más información, consulte Clústeres de conmutación por error y grupos de disponibilidad (SQL Server).For more information, see Failover Clustering and Availability Groups (SQL Server).

Nota

La edición Windows Server 2016 Datacenter introduce compatibilidad con Espacios de almacenamiento directo (S2D).Windows Server 2016 Datacenter edition introduces support for Storage Spaces Direct (S2D). Las instancias de clúster de conmutación por error de SQL Server admiten S2D para recursos de almacenamiento de clúster.SQL Server Failover Cluster Instances support S2D for cluster storage resources. Para obtener más información, consulte Espacios de almacenamiento directo en Windows Server 2016.For more information, see Storage Spaces Direct in Windows Server 2016.

Las instancias de clúster de conmutación por error también admiten volúmenes compartidos en clúster (CSV).Failover Cluster Instances also support Clustered Shared Volumes (CSV). Para obtener más información, vea Descripción de Volúmenes compartidos de clúster en un clúster de conmutación por error.For more information, see Understanding Cluster Shared Volumes in a Failover Cluster.

En este tema:In this Topic:

Ventajas de una instancia de clústeres de conmutación por errorBenefits of a Failover Cluster Instance

Cuando hay un error de hardware o software de un servidor, las aplicaciones o los clientes que se conecten al servidor experimentarán tiempo de inactividad.When there is hardware or software failure of a server, the applications or clients connecting to the server will experience downtime. Cuando una instancia de SQL ServerSQL Server se configura para ser una FCI (en lugar de una instancia independiente), la alta disponibilidad de esa instancia de SQL ServerSQL Server está protegida por la presencia de nodos redundantes en la FCI.When a SQL ServerSQL Server instance is configured to be an FCI (instead of a standalone instance), the high availability of that SQL ServerSQL Server instance is protected by the presence of redundant nodes in the FCI. Solo uno de los nodos de la FCI pertenece al grupo de recursos de WSFC cada vez.Only one of the nodes in the FCI owns the WSFC resource group at a time. En caso de se produzca un error (errores de hardware, errores del sistema operativo o errores de aplicación o servicio) o se realice una actualización planeada, la propiedad del grupo de recursos se mueve a otro nodo de WSFC.In case of a failure (hardware failures, operating system failures, application or service failures), or a planned upgrade, the resource group ownership is moved to another WSFC node. Este proceso es transparente para el cliente o aplicación que se conecta a SQL ServerSQL Server y minimiza el tiempo de inactividad que la aplicación o los clientes experimentan durante un error.This process is transparent to the client or application connecting to SQL ServerSQL Server and this minimize the downtime the application or clients experience during a failure. A continuación se enumeran algunas ventajas clave que las instancias de clúster de conmutación por error de SQL ServerSQL Server proporcionan:The following lists some key benefits that SQL ServerSQL Server failover cluster instances provide:

  • Protección a través de la redundancia en el nivel de instancia.Protection at the instance level through redundancy

  • Conmutación automática por error en caso de error (errores de hardware, errores del sistema operativo, errores de la aplicación o de servicio)Automatic failover in the event of a failure (hardware failures, operating system failures, application or service failures)

    Importante

    En un grupo de disponibilidad, no se admite la conmutación automática por error de una FCI a otros nodos del grupo de disponibilidad.In an availability group, automatic failover from an FCI to other nodes within the availability group is not supported. Esto significa que las FCI y los nodos independientes no deben acoplarse juntos en un grupo de disponibilidad si la conmutación automática por error es un componente importante de la solución de alta disponibilidad.This means that FCIs and standalone nodes should not be coupled together within an availability group if automatic failover is an important component your high availability solution. Sin embargo, este acoplamiento se puede realizar para la solución de recuperación ante desastres .However, this coupling can be made for your disaster recovery solution.

  • Compatibilidad con una amplia matriz de soluciones de almacenamiento, incluidos discos de clúster de WSFC (iSCSI, canal de fibra óptica, etc.) y recursos compartidos de archivos de Bloque de mensajes de servidor (SMB).Support for a broad array of storage solutions, including WSFC cluster disks (iSCSI, Fiber Channel, and so on) and server message block (SMB) file shares.

  • Solución de recuperación ante desastres que usa una FCI de múltiples subredes o que ejecuta una base de datos hospedada por FCI en un grupo de disponibilidad.Disaster recovery solution using a multi-subnet FCI or running an FCI-hosted database inside an availability group. Con la nueva utilidad de múltiples subredes en MicrosoftMicrosoftSQL Server 2012 (11.x)SQL Server 2012 (11.x), una FCI de múltiples subredes ya no necesita una LAN virtual, con lo que aumentan su capacidad de administración y su seguridad.With the new multi-subnet support in MicrosoftMicrosoftSQL Server 2012 (11.x)SQL Server 2012 (11.x), a multi-subnet FCI no longer requires a virtual LAN, increasing the manageability and security of a multi-subnet FCI.

  • Reconfiguración cero de aplicaciones y clientes durante las conmutaciones por errorZero reconfiguration of applications and clients during failovers

  • Directiva de conmutación por error flexible para eventos de desencadenador específicos en conmutaciones automáticas por errorFlexible failover policy for granular trigger events for automatic failovers

  • Conmutaciones por error confiables a través de la detección periódica y detallada del estado mediante el uso de conexiones dedicadas y persistentesReliable failovers through periodic and detailed health detection using dedicated and persisted connections

  • Facilidad de configuración y predicción en el momento de la conmutación por error mediante puntos de comprobación indirectos de antecedentesConfigurability and predictability in failover time through indirect background checkpoints

  • Uso acelerado de recursos durante las conmutaciones por errorThrottled resource usage during failovers

RecomendacionesRecommendations

En un entorno de producción, recomendamos que use direcciones IP estáticas junto con la dirección IP virtual de una instancia de clúster de conmutación por error.In a production environment, we recommend that you use static IP addresses in conjunction the virtual IP address of a Failover Cluster Instance. Recomendamos no usar DHCP en un entorno de producción.We recommend against using DHCP in a production environment. En caso de tiempo de inactividad, si expira el tiempo de concesión de la dirección de IP de DHCP, se necesitará un tiempo adicional para volver a registrar la nueva dirección IP de DHCP asociada al nombre DNS.In the event of down time, if the DHCP IP lease expires, extra time is required to re-register the new DHCP IP address associated with the DNS name.

Información general de las instancias de clúster de conmutación por errorFailover Cluster Instance Overview

Una FCI se ejecuta en un grupo de recursos de WSFC con uno o más nodos de WSFC.An FCI runs in a WSFC resource group with one or more WSFC nodes. Cuando la FCI se inicia, uno de los nodos asume la propiedad del grupo de recursos y pone en línea la instancia de SQL ServerSQL Server .When the FCI starts up, one of the nodes assume ownership of the resource group and brings its SQL ServerSQL Server instance online. Entre los recursos que pertenecen a este nodo se incluyen:The resources owned by this node include:

  • Nombre de redNetwork name

  • Dirección IPIP address

  • Discos compartidosShared disks

  • SQL ServerSQL Server Servicio Motor de base de datosDatabase Engine service

  • SQL ServerSQL Server Servicio del AgenteAgent service

  • SQL ServerSQL Server Analysis Services, si está instaladoAnalysis Services service, if installed

  • Un recurso compartido de archivos, si está instalada la característica FILESTREAMOne file share resource, if the FILESTREAM feature is installed

En cualquier momento, solo el propietario del grupo de recursos (y ningún otro nodo de la FCI) ejecuta sus servicios de SQL ServerSQL Server respectivos en el grupo de recursos.At any time, only the resource group owner (and no other node in the FCI) is running its respective SQL ServerSQL Server services in the resource group. Cuando se produce una conmutación por error, ya sea automática o planeada, tiene lugar la siguiente secuencia de eventos:When a failover occurs, whether it be an automatic failover or a planned failover, the following sequence of events happen:

  1. A menos que se produzca un error hardware o del sistema, todas las páginas desfasadas de la memoria caché del búfer se escriben en el disco.Unless a hardware or system failure occurs, all dirty pages in the buffer cache are written to disk.

  2. Todos los servicios de SQL ServerSQL Server respectivos del grupo de recursos se detienen en el nodo activo.All respective SQL ServerSQL Server services in the resource group are stopped on the active node.

  3. La propiedad del grupo de recursos se transfiere a otro nodo de la FCI.The resource group ownership is transferred to another node in the FCI.

  4. El nuevo propietario del grupo de recursos inicia los servicios de SQL ServerSQL Server .The new resource group owner starts its SQL ServerSQL Server services.

  5. Las solicitudes de conexión de la aplicación cliente se dirigen automáticamente al nuevo nodo activo utilizando el mismo nombre de red virtual (VNN).Client application connection requests are automatically directed to the new active node using the same virtual network name (VNN).

La FCI está en línea mientras el estado del quórum del clúster de WSFC subyacente sea bueno (la mayoría de los nodos de WSFC de quórum están disponibles como destinos de conmutación automática por error).The FCI is online as long as its underlying WSFC cluster is in good quorum health (the majority of the quorum WSFC nodes are available as automatic failover targets). Si el clúster de WSFC pierde su quórum, a causa de un error de hardware, de software o de red, o de una configuración de quórum incorrecta, todo el clúster de WSFC, junto con la FCI, se ponen en estado sin conexión.When the WSFC cluster loses its quorum, whether due to hardware, software, network failure, or improper quorum configuration, the entire WSFC cluster, along with the FCI, is brought offline. En este escenario de conmutación por error no planeada se requiere la intervención manual para restablecer el quórum en los nodos disponibles restantes con el fin de volver a poner en línea el clúster de WSFC y la FCI.Manual intervention is then required in this unplanned failover scenario to reestablish quorum in the remaining available nodes in order to bring the WSFC cluster and FCI back online. Para obtener más información, vea Configuración de los votos y modos de cuórum WSFC (SQL Server).For more information, see WSFC Quorum Modes and Voting Configuration (SQL Server).

Tiempo de conmutación por error previsiblePredictable Failover Time

Dependiendo de cuándo la instancia de SQL ServerSQL Server haya realizado por última vez una operación de punto de comprobación, puede haber una cantidad considerable de páginas desfasadas en la memoria caché del búfer.Depending on when your SQL ServerSQL Server instance last performed a checkpoint operation, there can be a substantial amount of dirty pages in the buffer cache. Por tanto, las conmutaciones por error duran el tiempo que lleve escribir las páginas desfasadas restantes en el disco, lo que puede dar lugar a un tiempo de conmutación por error prolongado e imprevisible.Consequently, failovers last as long as it takes to write the remaining dirty pages to disk, which can lead to long and unpredictable failover time. A partir de MicrosoftMicrosoftSQL Server 2012 (11.x)SQL Server 2012 (11.x), la FCI puede usar puntos de comprobación indirectos para limitar la cantidad de páginas desfasadas que se mantienen en la memoria caché del búfer.Beginning with MicrosoftMicrosoftSQL Server 2012 (11.x)SQL Server 2012 (11.x), the FCI can use indirect checkpoints to throttle the amount of dirty pages kept in the buffer cache. Cuando este proceso utiliza recursos adicionales en una carga de trabajo normal, el tiempo de conmutación por error se hace más fácil de predecir y de configurar.While this does consume additional resources under regular workload, it makes the failover time more predictable as well as more configurable. Esto es muy útil cuando el acuerdo de servicio en su organización especifica el objetivo de tiempo de recuperación (RTO) para su solución de alta disponibilidad.This is very useful when the service-level agreement in your organization specifies the recovery time objective (RTO) for your high availability solution. Para obtener más información sobre puntos de comprobación indirectos, vea Indirect Checkpoints.For more information on indirect checkpoints, see Indirect Checkpoints.

Supervisión de estado confiable y directiva de conmutación por error flexibleReliable Health Monitoring and Flexible Failover Policy

Después de que la FCI se inicie correctamente, el servicio de WSFC supervisa el estado del clúster de WSFC subyacente y el estado de la instancia de SQL ServerSQL Server .After the FCI starts successfully, the WSFC service monitors both the health of the underlying WSFC cluster, as well as the health of the SQL ServerSQL Server instance. A partir de MicrosoftMicrosoftSQL Server 2012 (11.x)SQL Server 2012 (11.x), el servicio de WSFC utiliza una conexión dedicada para sondear la instancia de SQL ServerSQL Server activa a efectos de diagnósticos de componentes detallados mediante un procedimiento almacenado del sistema.Beginning with MicrosoftMicrosoftSQL Server 2012 (11.x)SQL Server 2012 (11.x), the WSFC service uses a dedicated connection to poll the active SQL ServerSQL Server instance for detailed component diagnostics through a system stored procedure. Esto tiene una triple implicación:The implication of this is three-fold:

  • La conexión dedicada con la instancia de SQL ServerSQL Server permite un sondeo confiable a efectos de diagnósticos de componentes en todo momento, aunque la carga de la FCI sea elevada.The dedicated connection to the SQL ServerSQL Server instance makes it possible to reliably poll for component diagnostics all the time, even when the FCI is under heavy load. Esto permite distinguir entre un sistema sometido a una carga elevada y un sistema que tenga realmente condiciones de error, lo que evita problemas tales como conmutaciones por error falsas.This makes it possible to distinguish between a system that is under heavy load and a system that actually has failure conditions, thus preventing issues such as false failovers.

  • Los diagnósticos de componentes detallados permiten configurar una directiva de conmutación por error más flexible, en la que se puede elegir qué condiciones de error activan las conmutaciones por error y cuáles no.The detailed component diagnostics makes it possible to configure a more flexible failover policy, whereby you can choose what failure conditions trigger failovers and which failure conditions do not.

  • Los diagnósticos de componentes detallados también permiten una mejor solución de problemas de conmutaciones automáticas por error con carácter retroactivo.The detailed component diagnostics also enables better troubleshooting of automatic failovers retroactively. La información de diagnóstico se almacena los archivos de registro, que se colocan con los registros de errores de SQL ServerSQL Server .The diagnostic information is stored to log files, which are collocated with the SQL ServerSQL Server error logs. Puede cargarlos en el Visor de archivos de registro para inspeccionar los estados de los componentes que dan lugar a la conmutación por error para determinar la causa de dicha conmutación por error.You can load them into the Log File Viewer to inspect the component states leading up to the failover occurrence in order to determine what cause that failover.

Para obtener más información, vea Failover Policy for Failover Cluster Instances.For more information, see Failover Policy for Failover Cluster Instances

Elementos de una instancia de clúster de conmutación por errorElements of a Failover Cluster Instance

Una FCI consta de un conjunto de servidores físicos (nodos) que contienen una configuración de hardware similar y una configuración de software idéntica que incluye la versión y el nivel de revisión del sistema operativo, así como la versión, el nivel de revisión, los componentes y el nombre de instancia de SQL ServerSQL Server .An FCI consists of a set of physical servers (nodes) that contain similar hardware configuration as well as identical software configuration that includes operating system version and patch level, and SQL ServerSQL Server version, patch level, components, and instance name. Es necesaria una configuración de software idéntica para garantizar que la FCI pueda estar totalmente funcional cuando realice la conmutación por error entre los nodos.Identical software configuration is necessary to ensure that the FCI can be fully functional as it fails over between the nodes.

Grupo de recursos de WSFCWSFC Resource Group
Una FCI de SQL ServerSQL Server se ejecuta en un grupo de recursos de WSFC.A SQL ServerSQL Server FCI runs in a WSFC resource group. Cada nodo del grupo de recursos conserva una copia sincronizada de los valores de configuración y las claves del Registro con punto de comprobación para garantizar la funcionalidad total de la FCI después de una conmutación por error, y solo uno de los nodos del clúster pertenece al grupo de recursos cada vez (el nodo activo).Each node in the resource group maintains a synchronized copy of the configuration settings and check-pointed registry keys to ensure full functionality of the FCI after a failover, and only one of the nodes in the cluster owns the resource group at a time (the active node). El servicio de WSFC administra el clúster de servidores, la configuración de quórum, la directiva de conmutación por error y las operaciones de conmutación por error, así como el VNN y las direcciones IP virtuales para la FCI.The WSFC service manages the server cluster, quorum configuration, failover policy, and failover operations, as well as the VNN and virtual IP addresses for the FCI. En caso de que se produzca un error (errores de hardware, errores del sistema operativo o errores de aplicación o de servicio) o se realice una actualización planeada, la propiedad del grupo de recursos se mueve a otro nodo de la FCI. El número de nodos que se admiten en un grupo de recursos de WSFC depende de la edición de SQL ServerSQL Server .In case of a failure (hardware failures, operating system failures, application or service failures) or a planned upgrade, the resource group ownership is moved to another node in the FCI.The number of nodes that are supported in a WSFC resource group depends on your SQL ServerSQL Server edition. Además, el mismo clúster de WSFC puede ejecutar varias FCI (varios grupos de recursos), dependiendo de la capacidad de hardware, como número de CPUs, memoria y número de discos.Also, the same WSFC cluster can run multiple FCIs (multiple resource groups), depending on your hardware capacity, such as CPUs, memory, and number of disks.

Binarios de SQL ServerSQL Server Binaries
Los archivos binarios del producto se instalan localmente en cada nodo de la FCI; es un proceso similar a las instalaciones independientes de SQL ServerSQL Server .The product binaries are installed locally on each node of the FCI, a process similar to SQL ServerSQL Server stand-alone installations. Sin embargo, durante el inicio, los servicios no se inician automáticamente sino que son administrados por WSFC.However, during startup, the services are not started automatically, but managed by WSFC.

StorageStorage
Al contrario que en el grupo de disponibilidad, una FCI debe usar el almacenamiento compartido entre todos los nodos de la FCI para el almacenamiento de la base de datos y del registro.Contrary to the availability group, an FCI must use shared storage between all nodes of the FCI for database and log storage. El almacenamiento compartido puede realizarse en forma de discos de clúster de WSFC, discos de una SAN, Espacios de almacenamiento directo (S2D) o recursos compartidos de archivos en un SMB.The shared storage can be in the form of WSFC cluster disks, disks on a SAN, Storage Spaces Direct (S2D), or file shares on an SMB. De esta manera, todos los nodos de la FCI tienen la misma vista de datos de instancia cada vez que se produce una conmutación por error.This way, all nodes in the FCI have the same view of instance data whenever a failover occurs. Sin embargo, esto significa que el almacenamiento compartido tiene la posibilidad de ser el punto de error único y la FCI depende de la solución de almacenamiento subyacente para garantizar la protección de datos.This does mean, however, that the shared storage has the potential of being the single point of failure, and FCI depends on the underlying storage solution to ensure data protection.

Nombre de redNetwork Name
La VNN para la FCI proporciona un punto de conexión unificado para la FCI.The VNN for the FCI provides a unified connection point for the FCI. Esto permite que las aplicaciones se conecten a la VNN sin necesidad de conocer el nodo actualmente activo.This allows applications to connect to the VNN without the need to know the currently active node. Cuando se produce una conmutación por error, la VNN se registra en el nuevo nodo activo después de iniciarse.When a failover occurs, the VNN is registered to the new active node after it starts. Este proceso es transparente para el cliente o aplicación que se conecta a SQL ServerSQL Server y minimiza el tiempo de inactividad que la aplicación o los clientes experimentan durante un error.This process is transparent to the client or application connecting to SQL ServerSQL Server and this minimize the downtime the application or clients experience during a failure.

Direcciones IP virtualesVirtual IPs
En el caso de una FCI de múltiples subredes, se asigna una dirección IP virtual a cada subred de la FCI.In the case of a multi-subnet FCI, a virtual IP address is assigned to each subnet in the FCI. Durante una conmutación por error, la VNN en el servidor DNS se actualiza para señalar a la dirección IP virtual correspondiente a la subred respectiva.During a failover, the VNN on the DNS server is updated to point to the virtual IP address for the respective subnet. Las aplicaciones y los clientes pueden conectarse entonces a la FCI utilizando la misma VNN después de una conmutación por error de múltiples subredes.Applications and clients can then connect to the FCI using the same VNN after a multi-subnet failover.

Conceptos y tareas de conmutación por error de SQL ServerSQL Server Failover Concepts and Tasks

Conceptos y tareasConcepts and Tasks TemaTopic
Describe el mecanismo de detección de errores y la directiva de conmutación por error flexible.Describes the failure detection mechanism and the flexible failover policy. Failover Policy for Failover Cluster InstancesFailover Policy for Failover Cluster Instances
Describe los conceptos de la administración y el mantenimiento de la FCI.Describes concepts in FCI administration and maintenance. Administración y mantenimiento de la instancia de clúster de conmutación por errorFailover Cluster Instance Administration and Maintenance
Describe la configuración y conceptos de varias subredesDescribes multi-subnet configuration and concepts Agrupación en clústeres de varias subredes de SQL Server (SQL Server)SQL Server Multi-Subnet Clustering (SQL Server)

Temas relacionadosRelated Topics

Descripciones del temaTopic descriptions TemaTopic
Describe cómo instalar una nueva FCI de SQL ServerSQL Server .Describes how to install a new SQL ServerSQL Server FCI. Crear un nuevo clúster de conmutación por error de SQL Server (programa de instalación)Create a New SQL Server Failover Cluster (Setup)
Describe cómo actualizarse a un clúster de conmutación por error de SQL Server 2017SQL Server 2017 .Describes how to upgrade to a SQL Server 2017SQL Server 2017 failover cluster. Actualización de una instancia de clúster de conmutación por error de SQL ServerUpgrade a SQL Server Failover Cluster Instance
Describe los conceptos de clúster de conmutación por error de Windows y proporciona vínculos a las tareas relacionadas con el clúster de conmutación por error de WindowsDescribes Windows Failover Clustering Concepts and provides links to tasks related to Windows Failover Clustering Windows Server 2008Windows Server 2008: Información general de los clústeres de conmutación por error: Overview of Failover Clusters

Windows Server 2008Windows Server 2008 R2: Información general de los clústeres de conmutación por errorR2: Overview of Failover Clusters
Describe las distinciones de conceptos entre nodos de una FCI y réplicas de un grupo de disponibilidad y las consideraciones para utilizar una FCI de modo que hospede una réplica para un grupo de disponibilidad.Describes the distinctions in concepts between nodes in an FCI and replicas within an availability group and considerations for using an FCI to host a replica for an availability group. Clústeres de conmutación por error y grupos de disponibilidad (SQL Server)Failover Clustering and Availability Groups (SQL Server)