Crear una estrategia y arquitectura de alta disponibilidad para SharePoint ServerCreate a high availability architecture and strategy for SharePoint Server

Resumen: obtenga información sobre cómo combinar la arquitectura de la granja de servidores y la tecnología para crear un entorno de alta disponibilidad en una sola granja de servidores de SharePoint Server 2016 y SharePoint 2013.Summary: Learn how to combine farm architecture and technology to create a highly available environment in a single SharePoint Server 2016 and SharePoint 2013 farm.

Una estrategia de alta disponibilidad es un requisito importante para un entorno SharePoint Server de producción. Una estrategia de un extremo a otro incluye los procesos operativos, la gobernanza de la plataforma, la arquitectura y las soluciones técnicas. Este artículo se centra en los aspectos arquitectónicos y técnicos de alta disponibilidad. En la guía se explican los elementos de diseño específicos de SharePoint y las opciones técnicas que determinarán la estrategia de alta disponibilidad.A high-availability strategy is an important requirement for a production SharePoint Server environment. An end-to-end strategy includes operational processes, platform governance, architecture, and technical solutions. This article focuses on the architectural and technical aspects of high availability. The guidance explains specific SharePoint design elements and the technical options that will determine your strategy for high availability.

Nota

La alta disponibilidad y la recuperación ante desastres no son lo mismo. Aunque existe un solapamiento en la planeación y las soluciones, son subconjuntos de continuidad empresarial. El objetivo de la alta disponibilidad es proporcionar resistencia dentro del centro de datos principal y tiempos de inactividad planeados. El objetivo de la recuperación ante desastres es permitir a una organización reanudar sus operaciones informáticas en un centro de datos secundario cuando se produce un desastre en el centro de datos principal a causa del cual la infraestructura queda inutilizable. Para más información sobre la recuperación ante desastres para SharePoint Server, vea Seleccionar una estrategia de recuperación ante desastres para SharePoint Server.High availability and disaster recovery are not the same things. Although there is overlap in planning and solutions, they are subsets of business continuity. The purpose of high availability is to provide resiliency within the primary data center and planned downtime. The purpose of disaster recovery is to enable an organization to resume computer operations in a secondary data center when a disaster at the primary data center makes the infrastructure unusable. For information about disaster recovery for SharePoint Server, see Choose a disaster recovery strategy for SharePoint Server.

La alta disponibilidad se usa normalmente para describir la capacidad de un sistema de seguir funcionando y proporcionando recursos a sus usuarios cuando se produce un error en una o varias de las siguientes categorías en un dominio de errores: hardware, software o aplicación. El nivel de disponibilidad se expresa como medida del porcentaje de tiempo que un sistema está operativo de manera continuada para admitir funciones empresariales. El nivel requerido de disponibilidad varía entre las organizaciones. Aunque este requisito también puede variar entre unidades de negocio, un contrato de nivel de servicio es para toda la organización como una sola unidad. Desde el punto de vista de los usuarios, una granja de servidores de SharePoint está disponible cuando los usuarios pueden acceder a la granja de servidores y usar las características y los servicios que necesitan para realizar su trabajo.High availability is generally used to describe the ability of a system to continue operating and provide resources to its users when a failure occurs in one or more of the following categories in a fault domain: hardware, software, or application. The level of availability is expressed as a measure of the percentage of time that a system is continuously operational to support business functions. The required level of availability varies among organizations. Although this requirement may also vary among business units, a service level agreement is for the organization as a whole. From the perspective of users, a Sharepoint farm is available when users can access the farm and use the features and services that they must have to do their work.

Una granja de servidores SharePoint de alta disponibilidad tiene los siguientes objetivos y características:A highly available SharePoint farm has the following goals and characteristics:

  • El diseño de la granja de servidores reduce los puntos de error potenciales. Puesto que es improbable que se puedan eliminar todos los puntos de error, la estrategia general debe abarcar cómo se debe responder en el evento de un error.The farm design reduces potential points of failure. Because it is improbable that you can eliminate all failure points, the overall strategy must address how to respond to a failure event.

  • Los eventos de conmutación por error son ininterrumpidos y tienen un efecto mínimo en las actividades del usuario.Failover events are seamless and have minimal effect on user activities.

  • La granja de servidores continúa funcionando a una capacidad reducida en lugar de fallar completamente.The farm continues to operate at reduced capacity instead of failing completely.

  • La granja de servidores es resistente. Los incidentes que afectan al servicio ocurren con poca frecuencia y, en caso de hacerlo, se llevan a cabo las acciones necesarias de forma puntual y eficaz.The farm is resilient. Incidents affecting service occur infrequently, and timely and effective action is taken when they do occur.

IntroducciónIntroduction

Antes de crear una arquitectura y estrategia realística y económica de alta disponibilidad para el entorno SharePoint, se deben definir y cuantificar los objetivos de disponibilidad. Estos objetivos reflejan en qué medida la organización depende de SharePoint Server y cómo una pérdida del servicio afectaría a las operaciones de la organización. El efecto de la pérdida del servicio depende de la naturaleza de la pérdida (total o parcial), así como de la duración de la misma.Before you can create a realistic and economical high-availability architecture and strategy for your SharePoint environment, you have to define and quantify your availability goals. These goals reflect the extent to which your organization depends on SharePoint Server and how a loss of service might affect the organization's operations. The effect of the loss of service depends on the nature of the loss (full or partial) and the duration of the loss.

Una estrategia de alta disponibilidad adecuada debe reflejar las necesidades específicas de la organización. Además, debe proporcionar un equilibrio óptimo entre los requisitos del negocio, los contratos de nivel de servicio de TI y la disponibilidad de soluciones técnicas, capacidades de soporte de TI y costes de infraestructura.A successful high-availability strategy must reflect the specific needs of your organization. Additionally, it must provide an optimal balance between business requirements, IT service level agreements (SLAs), and the availability of technical solutions, IT support capabilities, and infrastructure costs.

Una vez identificados los requisitos de disponibilidad de la organización, se puede empezar a crear un diseño y una estrategia de alta disponibilidad para reducir el riesgo de tiempos de inactividad y reducción de las operaciones. Los profesionales de TI que diseñan e implementan sistemas altamente disponibles usan los siguientes principios como guía para cumplir sus objetivos:After identifying availability requirements for your organization, you can begin to create a high-availability design and a strategy that reduces the risk of downtime and reduced operations. IT professionals who design and deploy highly available systems use the following guiding principles to meet their goals:

  • Eliminar los puntos de error individuales para cada dominio de error y para todo el sistema en cada nivel posible (sistema operativo, software y aplicación SharePoint).Eliminate single points of failure for each fault domain and the entire system at every possible layer (the operating system, software and the SharePoint application).

  • Implementar sistemas muy rápidos de detección, aislamiento y resolución.Implement very rapid fault detection, isolation, and resolution.

Las soluciones de alta disponibilidad son de ámbito amplio y proporcionan un conjunto de recursos compartidos en todo el sistema que se integran para proporcionar los servicios necesarios predefinidos. La solución usa diferentes combinaciones de hardware y software para minimizar el tiempo de inactividad y restaurar los servicios cuando el sistema o parte del sistema falla.High availability solutions are broad in scope and provide a set of system-wide, shared resources that are integrated to provide predefined required services. The solution uses different combinations of hardware and software to minimize downtime and restore services when the system or part of the system fails.

Una solución de tolerancia a errores se centra en el hardware y usa hardware especializado para detectar errores y conmutar de forma instantánea a un componente de hardware redundante. Este componente puede ser un procesador, una tarjeta de memoria, un sistema de alimentación, un subsistema E/S o un subsistema de almacenamiento. El conmutador a un componente redundante proporciona un alto nivel de servicio.A fault-tolerant solution is hardware-centric and uses specialized hardware to detect faults and instantly switch to a redundant hardware component. This component can be a processor, memory board, power supply, I/O subsystem, or storage subsystem. The switch to a redundant component provides a high level of service.

Un análisis de costos y beneficios de las soluciones de tolerancia a errores y de las soluciones de alta disponibilidad permite a las organizaciones crear una estrategia efectiva para cumplir los objetivos de disponibilidad de su granja de servidores SharePoint. Normalmente existen desventajas de costes entre ambas soluciones.A cost-benefits analysis of fault-tolerant solutions and high availability solutions enables organizations to create an effective strategy to meet the availability goals for their SharePoint farm. Typically there are cost tradeoffs between the two solutions.

Un proceso que implemente la alta disponibilidad es una de las inversiones más caras para una granja de servidores SharePoint. A medida que aumenta el nivel de disponibilidad y el número de sistemas que se desean hacer altamente disponibles, también aumenta la complejidad y el coste de una solución de disponibilidad.A process that implements high availability is one of the more expensive investments for a SharePoint farm. As the level of availability and the number of systems that you want to make highly available increases, complexity and cost of an availability solution also increases.

Los avances en la tecnología de virtualización permiten a las organizaciones usar equipos virtuales como repuestos fríos, templados o calientes. Los equipos virtuales pueden ser adecuados para proporcionar la misma funcionalidad. La virtualización puede proporcionar flexibilidad y rentabilidad. Sin embargo, debe verificarse que un equipo virtual tiene la capacidad para tratar la misma carga que el equipo físico al que va a reemplazar.Advances in virtualization technology enable organizations to use virtual computers as hot, warm, or cold spares. Virtual computers may be suitable to provide the same functionality. Virtualization can provide flexibility and cost efficiency. However, you must verify that a virtual machine has the capacity to handle the load of the physical computer that it will replace.

Creación de una arquitectura de granja que admita la alta disponibilidadCreate a farm architecture that supports high availability

En la siguiente ilustración se muestra cómo distribuir y configurar diferentes partes de un entorno SharePoint para aumentar la disponibilidad en una granja de servidores. Este ejemplo también muestra cómo la redundancia permite solucionar dominios de error.The following illustration shows how you can distribute and configure different parts of a SharePoint environment to increase availability across a farm. This example also shows how redundancy can address fault domains.

Nota

El ejemplo no es completo. Por ejemplo, no muestra todos los dominios de error ni todo el hardware de tolerancia a errores.Our example is not comprehensive. For example it does not show all the fault domains and fault-tolerant hardware.

Ejemplos de redundancia en una topología de granja para tratar puntos de errorExamples of redundancy in a farm topology to address points of failure

Un ejemplo de granja en el que se muestra cómo los roles y servicios redundantes se usan para resolver puntos únicos de errores. En la siguiente lista encontrará más detalles.

Con referencia a la topología de la ilustración anterior, tenga en cuenta lo siguiente:Referring to the topology in the previous illustration, note the following:

  • Los servidores de la granja de este ejemplo pueden ser equipos físicos o máquinas virtuales que se implementan en servidores host Hyper-V. El principio de identificación y respuesta a puntos de error se aplica a ambos tipos de entorno.The farm servers in this example can be physical computers or virtual machines that are deployed on Hyper-V host servers. The principle of identifying and responding to points of failure applies to both types of environment.

  • Cuatro servidores (W1-W4) se dedican a servir contenido y esta redundancia incrementa la disponibilidad si se produce un error en uno o varios servidores. Este nivel de redundancia también permite a la granja de servidores continuar con las operaciones mientras se aplican actualizaciones de software.Four servers (W1-W4) are dedicated to serving content and this redundancy increases availability if a failure occurs in one or more servers. This level of redundancy also enables the farm to continue operations when software updates are applied.

  • Cuatro servidores de aplicaciones (A1-A4) incrementan la disponibilidad para los servicios de la granja de servidores y componentes de aplicación específicos, como la búsqueda. La búsqueda de roles y componentes es redundante.Four application servers (A1-A4) increase availability for farm services and specific application components such as search. Search roles and components are redundant.

  • Los servidores de bases de datos de la granja son redundantes y la alta disponibilidad de las bases de datos se puede lograr mediante la creación de reflejo de bases de datos y la agrupación en clústeres.The farm database servers are redundant and database high availability can be achieved by using database mirroring or clustering.

  • En un entorno virtual, las máquinas virtuales se colocan en servidores host Hyper-V independientes para eliminar un único punto de error. Este enfoque para la colocación de las máquinas virtuales sigue las instrucciones de prácticas recomendadas para la disponibilidad y el rendimiento.In a virtual environment the virtual machines are put on separate Hyper-V host servers to eliminate a single point of failure. This approach to virtual machine placement follows best practice guidelines for availability and performance.

  • El servidor de bases de datos principal (con la etiqueta 1) y el bastidor 2 (con la etiqueta 2), que contiene dos de los equipos host de virtualización, se identifican como dominios de error para mostrar cómo la granja de servidores y la infraestructura se pueden visualizar como una colección de dominios de error. Esto muestra cómo se puede realizar un análisis detallado del entorno para desarrollar una estrategia global y un análisis de costes y beneficios.The primary database server (labeled 1) and Rack 2 (labeled 2), that contains two of the virtualization host computers, are identified as fault domains to show how your farm and infrastructure can be viewed as a collection of fault domains. This shows how you can do an in-depth analysis of your environment to develop an overall strategy and cost benefit analysis.

Otros roles y servicios de la granja de servidoresOther farm roles and services

Nuestro ejemplo no incluye todos los roles, servicios y aplicaciones de servicios que se pueden ejecutar en una granja de servidores SharePoint concreta. No se puede usar un enfoque genérico de alta disponibilidad para todo en una granja de servidores de SharePoint. A continuación se enumeran algunas exclusiones importantes a la hora de usar un enfoque estándar de alta disponibilidad:Our example does not include all the roles, services, and service applications that might be running in a specific SharePoint farm. You cannot use a generic approach to high availability for everything in a SharePoint farm. Some important exclusions to using a standard approach to high availability are as follows:

Uso de la tolerancia de errores en la solución de alta disponibilidadUse fault tolerance in your high availability solution

Después de diseñar una arquitectura que soporta roles y cargas de trabajo de alta disponibilidad, se pueden usar componentes de tolerancia a errores para incrementar la disponibilidad. Las soluciones de tolerancia a errores están disponibles en la infraestructura, que incluye las bases de datos.After you design an architecture that supports highly available roles and workloads, you can use fault-tolerant components to increase availability. Fault tolerant solutions are available across the infrastructure, which includes the databases.

Una infraestructura de tolerancia a erroresA fault-tolerant infrastructure

La tolerancia a errores es altamente disponible para casi cualquier componente de hardware de la infraestructura de una granja de servidores SharePoint. Como parte del diseño de alta disponibilidad, se deben determinar las partes de la infraestructura que debe tener tolerancia a errores desde un punto de vista operativo y de costes. Aunque se pueden hacer cada parte tolerante a errores, no significa que tenga que hacerse.Fault tolerance is readily available for almost every hardware component in the infrastructure of a SharePoint farm. As part of your high availability design, determine the parts of the infrastructure that should be fault-tolerant from an operational and cost perspective. Just because you can make every part of the infrastructure fault-tolerant doesn't mean that you should.

Servidores de bases de datos y bases de datos de tolerancia a erroresFault tolerant database servers and databases

Puesto que la plataforma de SharePoint y las cargas de trabajo de su aplicación dependen de la disponibilidad y confiabilidad de todas las bases de datos de SharePoint, las bases de datos de alta disponibilidad son un aspecto extremadamente importante de la estrategia de alta disponibilidad. Puede usar las siguientes características como soluciones de tolerancia a errores para servidores de bases de datos y bases de datos de SharePoint:Because the SharePoint platform and its application workloads depend on the availability and reliability of all the SharePoint databases, highly available databases are an extremely important aspect of your high availability strategy. You can use the following features as fault-tolerant solutions for SharePoint database servers and databases:

  • Clústeres de conmutación por error de SQL Server (instancias de clúster de conmutación por error [FCI] AlwaysOn en SQL Server 2014 con el Service Pack 1 [SP1]) y SQL Server 2012SQL Server failover clustering (AlwaysOn Failover Cluster Instances (FCI) in SQL Server 2014 with Service Pack 1 (SP1)) and SQL Server 2012

  • Grupos de disponibilidad AlwaysOnAlwaysOn Availability Groups

  • Reflejo de base de datos SQL Server de alta disponibilidadSQL Server high-availability database mirroring

Acerca de las instancias de clúster de conmutación por error AlwaysOn y de grupos de disponibilidad AlwaysOnAbout AlwaysOn Failover Cluster Instances and AlwaysOn Availability Groups

Un clúster de conmutación por error necesita un almacenamiento en disco compartido entre dos equipos. En una configuración de dos nodos, los equipos se configuran como activos o pasivos, lo que proporciona una instancia del nodo principal totalmente redundante. El nodo pasivo solo pasa a estar en línea si el nodo principal produce errores. El disco compartido solo se presenta en un equipo a la vez. Esta configuración normalmente necesita la mayor cantidad de hardware adicional. En SQL Server 2014 (SP1) y SQL Server 2012, este tipo de configuración de clúster es una instancia de clúster de conmutación por error AlwaysOn y es una forma específica de instalar SQL Server. Debido a los requisitos de configuración, no se puede cambiar fácilmente una instalación estándar de SQL Server a una instancia de clúster de conmutación por error.A failover cluster requires shared disk storage between two computers. In a two node configuration, the computers are configured as active/passive which provides a fully redundant instance of the primary node. The passive node is only brought online when the primary node fails. The shared disk is only presented to one computer at a time. This configuration typically requires the most additional hardware. In SQL Server 2014 (SP1) and SQL Server 2012, this type of cluster configuration is an AlwaysOn Failover Cluster Instance, and it is a specific way to install SQL Server. Because of the configuration requirements, you cannot take a standard SQL Server installation and easily change it to a Failover Cluster Instance.

Un grupo de disponibilidad AlwaysOn es una tecnología diferente en SQL Server 2014 (SP1) y SQL Server 2012 (podría considerarse un descendiente de la creación de reflejo de la base de datos) que usa algunas características expuestas por clústeres de Windows. Pero no necesita almacenamiento de disco compartido, ni es necesario que los equipos de un grupo de disponibilidad tengan instalada una configuración especializada de SQL Server. Después de agregar un servidor de bases de datos a un clúster de Windows, es bastante fácil habilitar grupos de disponibilidad AlwaysOn y, después, configurar el grupo de disponibilidad que quiera.An AlwaysOn Availability Group is a different technology in SQL Server 2014 (SP1) and SQL Server 2012 (think of it as a descendant of Database Mirroring) that uses some features exposed by Windows Clustering. However, it does not require shared disk storage, and the computers in an availability group do not have to have a specialized configuration of SQL Server installed on them. After a database server is added to a Windows Cluster, it is fairly easy to enable AlwaysOn Availability Groups and then configure the availability group that you want.

En resumen, cualquier servidor que ejecute SQL Server 2014 (SP1) y SQL Server 2012 Enterprise Edition puede usar grupos de disponibilidad AlwaysOn si se une a un clúster y se configura el grupo de disponibilidad. Los clústeres de conmutación por error AlwaysOn necesitan hardware y pasos de configuración especiales para configurar las instancias de clúster de conmutación por error. Cada una de estas tecnologías se usa para entornos específicos y ambas son competidores complementarios. Para obtener más información sobre estas características, vea Soluciones de alta disponibilidad (SQL Server). Para obtener ayuda para decidir la tecnología de disponibilidad de SQL Server que usar, vea Seleccionar una tecnología de disponibilidad de SQL Server.In summary, any server that runs SQL Server 2014 (SP1) and SQL Server 2012 Enterprise Edition can use AlwaysOn Availability Groups by joining a cluster and configuring the availability group. AlwaysOn failover clusters require special hardware and configuration steps to set up Failover Cluster Instances. Each of these technologies has its use for specific environments, and both are complimentary competitors. For more information about these features, see High Availability Solutions (SQL Server). For help deciding which SQL Server availability technology to use, see Choosing a SQL Server Availability Technology.

Importante

Puesto que cada opción de alta disponibilidad de SQL Server tiene sus propias características, ventajas y desventajas, un opción no es necesariamente mejor que la otra. Por ejemplo, en el caso de un escenario que usa grupo de disponibilidad AlwaysOn, puede ser mejor minimizar la pérdida de datos que ganar el rendimiento que logran las instancias de clústeres de conmutación por error AlwaysOn. Se debe elegir una solución de alta disponibilidad en función de las necesidades empresariales y de los requisitos de la infraestructura de TI.Because each SQL Server high availability option has its own features, strengths, and weaknesses, one option is not necessarily better than another. For example, in a given scenario that uses AlwaysOn Availability Groups, minimizing data lose might be better than any performance gain that AlwaysOn Failover Cluster Instances achieves. You must choose a high-availability solution that is based on your business requirements and IT infrastructure requirements.

Un factor determinante a la hora de seleccionar una opción de SQL Server para usar son las bases de datos de datos SharePoint. Es necesario comprender las características de las bases de datos SharePoint Server. Cada base de datos puede tener restricciones o requisitos específicos que determinarán la solución SQL Server de tolerancia a errores más apropiada y totalmente compatible con el entorno de producción. Se recomienda revisar los artículos siguientes:A determining factor in selecting a SQL Server option to use is the SharePoint databases. You must understand the characteristics of the SharePoint Server databases. Each database may have specific requirements or constraints that will determine the SQL Server fault-tolerant solution that is appropriate and fully supported in your production environment. We recommend that you review the following articles:

Clústeres de conmutación por error de SQL ServerSQL Server failover clustering

Los clústeres de conmutación por error admiten la disponibilidad para una instancia de SQL Server en SQL Server 2014 (SP1) o SQL Server 2012.Failover clustering provides availability support for an instance of SQL Server on SQL Server 2014 (SP1) or SQL Server 2012.

Un clúster de conmutación por error es una combinación de uno o más nodos o servidores y dos o más discos compartidos. Aunque una instancia de un clúster de conmutación por error aparece como un equipo único, la instancia proporciona la conmutación por error de un nodo a otro si el nodo actual deja de estar disponible. SharePoint Server se puede ejecutar en cualquier combinación de nodos activos y pasivos en un clúster compatible con SQL Server.A failover cluster is a combination of one or more nodes or servers, and two or more shared disks. Although an instance of a failover cluster appears as a single computer, the instance provides failover from one node to another if the current node becomes unavailable. SharePoint Server can run on any combination of active and passive nodes in a cluster that SQL Server supports.

SharePoint Server hace referencia al clúster en su conjunto. Por lo tanto, la conmutación por error es automática e imperceptible desde el punto de vista de SharePoint Server.SharePoint Server references the cluster as a whole. Therefore, failover is automatic and seamless from the perspective of SharePoint Server.

Nota

Cuando se produce una conmutación por error planeada o no planeada, se interrumpen las conexiones y deben establecerse de nuevo al pasar de un nodo de clúster a otro.When either a planned or unplanned failover happens, connections are dropped and must be established again when transitioning from one cluster node to another cluster node.

Para obtener información detallada sobre los clústeres de conmutación por error de SQL Server, consulte Instancias de clúster de conmutación por error de AlwaysOn (SQL Server).For detailed information about SQL Server failover clustering, see AlwaysOn Failover Cluster Instances (SQL Server).

Grupos de disponibilidad AlwaysOn de SQL Server y reflejo de bases de datos SQL ServerSQL Server AlwaysOn Availability Groups and SQL Server Database Mirroring

La ventaja principal de los grupos de disponibilidad AlwaysOn de SQL Server y del reflejo de bases de datos SQL Server es que ambos proporcionan una redundancia de datos completa o casi completa según cómo se configuren para el procesamiento de transacciones. Además de minimizar la pérdida de datos, la conmutación por error automática minimiza el tiempo de inactividad de las bases de datos de producción.The key benefit of SQL Server AlwaysOn Availability Groups and SQL Server Database Mirroring is that both provide complete or almost complete data redundancy depending on how you configure them for transaction processing. In addition to minimizing data loss, automatic failover minimizes downtime for production databases.

Importante

Aunque SQL Server 2016, SQL Server 2014 (SP1) y SQL Server 2012 admiten la creación de reflejo de la base de datos, se planeó que esta característica esté en desuso. Le recomendamos que evite el uso de esta característica en nuevos trabajos de desarrollo. Planee cambiar las aplicaciones que usan esta característica actualmente y use los grupos de disponibilidad AlwaysOn en su lugar.Although SQL Server 2016, SQL Server 2014 (SP1), and SQL Server 2012 support database mirroring, this feature is planned to be deprecated. We recommend that you avoid using this feature in new development work. Plan to change applications that currently use this feature. Use AlwaysOn Availability Groups instead.

Grupos de disponibilidad AlwaysOnAlwaysOn Availability Groups

La característica de grupos de disponibilidad AlwaysOn de SQL Server es una solución de alta disponibilidad y de recuperación ante desastres que proporciona una alternativa de nivel empresarial al reflejo de bases de datos. Los grupos de disponibilidad AlwaysOn admiten un entorno de conmutación por error para una o varias bases de datos del usuario incluidas en una colección definida por el usuario. Esta colección, un grupo de disponibilidad, está formada por los componentes siguientes:The SQL Server AlwaysOn Availability Groups feature is both a high-availability and disaster-recovery solution that provides an enterprise-level alternative to database mirroring. AlwaysOn Availability Groups supports a failover environment for one or more user databases contained in a user-defined collection. This collection, an availability group, consists of the following components:

  • Replicas, que son un conjunto discreto de bases de datos del usuario denominadas bases de datos de disponibilidad que se tratan como una sola unidad. Un grupo de disponibilidad admite una réplica principal y hasta cuatro réplicas secundarias.Replicas, which are a discrete set of user databases called availability databases that are handled as a single unit. An availability group supports one primary replica and up to four secondary replicas.

  • Una instancia específica de SQL Server para hospedar cada réplica y mantener una copia local de cada base de datos que pertenece al grupo de disponibilidad.A specific instance of SQL Server to host each replica and to maintain a local copy of each database that belongs to the availability group.

Cuando un grupo de disponibilidad se conmuta por error en una instancia de destino o un servidor de destino, todas las bases de datos del grupo también se conmutan por error. Como SQL Server 2014 (SP1) y SQL Server 2012 pueden hospedar varios grupos de disponibilidad en un único servidor, se puede configurar AlwaysOn para que conmute por error en las instancias de SQL Server en distintos servidores. Esto reduce la necesidad de usar servidores de alto rendimiento inactivos en espera para administrar la carga total del servidor principal, que es una de las muchas ventajas de los grupos de disponibilidad.When an availability group fails over to a target instance or target server, all databases in the group also fail over. Because SQL Server 2014 (SP1) and SQL Server 2012 can host multiple availability groups on a single server, you can configure AlwaysOn to fail over to SQL Server instances on different servers. This reduces the need for idle, high-performance standby servers to handle the full load of the primary server, which is one of the many benefits of availability groups.

Nota

Las incidencias de las bases de datos, como una base de datos que se convierte en sospechosa a causa de la pérdida de un archivo de datos, la eliminación de una base de datos o la corrupción de un registro de transacción, no causan una conmutación por error.Database issues, such as a database becoming suspect due to a loss of a data file, deletion of a database, or corruption of a transaction log do not cause a failover.

Para obtener más información sobre las ventajas de los grupos de disponibilidad AlwaysOn, así como una introducción a la terminología de los grupos de disponibilidad AlwaysOn, consulte Grupos de disponibilidad AlwaysOn (SQL Server).For more information about the benefits of AlwaysOn Availability Groups and an overview of AlwaysOn Availability Groups terminology, see AlwaysOn Availability Groups (SQL Server).

Creación de reflejos de base de datosDatabase mirroring

Nota

Aunque SQL Server 2016, SQL Server 2014 (SP1) y SQL Server 2012 admiten la creación de reflejo de la base de datos, se planeó que esta característica esté en desuso. Le recomendamos que evite el uso de esta característica en nuevos trabajos de desarrollo. Planee cambiar las aplicaciones que usan esta característica actualmente y use los grupos de disponibilidad AlwaysOn en su lugar.Although SQL Server 2016, SQL Server 2014 (SP1), and SQL Server 2012 support database mirroring, this feature is planned to be deprecated. We recommend that you avoid using this feature in new development work. Plan to change applications that currently use this feature. Use AlwaysOn Availability Groups instead.

La creación de reflejos de base de datos proporciona redundancia de base de datos al conservar una copia reflejada de las bases de datos en el servidor de bases de datos principal. La creación de reflejos se implementa por base de datos y solo funciona con bases de datos que usan el modelo de recuperación completa.Database mirroring provides database redundancy by keeping a mirrored copy of databases on the primary database server. Mirroring is implemented on a per-database basis and only works with databases that use the full recovery model.

Nota

Existen dos modos de funcionamiento de la creación de reflejos. Uno de ellos, el modo de seguridad alta, admite la operación sincrónica. En el modo de seguridad alta, cuando se inicia una sesión, el servidor reflejado sincroniza la base de datos reflejada y la base de datos principal lo más rápido posible. Una vez sincronizadas las bases de datos, se escribe una transacción en el registro del servidor secundario y se vuelve a reproducir. (El control vuelve al servidor principal una vez protegida la transacción.) El otro modo de creación de reflejos es de rendimiento alto y utiliza la operación asincrónica para reducir la latencia de la transacción, con el coste de una mayor pérdida de datos.There are two mirroring operating modes. One of them, high-safety mode, supports synchronous operation. In high-safety mode, when a session starts, the mirror server synchronizes the mirror database and the principal database as quickly as possible. As soon as the databases are synchronized, a transaction is written to the log on the secondary server and then replayed. (Control returns to the principal server as soon as the transaction is hardened.) The other mirroring mode is high-performance, which uses asynchronous operation to reduce transaction latency, at the cost of increased data loss.

Para la creación de reflejos de alta disponibilidad en una granja de servidores SharePoint, se debe usar el modo de seguridad alta con conmutación por error automática. La creación de reflejos de seguridad alta requiere tres instancias de servidor: una principal, un reflejo y un testigo. El servidor testigo habilita SQL Server para que conmute por error automáticamente del servidor principal al servidor reflejado. La conmutación por error a la base de datos reflejada tarda normalmente unos segundos.For high-availability mirroring in a SharePoint farm, you must use high-safety mode with automatic failover. High-safety database mirroring requires three server instances: a principal, a mirror, and a witness. The witness server enables SQL Server to automatically fail over from the principal server to the mirror server. Failover from the principal database to the mirror database typically takes several seconds.

Para obtener información general sobre la creación de reflejos de bases de datos, vea Creación de reflejo de la base de datos.For general information about database mirroring, see Database Mirroring.

Importante

No se pueden crear reflejos de las bases de datos configuradas para usar el proveedor de almacén BLOB remoto FILESTREAM de SQL Server.Databases that are configured to use the SQL Server FILESTREAM remote BLOB store provider cannot be mirrored.

Comparación de la disponibilidad de las bases de datos y las estrategias de recuperación para una única granja de servidoresComparison of database availability and recovery strategies for a single farm

La elección de una tecnología SQL Server para la alta disponibilidad y la recuperación ante desastres debería basarse en los objetivos de negocio de la organización para el Objetivo de punto de recuperación (RPO) y el Objetivo de tiempo de recuperación (RTO). Aunque RPO y RTO se asocian normalmente con la recuperación ante desastres, algunos eventos de error se encuentran fuera del ámbito de un desastre pero requieren recuperación desde un medio de copia de seguridad local en la base de datos principal.The choice of a SQL Server technology for high availability and disaster recovery should be based on your organization's business goals for Recovery Point Objective (RPO) and Recovery Time Objective (RTO). Although RPO and RTO are typically associated with disaster recovery, some failure events are outside the scope of a disaster but require recovery from local backup media in the primary datacenter.

Importante

En función de la base de datos específica, las distintas bases de datos de SharePoint Server solo admiten opciones específica de alta disponibilidad de SQL Server. Para más información, vea Compatibilidad de alta disponibilidad y opciones de recuperación ante desastres para bases de datos de SharePoint.Depending on the specific database, the various SharePoint Server databases only support specific SQL Server high availability options. For more information, see Supported high availability and disaster recovery options for SharePoint databases.

En la tabla siguiente se ofrece una comparación general de los resultados RPO y RTO que las soluciones de SQL Server disponibles logran.The following table provides a general comparison of the RPO and RTO results that available SQL Server solutions achieve.

Nota

Los tiempos en la tabla siguiente son para comparar las opciones de bases de datos. En la práctica, todos los tiempos dependen de la carga de trabajo, el volumen de datos y los procedimientos de conmutación por error.Times in the following table are for comparing database options. In practice, all times depend on the workload, data volume, and failover procedures.

Comparación de RPO y RTO en función de la tecnología de bases de datosRPO and RTO comparison based on database technology

Solución SQL ServerSQL Server solution Pérdida de datos potencial (RPO)Potential data loss (RPO) Tiempo de recuperación potencial (RTO).Potential recovery time (RTO) Conmutación por error automáticaAutomatic failover Secundarias legibles
**Note:
SharePoint Server admite réplicas secundarias legibles para el uso en tiempo de ejecución. Para obtener más información, vea Actualización acumulativa de Office 2013 para abril de 2014 y Ejecutar una granja de servidores que usa bases de datos de solo lectura en SharePoint Server.
Readable secondaries
Note: SharePoint Server supports readable secondary replicas for runtime usage. For more information, see Office 2013 cumulative update for April 2014 and Run a farm that uses read-only databases in SharePoint Server.**
Grupo de disponibilidad AlwaysOn (confirmación sincrónica)AlwaysOn Availability Group (synchronous-commit)
CeroZero
SegundosSeconds
Yes
0 - 20 - 2
Grupo de disponibilidad AlwaysOn (confirmación asincrónica)AlwaysOn Availability Group (asynchronous-commit)
SegundosSeconds
MinutosMinutes
NoNo
0 - 40 - 4
Instancia de clúster de conmutación por error AlwaysOnAlwaysOn Failover Cluster Instance
No se aplicaDoes not apply
Una instancia de clúster de conmutación por error por sí sola no proporciona protección de datos. La cantidad de pérdida de datos depende de la implementación del sistema de almacenamiento.An FCI itself does not provide data protection. The amount of data loss depends on the storage system implementation.
Segundos a minutosSeconds to minutes
Yes
No se aplicaDoes not apply
Creación de reflejos de base de datos: seguridad alta (modo sincrónico + servidor testigo)Database mirroring - High-safety (synchronous mode + witness server)
CeroZero
SegundosSeconds
Yes
No se aplicaDoes not apply
Creación de reflejos de base de datos: rendimiento alto (modo asincrónico)Database mirroring - High-performance (asynchronous mode)
SegundosSeconds
MinutosMinutes
NoNo
No se aplicaDoes not apply
Copia de seguridad, copia, restauración.Backup, copy, restore
Horas o cero si se puede obtener acceso al final del registro después del error.Hours or zero if the tail of the log can be accessed after the failure.
Horas a díasHours to days
NoNo
No durante una restauraciónNot during a restore

Comparación del clúster SQL Server, el grupo de disponibilidad AlwaysOn y el reflejo de base de datosComparison of SQL Server Cluster, AlwaysOn Availability Group and Database mirror

ProcesoProcess Clúster de conmutación por error de SQL ServerSQL Server failover cluster Grupo de disponibilidad AlwaysOn de SQL Server 2014 (SP1) y SQL Server 2012SQL Server 2014 (SP1) and SQL Server 2012 AlwaysOn Availability Group Reflejo de alta disponibilidad de SQL ServerSQL Server high-availability mirror
Tiempo de la conmutación por errorTime to fail over
El miembro del clúster toma el control casi inmediatamente después del error. Se produce un retardo mientras el nodo del clúster se pone en funcionamiento.Cluster member takes over almost immediately after failure. A lag occurs while the cluster node spins up.
La réplica toma el control casi inmediatamente después del error. Se produce un retardo mientras la réplica secundaria se pone en funcionamiento.Replica takes over almost immediately after failure. A lag occurs while the secondary replica spins up.
El reflejo toma el control tan pronto como se procesa la cola rehecha.Mirror takes over as soon as the redo queue is processed.
Coherencia de las transaccionesTransactional consistency
Yes
Yes
Yes
Simultaneidad de las transaccionesTransactional concurrency
Yes
Yes
Yes
Tiempo de recuperaciónTime to recovery
Menos tiempo de recuperación que un grupo de disponibilidad.Shorter time to recover than an availability group.
Mayor tiempo de recuperación que un clúster de conmutación por error, pero más rápido que una solución reflejada.Longer time to recover than a failover cluster, but faster recovery time than a mirrored solution.
Tiempo de recuperación ligeramente mayor que un clúster o un grupo de disponibilidad.Slightly longer time to recover than cluster or availability group.
Pasos necesarios para la conmutación por errorSteps required for failover
Los nodos de la base de datos detectan un error automáticamente.Database nodes automatically detect a failure.
SharePoint Server hace referencia al clúster para que la conmutación por error sea directa y automática.SharePoint Server references the cluster so that failover is seamless and automatic.
La escucha del grupo de disponibilidad detecta un error automáticamente y la conmutación por error es directa y automática.The Availability Group listener automatically detects a failure and failover is seamless and automatic.
La base de datos detecta un error automáticamente.The database automatically detects failure.
SharePoint Server identifica la ubicación del reflejo si este se configuró correctamente para que la conmutación por error sea automática.SharePoint Server is aware of the mirror location, if it was configured correctly so that failover is automatic.
Protección frente a errores de almacenamientoProtection against failed storage
El clúster de conmutación por error por sí solo no proporciona protección de datos. La cantidad de pérdida de datos depende de la implementación del sistema de almacenamiento. Por ejemplo, un entorno SAN tiene componentes redundantes como múltiples rutas de archivo, RAID y reservas activas.The failover cluster itself does not provide data protection. The amount of data loss depends on the storage system implementation. For example, a SAN environment has redundant components such as multiple file paths, RAID, and hot spares.
Protege frente a errores de almacenamiento ya que la réplica principal escribe en los discos locales de las réplicas secundarias.Protects against failed storage because the primary replica writes to the local disks on the secondary replicas.
Protege frente a errores de almacenamiento ya que tanto el servidor principal como el de la base de datos reflejada escriben en discos locales.Protects against failed storage because both the principal and mirror database servers write to local disks.
Tipos de almacenamiento admitidosStorage types supported
Requiere almacenamiento compartido, que es más caro que el almacenamiento dedicado.Requires shared storage which is more expensive than dedicated storage.
Puede usar soluciones de almacenamiento conectadas directamente más económicas.Can use less expensive directly attached storage solutions.
Puede usar almacenamiento conectado directamente más económico.Can use less expensive directly attached storage.
Requisitos de ubicaciónLocation requirements
Los miembros del clúster deben encontrarse en la misma subred.Members of the cluster must be on the same subnet.
Note: Este no es el caso para SQL Server 2014 (SP1) y SQL Server 2012.Note: This is not the case with SQL Server 2014 (SP1) and SQL Server 2012.
Las réplicas pueden encontrarse en diferentes subredes si la latencia no causa problemas de rendimiento.Replicas can be on different subnets as long as latency does not cause performance issues.
Los servidores principal, reflejado y testigo deben estar en la misma LAN (ida y vuelta con una latencia de hasta 1 milisegundo).Principal, mirror, and witness servers must be on the same LAN (up to 1 millisecond latency round-trip).
Modelo de recuperaciónRecovery model
Se recomienda el modelo de recuperación completa de SQL Server. Se puede usar el modelo de recuperación simple de SQL Server. Sin embargo, el único punto de recuperación disponible si se pierde el clúster será la última copia de seguridad completa.SQL Server full recovery model recommended. You can use the SQL Server simple recovery model. However, the only available recovery point if the cluster is lost will be the last full backup.
Requiere el modelo de recuperación completa de SQL Server 2012 y SQL Server 2014 (SP1).Requires SQL Server 2014 (SP1) and SQL Server 2012 full recovery model.
Requiere el modelo de recuperación completa de SQL Server.Requires SQL Server full recovery model.
Sobrecarga de rendimientoPerformance overhead
Durante una conmutación por error se puede producir alguna disminución del rendimiento. El servidor no estará disponible durante la conmutación por error y las conexiones se interrumpen y se vuelven a establecer en el nuevo nodo activo.Some decrease in performance may occur while a failover is occurring. The server will be unavailable during failover and connections are dropped and then established again on the new active node.
Los grupos de disponibilidad AlwaysOn introducen la latencia transaccional, debido a la confirmación sincrónica en las réplicas secundarias. La cantidad de latencia depende del número de réplicas secundarias que se deben sincronizar.AlwaysOn Availability Groups introduce transactional latency because of synchronous commit on the secondary replicas. The amount of latency depends on the number of secondary replicas that have to be synchronized.
La sobrecarga de la memoria y del procesador es mayor que en los clústeres, pero menor que en la creación de reflejos.Memory and processor overhead is greater than clustering, but less than mirroring.
La creación de reflejos de alta disponibilidad introduce la latencia transaccional, ya que es sincrónica. También requiere una sobrecarga de la memoria y del procesador adicional.High-availability mirroring introduces transactional latency because it is synchronous. It also requires additional memory and processor overhead.
Sobrecarga de operacionesOperations overhead
Se configuran y mantienen en el nivel del servidor.Set up and maintained at the server level.
La sobrecarga operativa es mayor que en los clústeres y la creación de reflejos. AlwaysOn requiere sobrecarga a nivel del servidor de base de datos SQL Server, además de a nivel de Windows Server. The operational overhead is greater than clustering and mirroring. AlwaysOn requires overhead at the level of the SQL Server database server in addition to the Windows Server level.
Nota: Los objetos de nivel de servidor (como los trabajos de agente y los inicios de sesión) necesitan mantenerse de forma manual.Note: Server-level objects such as logons and agent jobs must be maintained manually.
Si se agregan bases de datos de contenido, se deben agregar a un grupo de disponibilidad y, después, sincronizar la réplica principal con las réplicas secundarias.If you add content databases, you have to add them to an availability group and then synchronize the primary replica to the secondary replicas.
Un entorno de granja de servidores SharePoint requiere varios pasos de configuración para asegurarse de que la cadena de conexión de SharePoint Server está asociada correctamente con el nombre de la escucha del grupo de disponibilidad.A SharePoint farm environment requires multiple configuration steps to make sure that the SharePoint Server connection string is correctly associated with the availability group listener name.
La sobrecarga de operaciones es mayor que en los clústeres. Se debe configurar y mantener para todas las bases de datos. La reconfiguración después de la conmutación por error es manual.The operations overhead is more than clustering. Must be set up and maintained for all databases. Reconfiguring after failover is manual.
Nota: Los objetos de nivel de servidor (como los trabajos de agente y los inicios de sesión) necesitan mantenerse de forma manual.Note: Server-level objects such as logons and agent jobs must be maintained manually.
Si se agregan bases de datos de contenido, se deben agregar al principal y después sincronizarlas con el principal del reflejo.If you add content databases, you have to add them to the principal and then synchronize the principal to the mirror.

Configuración de dos centros de datos como una única granja de servidores (granja de servidores "expandida") para proporcionar una alta disponibilidadConfigure two data centers as a single farm ("stretched" farm) to provide high availability

Algunas empresas tienen centros de datos ubicados cerca los unos de los otros, conectados mediante cables de fibra óptica de banda ancha. Si este entorno está disponible, es posible configurar ambos centros de datos como una sola granja de servidores. Esta topología de granja de servidores distribuida se denomina granja de servidores "expandida".Some enterprises have data centers that are located in close proximity to one another, connected by high-bandwidth fiber optic links. When this environment is available it is possible to configure the two data centers as a single farm. This distributed farm topology is called a "stretched" farm.

Para que una arquitectura de granja de servidores expandida funcione como solución de alta disponibilidad compatible, se deben cumplir los siguientes requisitos previos:For stretched farm architecture to work as a supported high availability solution the follow prerequisites must be met:

  • Hay una latencia dentro de la granja de servidores de gran constancia, de <1ms (unidireccional), el 99,9% del tiempo durante un período de diez minutos. (La latencia dentro de la granja se define comúnmente como la latencia entre los servidores web front end y los servidores de bases de datos.)There is a highly consistent intra-farm latency of <1ms (one way), 99.9% of the time over a period of ten minutes. (Intra-farm latency is commonly defined as the latency between the front-end web servers and the database servers.)

  • La velocidad de ancho de banda debe ser de al menos 1 gigabit por segundo.The bandwidth speed must be at least 1 gigabit per second.

Para proporcionar tolerancia a errores en una granja de servidores expandida, usa las instrucciones de prácticas recomendadas estándar para configurar aplicaciones de servicio y bases de datos redundantes.To provide fault tolerance in a stretched farm, use the standard best practice guidance to configure redundant service applications and databases.

En la ilustración siguiente se muestra una granja de servidores expandida.The following illustration shows a stretched farm.

Granja de servidores expandidaStretched farm

Topología de una granja expandida que utiliza dos centros de datos para ofrecer una disponibilidad elevada.

Incorporación de operaciones de copia de seguridad y de restauración en una estrategia de alta disponibilidadIncorporate backup and restore operations in a high availability strategy

La estrategia de alta disponibilidad debe incluir las operaciones de copia de seguridad y de restauración apropiadas para asegurar que la granja de servidores es resistente. En el caso de un incidente, como un error del medio o del usuario, se debe poder restaurar la parte afectada del entorno o de los datos de la granja de servidores de forma inmediata. Una solución de copia de seguridad y de restauración efectiva debe permitir el cumplimiento de los objetivos de tiempo de recuperación (RTO) y los objetivos de recuperación potencial (RPO) definidos.Your high availability strategy must include the appropriate backup and restore operations to make sure that the SharePoint farm is resilient. When an incident, such as a media failure or user error occurs, you must be able to restore the affected part of the farm environment or farm data in a timely manner. An effective backup and restore solution should enable you to meet the Recovery Time Objectives (RTO) and Recovery Point Objectives (RPO) that you define.

Vea tambiénSee also

ConceptosConcepts

Conceptos de alta disponibilidad y recuperación ante desastres en SharePoint ServerHigh availability and disaster recovery concepts in SharePoint Server

Seleccionar una estrategia de recuperación ante desastres para SharePoint ServerChoose a disaster recovery strategy for SharePoint Server