Cambios y conmutaciones por error

Se aplica a: Exchange Server 2013 SP1

Los cambios y las conmutaciones por error son las dos formas de interrupciones en Microsoft Exchange Server 2013.

  • Una conmutación es una interrupción programada de una base de datos o servidor que se inicia explícitamente mediante un cmdlet o por el sistema de disponibilidad administrado en Exchange 2013. Los cambios suelen llevarse a cabo como preparación para realizar una operación de mantenimiento. Los cambios implican que la copia activa de la base de datos de buzones de correo se mueve a otro servidor en el grupo de disponibilidad de base de datos (DAG). Si no se encuentra ningún destino correcto durante un cambio, los administradores recibirán un error y la base de datos de buzón permanecerá activa o montada.

  • Una conmutación por error hace referencia a eventos inesperados que dan lugar a la falta de disponibilidad de servicios, datos o ambos. Una conmutación por error implica que el sistema se recupere automáticamente de un error al activar una copia pasiva de la base de datos de buzones de correo para convertirla en la copia activa de la base de datos de buzones de correo. Si no se encuentra ningún destino correcto durante una conmutación por error, se desmontará la base de datos de buzones de correo.

Exchange 2013 está diseñado para controlar los cambios y las conmutaciones por error.

¿Está buscando tareas de administración relacionadas con la alta disponibilidad y la resistencia del sitio? Vea Administración de alta disponibilidad y resistencia de sitios.

Cambios

Existen tres tipos de cambios en Exchange 2013:

  • Cambios de base de datos
  • Cambios de servidor
  • Cambios de centro de datos

Cambios de base de datos

Un cambio de base de datos es el proceso por el que una base de datos activa individual se cambia a otra copia de base de datos (una copia pasiva) y esa copia de base de datos se convierte en la nueva copia de base de datos activa. Los cambios de base de datos pueden ocurrir tanto dentro de los centros de datos como entre ellos. Un cambio de base de datos se puede realizar mediante el Centro de administración de Exchange (EAC) o el Shell. Independientemente de la interfaz que se use, el proceso de cambio es el siguiente:

  1. El administrador inicia un cambio de base de datos para mover la copia actualmente activa de la base de datos de buzones de correo a otro servidor.

  2. El cliente usado para la tarea realiza una llamada RPC al servicio de replicación de Microsoft Exchange en un miembro del DAG.

  3. Si el miembro de DAG no cuenta con el rol de administrador activo principal (PAM), envía la tarea al servidor que contiene el rol de PAM.

  4. La tarea realiza una llamada RPC al servicio de replicación de Microsoft Exchange en el servidor que contiene el rol de PAM.

  5. El PAM lee y actualiza la información de la ubicación de la base de datos que está almacenada en la base de datos del clúster para el DAG.

  6. El PAM se pone en contacto con el servicio de replicación de Microsoft Exchange en el miembro del DAG cuya copia pasiva se está activando como la nueva copia activa de la base de datos de buzones de correo.

  7. El servicio de replicación de Microsoft Exchange en el servidor de destino solicita a los servicios de replicación de Microsoft Exchange en todos los demás miembros del DAG que determinen el mejor origen del registro para la copia de la base de datos.

  8. La base de datos se desmonta del servidor actual, y el servicio de replicación de Microsoft Exchange en el servidor de destino copia los registros restantes en el servidor de destino.

  9. El servicio de replicación de Microsoft Exchange en el servidor de destino solicita un montaje de base de datos.

  10. El servicio de almacén de información de Microsoft Exchange en el servidor de destino reproduce los archivos de registro y monta la base de datos.

  11. Los códigos de error se devuelven al servicio de replicación de Microsoft Exchange en el servidor de destino.

  12. El PAM actualiza la información del estado de la copia de la base de datos en la base de datos del clúster para el DAG.

  13. Los códigos de error son devueltos por el servicio de replicación de Microsoft Exchange en el servidor de destino al servicio de replicación de Microsoft Exchange en el PAM.

  14. El servicio de replicación de Microsoft Exchange en el PAM devuelve los errores a la interfaz administrativa en la cual se llamó a la tarea.

  15. PowerShell en remoto devuelve los resultados de la operación a la interfaz administrativa que realiza la llamada.

Para obtener instrucciones detalladas acerca de cómo realizar un cambio de base de datos, vea Activación de una copia de base de datos de buzones.

Conmutaciones de servidor

Un cambio de servidor es el proceso por el cual todas las bases de datos activas en un miembro del DAG se activan en uno o más miembros del DAG. Al igual que los cambios de base de datos, se puede producir un cambio de servidor tanto dentro de un centro de datos como entre centros de datos, y puede ser iniciado mediante el uso del EAC y el Shell. Independientemente de la interfaz que se use, el proceso de cambio de servidor es el siguiente:

  1. El administrador inicia un cambio de servidor para mover todas las copias actualmente activas de la base de datos de buzones de correo a uno o más servidores.

  2. La tarea realiza los mismos pasos detallados anteriormente en este tema para los cambios de base de datos (pasos 2 a 4) de cada una de las bases de datos activas en el servidor actual.

  3. El PAM lee y actualiza la información de la ubicación de la base de datos que está almacenada en la base de datos del clúster para el DAG.

  4. El PAM se pone en contacto con el servicio de replicación de Microsoft Exchange en cada miembro del DAG en el cual se está activando una copia pasiva.

  5. El servicio de replicación de Microsoft Exchange en los servidores de destino solicita a los servicios de replicación de Microsoft Exchange en todos los demás miembros del DAG que determinen el mejor origen del registro para la copia de la base de datos.

  6. La base de datos se desmonta del servidor actual, y el servicio de replicación de Microsoft Exchange en cada servidor de destino copia los registros restantes.

  7. El servicio de replicación de Microsoft Exchange en cada servidor de destino solicita un montaje de base de datos.

  8. El servicio de almacén de información de Microsoft Exchange en cada servidor de destino reproduce los archivos de registro y monta la base de datos.

  9. Los códigos de error se devuelven al servicio de replicación de Microsoft Exchange en el servidor de destino.

  10. El PAM actualiza la información del estado de la copia de la base de datos en la base de datos del clúster para el DAG.

  11. Los códigos de error son devueltos por el servicio de replicación de Microsoft Exchange en el servidor de destino al servicio de replicación de Microsoft Exchange en el PAM.

  12. El servicio de replicación de Microsoft Exchange en el PAM devuelve los errores a la interfaz administrativa en la cual se llamó a la tarea.

  13. PowerShell en remoto devuelve los resultados de la operación a la interfaz administrativa que realiza la llamada.

Para obtener instrucciones detalladas acerca de cómo realizar un cambio de servidor, vea Realizar un cambio de servidor.

Cambios de centro de datos

En una configuración con resistencia de sitios se puede producir una recuperación automática en respuesta a un fallo en el nivel de sitio dentro de un DAG, lo que permitiría al sistema de mensajería permanecer operativo. Esta configuración requiere al menos tres ubicaciones ya que necesita la implementación de los miembros de DAG en dos ubicaciones y el servidor de testigo de DAG en una tercera.

Si no tiene tres ubicaciones, o incluso si tiene tres ubicaciones, pero quiere controlar las acciones de recuperación a nivel de centro de datos, puede configurar un DAG para la recuperación manual si se produce un error de nivel de sitio. En ese caso, realizará un proceso denominado un cambio de centro de datos. Como sucede con muchas situaciones de recuperación ante desastres, la planificación y la preparación anticipadas de un cambio de centro de datos pueden simplificar el proceso de recuperación y reducir la duración de la interrupción.

Debido a los numerosos cambios arquitectónicos en Exchange 2013, incluida la consolidación de roles de servidor, realizar un cambio de centro de datos en Exchange 2013 es más fácil que en Exchange 2010. Para obtener el procedimiento detallado de cómo realizar un cambio de centro de datos, vea Cambios en el centro de datos.

Conmutaciones por error

Una conmutación por error es un proceso de activación automática que tiene lugar en el nivel de la base de datos, el servidor o el centro de datos. Las conmutaciones por error ocurren en respuesta a un error que afecta a una base de datos individual (por ejemplo, una pérdida de almacenamiento aislada), a un servidor completo (por ejemplo, un error en la placa base o una pérdida de energía) o a un sitio completo (por ejemplo, la pérdida de todos los miembros de DAG de un sitio).

Los DAG y las copias de bases de datos de buzones de correo proporcionan una redundancia completa y una recuperación rápida tanto de los datos como de los servicios que permiten obtener acceso a los datos. En la tabla siguiente se enumeran las acciones de recuperación esperadas para varios errores. Algunos errores requieren que el administrador inicie la recuperación, mientras que otros son administrados automáticamente por el sistema.

Descripción Activación automática Acción de reparación automática Estado durante la reparación: Activo Estado durante la reparación: Pasivo Acciones de reparación Comentarios
Error en la base de datos de software del motor de almacenamiento extensible (ESE): Las unidades que almacenan la base de datos devuelven errores en algunas lecturas (por ejemplo, un error -1018). Posible interrupción breve.

Posible conmutación por error automática.
Aplicación de revisión automática de página errónea. Cambio manual, conmutación por error automática o reparación en línea. Error Reconstruir RAID, reparar copia de base de datos y base de datos, restaurar y ejecutar la recuperación, y luego aplicar la revisión de páginas, o aplicar la revisión de páginas de la copia. Puede haber otros códigos de error de base de datos de software.

No se incluyen errores de bloqueo del sistema de archivos NTFS.

Si se realiza una conmutación por error o un cambio, se actualiza el servidor host.
Error de base de datos "semi-soft" de ESE: las unidades que almacenan la base de datos devuelven errores en algunas escrituras. Interrupción breve durante la conmutación por error automática. Reconstrucción automática de volumen o disco después de un posible reemplazo de unidad. Se desmontará si no se puede recuperar. Error La reconstrucción de RAID puede resolver el problema.

Copiar y reparar, restaurar y ejecutar una recuperación, o reconstruir el disco o volumen después de un posible reemplazo.
Un error de escritura semisoft de ESE significa que algunas escrituras son correctas.

No se incluye un error de bloqueo de NTFS.
Error en el registro "semisoft" de ESE: Las unidades que almacenan los datos del registro devuelven errores no recuperados en algunas lecturas o escrituras. Interrupción breve durante la conmutación por error automática. Reconstrucción automática de volumen o disco después de un posible reemplazo de unidad. Se desmontará si no se puede recuperar. Error La reconstrucción de RAID puede resolver el problema.

Copiar y reparar, restaurar y ejecutar una recuperación, o reconstruir el disco o volumen después de un posible reemplazo.
Un error de lectura o escritura semisoft de ESE significa que algunas lecturas o escrituras son correctas.

Si la base de datos falla, una recuperación automática ocurrirá antes de que comience el proceso de recuperación de datos del registro.
Agotamiento de recursos o error de software de ESE: Un error en el cual ESE termina la instancia (por ejemplo, Id. de evento 1022, gran profundidad de punto de control). Interrupción breve durante la conmutación por error automática. Ninguno. Se desmontará si no se puede recuperar. Error Solucionar problema de recursos subyacente. Este error podría ser el error expuesto de otros casos.
Errores de bloqueo de NTFS: Las unidades que almacenan la base de datos o los registros experimentan un error de escritura o lectura en una estructura de control de NTFS. Interrupción breve durante la conmutación por error automática. Volumen reconstruido después de un posible reemplazo de unidad. Se desmontará si no se puede recuperar. Error La reconstrucción de RAID puede resolver el problema. Las utilidades de NTFS pueden resolver los problemas de NTFS. Es posible que se requiera la recuperación de Exchange. Es más probable que este evento se produzca cuando RAID no está en uso. Si este evento afecta al volumen de registro activo, se perderán algunos archivos de registro recientes.

No se incluyen errores corregidos de manera automática por NTFS, su software subyacente ni su pila de hardware.
Error en la base de datos o en la unidad de registro: se ha producido un error en una unidad que almacena la base de datos o los registros y no se puede acceder a ella. Interrupción breve durante la conmutación por error automática. Unidad reformateada o reemplazada, seguida de una reconstrucción completa del volumen. Se desmontará si no se puede recuperar. Error Reemplazo de unidad, seguido de una posible reconstrucción de RAID.

Reemplazo de unidad, seguido de una reconstrucción completa del volumen.

Reconstrucción completa del volumen.
No procede.
Error en la base de datos o el volumen de registro: se produce un error en el volumen debido a problemas de NTFS o volumen de nivel inferior. Interrupción breve durante la conmutación por error automática. Unidad reformateada o reemplazada. Se desmontará si no se puede recuperar. Error Reemplazo de unidad, seguido de una posible reconstrucción de RAID.

Reemplazo de unidad, seguido de una reconstrucción completa del volumen.

Reconstrucción completa del volumen.
No aplicable
Volumen de base de datos o registro sin espacio: El sistema de archivos NTFS con los archivos de registro o base de datos no tiene espacio. Conmutación por error automática si otra copia no está en un estado similar. Ninguno. Desmontado. Error Ejecutar copias de seguridad incrementales o completas; eliminar registros de forma manual; esperar; reanudar la copia de la base de datos; o reparar la copia de la base de datos que falló. No aplicable
El administrador desmonta la base de datos incorrecta. Si la conmutación por error automática no es bloqueada por el administrador, ocurrirá una breve interrupción.

Si la conmutación por error automática es evitada, habrá una interrupción hasta que la base de datos se monte.
Ninguno. Desmontado. No aplicable El administrador corrige el error. No aplicable
El administrador suspende la copia de la base de datos incorrecta. En función de la configuración y la copia afectada, puede evitarse la recuperación automática. Ninguno. No aplicable Suspended El administrador corrige el error. No aplicable
El administrador desmonta una base de datos para el mantenimiento de almacenamiento, NTFS o volumen. Si la conmutación por error automática no es bloqueada por el administrador, ocurrirá una breve interrupción.

Si la conmutación por error automática es bloqueada, habrá una interrupción hasta que el administrador complete la tarea.
Ninguno. Desmontado. No aplicable El administrador finaliza la tarea. No aplicable
El administrador suspende una copia de la base de datos para el mantenimiento de almacenamiento, NTFS o volumen. En función de la configuración y la copia afectada, puede evitarse la recuperación automática. Ninguno. No aplicable Suspended El administrador completa las acciones. No aplicable
El administrador desmonta una base de datos para el mantenimiento de la base de datos sin conexión. Interrupción hasta que se haya reparado. Ninguno. Desmontado. Suspended El administrador completa las acciones. Las copias activas y pasivas de la base de datos se separan.

El administrador debe suspender las copias.
Error de red de área de almacenamiento (SAN), disco o controlador de almacenamiento. Interrupción breve durante la conmutación por error automática. Ninguno. Desmontado. Cualquiera Reparar el hardware. Una copia pasiva de la base de datos estará en el estado en que se encontraba en el momento en que falló el sistema.
Mantenimiento de hardware del servidor. Interrupción breve durante la conmutación por error automática (a menos que sea bloqueada por un administrador). Ninguno. Desmontado. Cualquiera Completar las acciones. Una copia pasiva de la base de datos estará en el estado en que se encontraba en el momento en que se apagó el sistema.
Mantenimiento de software del servidor. Interrupción breve durante la conmutación por error automática (a menos que sea bloqueada por un administrador). Ninguno. Desmontado. Cualquiera Completar las acciones. Una copia pasiva de la base de datos estará en el estado en que se encontraba en el momento en que se apagó el sistema.
Un administrador ha interrumpido o detenido el servicio Almacén de información de Microsoft Exchange. Interrupción breve durante la conmutación por error automática. Ninguno. Desmontado. Cualquiera Reiniciar el servicio de almacén de información de Microsoft Exchange. No aplicable
Se produce un error en el servicio de almacén de información de Microsoft Exchange; el sistema operativo aún se está ejecutando. Interrupción breve durante la conmutación por error automática. El Administrador de control de servicios reinicia el servicio de almacén de información de Microsoft Exchange. Desmontado. Cualquiera Reiniciar de forma manual o automática el servicio de almacén de información de Microsoft Exchange. Una copia pasiva de la base de datos estará en el estado en que se encontraba cuando falló el servicio de almacén de información de Microsoft Exchange.
Error parcial del servicio Almacén de información de Microsoft Exchange; parte del almacén de Exchange deja de funcionar, pero no se identifica como errónea. Posible interrupción breve durante la conmutación por error automática. Ninguno. Montado y parcialmente funcional. Cualquiera, pero puede estar sólo parcialmente funcional Reiniciar el servidor, el sistema operativo o el servicio de almacén de información de Microsoft Exchange. No aplicable
Error en el servidor: El servidor ha producido un error debido a una de las siguientes razones:
  • Error total de alimentación
  • Error no recuperado del chip del procesador, la placa base o el backplane
  • Error de detención de sistema operativo
  • El sistema operativo deja de responder
  • Error total de comunicación
Interrupción breve durante la conmutación por error automática. Reiniciar el equipo. Desmontado. Cualquiera Restaurar la energía; cambiar la configuración del sistema operativo; cambiar la configuración del hardware; reemplazar el hardware; reiniciar el sistema operativo; reparar el sistema operativo; reparar el hardware; o reparar los problemas de comunicación. No aplicable
El DAG tiene un error de quórum. Interrupción hasta que se haya reparado. Ninguno. Desmontado. Cualquiera Reparar el quórum que falló; asignar un nuevo quórum; o restaurar la red que está provocando el error de quórum. Una copia pasiva de la base de datos estará en el estado en que se encontraba en el momento en que falló el sistema.
Error de comunicación de red MAPI: El servidor ya no está disponible en la red MAPI. Interrupción breve durante la conmutación por error automática; no deben existir pérdidas. Ninguno. La comunicación se sigue intentado. Desmontado. Cualquiera Solucionar problema de comunicación corrigiendo problemas de hardware o software. No aplicable
Error de comunicación de red de replicación: El servidor no puede recibir latidos, copias de registro ni valores de inicialización por medio de la red de replicación que falló. Posible interrupción breve de inicialización o copia mientras la carga de trabajo se cambia a otra red. Ninguno. La comunicación se sigue intentado. Ninguno. Cualquiera Solucionar problema de comunicación corrigiendo problemas de hardware o software. Resistencia afectada por el error.
Varios errores de comunicación de red: el servidor no puede recibir latidos, copias de registro ni inicialización a través de varias redes. Interrupción breve durante la conmutación por error automática; no deben existir pérdidas. Ninguno. La comunicación se sigue intentado. Desmontado. Cualquiera Solucionar problema de comunicación corrigiendo problemas de hardware o software. Al menos una red todavía funciona.
Error parcial de una o varias redes: Las redes tienen tasas de error elevadas. Error no detectado; sin acción. Ninguno. Montado; pero posibles problemas de rendimiento. Cualquiera Solucionar problema de comunicación corrigiendo problemas de hardware o software. La red tiene tasas de error superiores a las normales.
Bloqueo de sistemas operativos no detectados: el sistema operativo deja de responder, pero no se detecta mediante la supervisión o la agrupación en clústeres. Ninguno. Ninguno. Cualquiera. Cualquiera Reiniciar o terminar los recursos que no responden. No se detectó el bloqueo, por lo que no se toma ninguna acción.

Algunas funciones pueden estar operativas.
La unidad del sistema operativo tiene un error. Interrupción breve durante la conmutación por error automática. Ninguno. Desmontado. Cualquiera Reemplazar la unidad y reconstruir el servidor, o reconstruir el volumen utilizando RAID. No aplicable
La unidad del sistema operativo se ha quedado sin espacio. Interrupción breve durante la conmutación por error automática. Ninguno. Desmontado. Cualquiera Liberar manualmente espacio en el volumen. No procede.
Las unidades que contienen archivos binarios de Exchange experimentan un error de volumen o unidad. Interrupción breve durante la conmutación por error automática. Ninguno. Desmontado. Cualquiera Reemplazar la unidad y volver a instalar la aplicación, o reconstruir el volumen usando RAID. No aplicable
La unidad que contiene los archivos binarios de Exchange se ha quedado sin espacio. Interrupción breve durante la conmutación por error automática. Ninguno. Desmontado. Cualquiera Liberar manualmente espacio en el volumen. No aplicable
Nuevo registro no válido detectado: La secuencia de registro es interrumpida por un archivo existente. Breve interrupción durante la conmutación por error automática; suponer que otras copias no tienen el mismo problema. Ninguno. Desmontado. Error Quitar registros perjudiciales después de determinar el origen. No se deben replicar los registros perjudiciales.
La replicación continua detecta registro no válido: La reproducción detecta un registro inadecuado durante la copia o reproducción. No aplicable Descartar registro. No aplicable Error Descartar registro no válido; mover la secuencia de registro que afecta. No procede.

Conmutaciones por error de base de datos

Una conmutación por error de base de datos sucede cuando una copia de la base de datos que estaba activa ya no puede permanecer activa. Las siguientes repeticiones forman parte de una conmutación por error de base de datos:

  1. El error de base de datos es detectado por el servicio de almacén de información de Microsoft Exchange.

  2. El servicio de almacén de información de Microsoft Exchange escribe eventos de error en el registro de eventos del canal crimson.

  3. El administrador activo en el servidor que contiene la base de datos con error detecta los eventos de error.

  4. El administrador activo solicita el estado de la copia de la base de datos de otros servidores que contienen una copia de la base de datos.

  5. Los demás servidores devuelven el estado de la copia de la base de datos solicitado al administrador activo que lo solicita.

  6. El PAM comienza a mover la base de datos activa a otro servidor en el DAG mediante un algoritmo de selección de la mejor copia.

  7. El PAM actualiza la ubicación de montaje de la base de datos en la base de datos del clúster para enviarla al servidor seleccionado.

  8. El PAM envía una solicitud al administrador activo en el servidor seleccionado para convertirse en el patrón de base de datos.

  9. El administrador activo en el servidor seleccionado solicita que el servicio de replicación de Microsoft Exchange intente copiar los últimos registros del servidor anterior y establezca la marca de montaje para la base de datos.

  10. El servicio de replicación de Microsoft Exchange copia los registros del servidor que tenía previamente la copia activa de la base de datos.

  11. El administrador activo lee el número de generación de registro máximo de la base de datos del clúster.

  12. El servicio de almacén de información de Microsoft Exchange monta la nueva copia activa de la base de datos.

Conmutaciones por error de servidor

Una conmutación por error de servidor sucede cuando el miembro del DAG ya no puede reparar la red MAPI, o cuando el Servicio de clúster en un miembro del DAG ya no puede ponerse en contacto con los miembros del DAG restantes. Las siguientes repeticiones forman parte de una conmutación por error de servidor:

  1. El Servicio de clúster en el PAM envía una notificación al PAM por una de las dos razones:

    1. Nodo inactivo: el servidor es accesible, pero no puede participar en las operaciones de DAG.
    2. Red MAPI inactiva: no se puede establecer contacto con el servidor a través de la red MAPI y, por lo tanto, no puede participar en operaciones de DAG.
  2. Si el servidor es accesible, el PAM contacta al administrador activo en el servidor afectado y solicita que se desmonten todas las bases de datos inmediatamente.

  3. Para cada copia de base de datos afectada:

    1. El PAM solicita el estado de la copia de la base de datos de todos los servidores en el DAG.
    2. El PAM recibe una respuesta de todos los miembros del DAG accesibles y activos.
    3. El PAM intenta determinar el mejor origen del registro entre todos los servidores que responden al consultar el número de generación de registro más reciente de cada uno de los respondedores.
    4. Cada uno de los servidores responde con el número de generación de registro.
  4. El PAM recupera el estado actual del catálogo del índice de búsqueda de la base de datos del clúster.

  5. Según el número de generación de registro y el estado del catálogo de la copia de cada base de datos, el PAM selecciona las mejores copias para activar.

  6. El PAM actualiza la ubicación montada de la base de datos en la base de datos del clúster.

  7. El PAM inicia la conmutación por error de base de datos comunicándose con el administrador activo en uno o más servidores.

  8. El administrador activo en los servidores seleccionados solicita que el servicio de replicación de Microsoft Exchange intente copiar los últimos registros del servidor anterior y establezca la marca de montaje.

  9. Cuando la base de datos se puede montar, el administrador activo en los servidores monta la base de datos.

Para obtener más información acerca del mejor proceso de selección de copia del administrador activo, vea Active Manager.

Conmutaciones por error del centro de datos

Se han realizado cambios significativos en Exchange 2013 que abordan los retos de llevar a cabo una configuración con resistencia de sitios en Exchange 2010. Mediante la simplificación del espacio de nombres, la consolidación de los roles de servidor, la separación del servidor de acceso de cliente y la recuperación DAG (en Exchange 2013, no es necesario mover el espacio de nombres con el DAG), así como los cambios en el equilibrio de carga, Exchange 2013 proporciona nuevas opciones de resistencia como, por ejemplo, poder usar un único espacio de nombres global. Además, si tiene más de dos ubicaciones en las que implementar componentes del servicio de mensajería, Exchange 2013 también habilita la configuración del servicio de mensajería para la conmutación automática por error en respuesta a errores que requerían intervención manual en Exchange 2010.

En Exchange 2013 se ha simplificado el funcionamiento de la resistencia de sitios. Exchange aplica tolerancia a errores integrada en el espacio de nombres a través de varias direcciones IP, equilibrio de carga (y, si es necesario, la capacidad de incluir y quitar servidores del servicio). Uno de los cambios más significativos que hicimos en Exchange 2013 fue usar la capacidad de los clientes para almacenar en caché varias direcciones IP devueltas desde un servidor DNS en respuesta a una solicitud de resolución de nombres. Si suponemos que el cliente tiene la capacidad de copiar en caché múltiples direcciones IP (lo que hacen la mayoría de clientes HTTP y dado que la mayoría de los protocolos de acceso de cliente de Exchange 2013 se basan en HTTP (Outlook, Outlook en cualquier lugar, EAS, EWS, OWA, EAC, RPS, etc.), todos los clientes HTTP compatibles tienen la capacidad de usar múltiples direcciones IP), lo que proporciona la conmutación por error del lado cliente. Puede configurar DNS para entregar varias direcciones IP a un cliente durante la resolución de nombres. El cliente solicita mail.contoso.com y obtiene, por ejemplo, dos o cuatro direcciones IP. Sin embargo, el cliente usará de forma confiable muchas direcciones IP que recupera el cliente. Este uso óptimo hace que el cliente sea mucho mejor, ya que si se produce un error en una de las direcciones IP, el cliente tiene uno o más otros a los que intentar conectarse. Si el cliente prueba una y genera un error, espera unos 20 segundos y, a continuación, prueba la siguiente de la lista. Así, si pierde conectividad en la matriz CAS principal pero dispone de una segunda dirección IP pública para una segunda matriz CAS, la recuperación de los clientes es automática y se produce en unos 21 segundos.

Los clientes HTTP modernos (sistemas operativos y exploradores web que tienen diez años o menos) funcionan automáticamente con esta redundancia. La pila HTTP puede aceptar varias direcciones IP para un FQDN y, si se produce un error en la primera dirección IP que intenta (por ejemplo, no se puede conectar), probará la siguiente dirección IP de la lista. En un error temporal (se pierde la conexión después de que se haya establecido la sesión, debido a un error intermitente en el servicio donde, por ejemplo, un dispositivo está quitando paquetes y necesita ser quitado del servicio), es posible que el usuario tenga que actualizar su explorador.

Con la configuración adecuada, la conmutación por error puede producirse en el nivel de cliente y los clientes se redirigirán automáticamente a un segundo centro de datos que tenga servidores de acceso de cliente operativos, y esos servidores de acceso de cliente operativos devolverán la comunicación al servidor de buzones del usuario, lo que no se verá afectado por la interrupción (porque no realiza una conmutación por error). En lugar de trabajar para recuperar el servicio, el servicio se recupera y puede centrarse en corregir el problema principal (por ejemplo, reemplazar un equilibrador de carga con errores).

Dado que puede conmutar por error el espacio de nombres entre centros de datos, todo lo que se necesita para lograr una conmutación por error del centro de datos es un mecanismo para la conmutación por error del rol Buzón entre centros de datos. Para obtener la conmutación automática por error para el DAG, diseñe una solución en la que el DAG se divida uniformemente entre dos centros de datos y, a continuación, coloque el servidor testigo en una tercera ubicación para que los miembros del DAG puedan arbitrarlo en cualquiera de los centros de datos, independientemente del estado de la red entre los centros de datos que contienen los miembros del DAG. La clave es que la tercera ubicación está al margen de los fallos que afectan a las ubicaciones que contienen a los miembros de DAG.

Si solo tiene dos centros de datos y querría configurar la conmutación por error automática, puede utilizar Microsoft Azure como tercera ubicación. Tendrá que crear una red virtual de Azure y conectarla a los dos centros de datos mediante una VPN multipunto. Después podrá colocar el servidor testigo en una máquina virtual de Microsoft Azure. Para obtener más información, vea Usar una máquina virtual de Microsoft Azure como un servidor testigo del DAG.