Diseño y arquitectura de Azure ExpressRoute para lograr la resistencia

Azure ExpressRoute es un servicio de conectividad híbrida esencial ampliamente utilizado por su baja latencia, resistencia y conectividad privada de alto rendimiento entre su red local y las cargas de trabajo de Azure. Ofrece la posibilidad de lograr confiabilidad, resistencia y recuperación ante desastres en las conexiones de red entre el entorno local y Azure para garantizar la disponibilidad de las cargas de trabajo empresariales y críticas. Esta funcionalidad también extiende el acceso a los recursos de Azure de forma escalable y rentable.

Diagrama que ilustra una conexión entre una red local y Azure mediante ExpressRoute.

Para tener un sistema bien estructurado, es fundamental unas conexiones de red con una alta confiabilidad, resistencia y disponibilidad. La confiabilidad consta de dos principios: resistencia y disponibilidad. El objetivo de la resistencia es evitar errores y, en caso de que se produzcan, restaurar las aplicaciones a un estado totalmente operativo. El objetivo de la disponibilidad es proporcionar acceso constante a la aplicación o carga de trabajo. Es importante planear de antemano la confiabilidad en función de las necesidades empresariales y los requisitos de la aplicación.

Los usuarios de ExpressRoute dependen de la disponibilidad y el rendimiento de los sitios perimetrales, la WAN y las zonas de disponibilidad para mantener su conectividad con Azure. Sin embargo, estos componentes o sitios pueden experimentar errores debido a diversos motivos, como el mal funcionamiento del equipo, las interrupciones de la red, las condiciones meteorológicas o los desastres naturales. Por lo tanto, es una responsabilidad conjunta de los usuarios y su proveedor de nube planear la arquitectura pensando en la confiabilidad, la resistencia y la disponibilidad.

Resistencia del sitio para ExpressRoute

Hay tres arquitecturas de resistencia de ExpressRoute que se pueden usar para garantizar disponibilidad y resistencia altas en las conexiones de red entre el entorno local y Azure. Estos diseños de arquitectura incluyen:

Resistencia máxima

La arquitectura de resistencia máxima en ExpressRoute está estructurada para eliminar cualquier único punto de error dentro de la ruta de acceso de red de Microsoft. Esta configuración se logra mediante la configuración de un par de circuitos en dos ubicaciones distintas para la diversidad de sitios con ExpressRoute. El objetivo de la resistencia máxima es mejorar la confiabilidad, la resistencia y la disponibilidad, como resultado, y así garantizar el mayor nivel de resistencia para las cargas de trabajo empresariales o críticas. Para estas operaciones, se recomienda configurar la resistencia máxima. Este diseño de arquitectura se recomienda como parte del Marco de buena arquitectura bajo el pilar de confiabilidad. El equipo de ingeniería de ExpressRoute desarrolló una experiencia de portal guiada para ayudarle a configurar la resistencia máxima.

Diagrama que ilustra un par de circuitos ExpressRoute, configurados en dos ubicaciones de emparejamiento distintas, entre una red local y Microsoft.

Resistencia alta

Una resistencia alta, también conocida como resistencia del sitio o de varios sitios, permite el uso de varios sitios dentro de la misma área metropolitana (Metro) para conectar la red local a Azure mediante ExpressRoute. La resistencia alta ofrece diversidad de sitios al dividir un único circuito entre dos sitios. La primera conexión se establece en un sitio y la segunda conexión en otro. El objetivo de la resistencia de varios sitios es mitigar el efecto del aislamiento y los errores de los sitios perimetrales mediante la introducción de funcionalidades para permitir la diversidad de sitios. La diversidad de sitios se logra mediante un único circuito entre sitios emparejados dentro de una ciudad metropolitana, lo que ofrece resistencia a los errores entre el perímetro y la región. La resistencia alta proporciona un mayor nivel de resistencia del sitio que la resistencia estándar, pero no tanto como la resistencia máxima. La resistencia alta tiene el mismo precio que la resistencia estándar, con paridad de latencia en dos sitios. Esta arquitectura se puede usar para cargas de trabajo empresariales y críticas dentro de una región. Para más información, consulte Metro de ExpressRoute.

Diagrama que ilustra un único circuito ExpressRoute, con cada vínculo configurado en dos ubicaciones de emparejamiento distintas.

Resistencia estándar

La resistencia estándar de ExpressRoute es un único circuito con dos conexiones configuradas en un único sitio. La redundancia integrada (activo-activo) está configurada para facilitar la conmutación por error en las dos conexiones del circuito. En la actualidad, ExpressRoute ofrece dos conexiones en una sola ubicación de emparejamiento. Si se produce un error en este sitio, es posible que los usuarios experimenten una pérdida de conectividad con sus cargas de trabajo de Azure. Esta configuración también se conoce como hospedaje único, ya que representa a los usuarios con un circuito ExpressRoute configurado con solo una ubicación de emparejamiento. Esta configuración se considera la menos resistente y no se recomienda para cargas de trabajo empresariales o críticas porque no proporciona resistencia del sitio.

Diagrama que ilustra un único circuito ExpressRoute, con cada vínculo configurado en una sola ubicación de emparejamiento.

Resistencia zonal para ExpressRoute

Las regiones de Azure son una parte integral de la estrategia de diseño y resistencia de ExpressRoute. Estas regiones son ubicaciones geográficas de centros de datos que hospedan servicios de Azure. Las regiones están interconectadas mediante una red dedicada de baja latencia y están diseñadas para tener una alta disponibilidad y ser tolerantes a errores y escalables.

Azure ofrece varias características para garantizar la resistencia regional. Una de estas características son las zonas de disponibilidad. Las zonas de disponibilidad protegen las aplicaciones y los datos de los errores de los centros de datos, ya que abarcan varias ubicaciones físicas dentro de una región. Las regiones y las zonas de disponibilidad son fundamentales para la estrategia de diseño y resistencia de la aplicación. Mediante el uso de zonas de disponibilidad, puede lograr una mayor disponibilidad y resistencia en las implementaciones. Para más información, consulte Regiones y zonas de disponibilidad.

Se recomienda implementar sus puertas de enlace de red virtual de ExpressRoute con redundancia de zona entre zonas de disponibilidad dentro de una región. Estas zonas de disponibilidad son ubicaciones físicas independientes con infraestructura independiente (alimentación, refrigeración y redes). El propósito es proteger la conectividad de red local a Azure frente a errores de nivel de zona. Las puertas de enlace ExpressRoute con redundancia de zona proporcionan resistencia, escalabilidad y mayor disponibilidad para acceder a servicios críticos de Azure.

Los errores de equipos o los desastres en centros de datos regionales y zonales pueden afectar a las implementaciones de puertas de enlace de ExpressRoute en redes virtuales. Si las puertas de enlace no se implementan con redundancia de zona, estos errores dentro de un centro de datos de Azure pueden afectar a la capacidad de los usuarios para acceder a sus cargas de trabajo de Azure.

Si tiene puertas de enlace de ExpressRoute sin redundancia de zona, ahora tiene la posibilidad de migrar a una puerta de enlace habilitada para zonas de disponibilidad.

Recomendaciones

A continuación se muestran recomendaciones para garantizar alta disponibilidad, resistencia y confiabilidad en la arquitectura de red de ExpressRoute:

Recomendaciones del circuito ExpressRoute

Planeamiento del circuito ExpressRoute o de ExpressRoute Direct

Durante la fase de planeamiento inicial, es fundamental determinar si se debe configurar un circuito ExpressRoute o una conexión ExpressRoute Direct. Un circuito ExpressRoute permite una conexión privada dedicada a Azure con la ayuda de un proveedor de conectividad. ExpressRoute Direct permite la extensión de una red local directamente a la red de Microsoft en una ubicación de emparejamiento. También es necesario identificar el requisito de ancho de banda y el requisito del tipo de SKU del circuito para satisfacer sus necesidades empresariales.

Evaluación de la resistencia de circuitos ExpressRoute con redundancia de varios sitios

Después de implementar circuitos ExpressRoute con redundancia de varios sitios con resistencia máxima, es esencial asegurarse de que las rutas locales se anuncian a través de los circuitos redundantes para usar completamente las ventajas de la redundancia de varios sitios. Para evaluar la resistencia y probar la conmutación por error de circuitos redundantes y rutas, obtenga más información aquí.

Planeamiento de la configuración activo-activo

Para mejorar la resistencia y la disponibilidad, Microsoft recomienda operar ambas conexiones de un circuito ExpressRoute en modo activo-activo. Al permitir que dos conexiones funcionen en este modo, la carga de Microsoft equilibra el tráfico de red entre las conexiones según el flujo.

Diversidad de capas físicas

Para mejorar la resistencia, planee establecer varias rutas de acceso entre el perímetro local y las ubicaciones de emparejamiento (ubicaciones perimetrales del proveedor o de Microsoft). Esta configuración se puede lograr mediante el uso de diferentes proveedores de servicios o mediante el enrutamiento a través de otra ubicación de emparejamiento desde la red local. Para obtener una alta disponibilidad, es esencial mantener la redundancia del circuito de ExpressRoute en toda la red de un extremo a otro. Esto incluye mantener la redundancia dentro de la red local y la redundancia dentro del proveedor de servicios. Garantizar la redundancia en estas partes de la arquitectura significa que no debe tener un único punto de error.

Asegúrese de que BFD (detección de reenvío bidireccional) está habilitado y configurado.

Habilitar la detección de reenvío bidireccional (BFD) a través de ExpressRoute puede acelerar la detección de errores de vínculo entre los dispositivos MSEE y los enrutadores en los que está configurado el circuito ExpressRoute. Microsoft recomienda configurar los dispositivos Customer Premises Edge (CPE) con BFD. ExpressRoute se puede configurar a través de los dispositivos de enrutamiento perimetrales o los dispositivos de enrutamiento Partner Edge. BFD está habilitado de forma predeterminada en los dispositivos MSEE del lado Microsoft.

Recomendaciones de puerta de enlace de ExpressRoute

Planeamiento de la puerta de enlace de red virtual

Cree puertas de enlace de red virtual con redundancia de zona para mejorar la resistencia y planee puertas de enlace de red virtuales en diferentes regiones pensando en la recuperación ante desastres y la alta disponibilidad. Al usar puertas de enlace con redundancia de zona, puede beneficiarse de la resistencia de zona para acceder a sus servicios críticos y escalables en Azure.

Migración a puertas de enlace de ExpressRoute con redundancia de zona

La experiencia de migración de puertas de enlace guiada facilita la migración desde una SKU no habilitada para Az hasta una puerta de enlace de SKU habilitada para Az. Esta característica permite la creación de una puerta de enlace de red virtual adicional dentro de la misma subred de puerta de enlace. Durante el proceso de migración, Azure transfiere las configuraciones del plano de control y de la ruta de acceso de datos de la puerta de enlace existente a la nueva.

Recomendaciones de recuperación ante desastres y alta disponibilidad

Habilitación de alta disponibilidad y recuperación ante desastres

Para maximizar la disponibilidad, tanto el cliente como los segmentos del proveedor de servicios en el circuito ExpressRoute deben diseñarse para lograr disponibilidad y resistencia. Para la recuperación ante desastres, planee escenarios de interrupciones de servicio regionales debido a calamidades naturales, por ejemplo. Implemente un diseño sólido de recuperación ante desastres para varios circuitos configurados mediante diferentes ubicaciones de emparejamiento en diferentes regiones. Para más información, consulte Diseño para la recuperación ante desastres.

Planeamiento de la redundancia geográfica

Para planear la recuperación ante desastres, se recomienda configurar circuitos ExpressRoute en varias ubicaciones y regiones de emparejamiento. Se pueden crear circuitos ExpressRoute en la misma área metropolitana o en otras distintas, y se pueden usar diferentes proveedores de servicios para diversas rutas a través de cada circuito. Los circuitos ExpressRoute con redundancia geográfica se usan para crear una conectividad de red back-end sólida para la recuperación ante desastres. Para más información, consulte Diseño de alta disponibilidad.

Nota:

No se recomienda usar una VPN de sitio a sitio como solución de copia de seguridad para la conectividad de ExpressRoute cuando se trabaja con cargas de trabajo críticas, con un uso intensivo de ancho de banda o sensibles a la latencia. En esos casos, es aconsejable diseñar para la recuperación ante desastres con resistencia multisitio de ExpressRoute a fin de garantizar la máxima disponibilidad.

Emparejamiento de redes virtuales para la conectividad entre redes virtuales

El emparejamiento de red virtual (VNet) proporciona un método más eficaz y directo, lo que permite a los servicios de Azure comunicarse entre redes virtuales sin necesidad de una puerta de enlace de red virtual, saltos adicionales o el tránsito a través de la red pública de Internet. Para establecer la conectividad entre redes virtuales, se debe implementar el emparejamiento de red virtual para obtener el mejor rendimiento posible. Para más información, consulte Emparejamiento de redes virtuales de Azure y Crear, cambiar o eliminar un emparejamiento de red virtual.

Recomendaciones de supervisión y alertas

Configuración de supervisión y alertas para circuitos ExpressRoute

Como línea base, se recomienda configurar Network Insights en Azure Monitor para ver todas las métricas de circuitos ExpressRoute, incluido ExpressRoute Direct y Global Reach. Dentro de la tarjeta de circuitos, puede visualizar las topologías y dependencias de emparejamientos, conexiones y puertas de enlace. La información disponible para los circuitos incluye disponibilidad, rendimiento y rechazo de paquetes.

Configuración de alertas de estado del servicio para las notificaciones de mantenimiento de circuitos ExpressRoute

ExpressRoute usa Azure Service Health para notificarle el mantenimiento de circuitos ExpressRoute planeado y próximo. Con Service Health, puede ver el mantenimiento planeado y anterior en Azure Portal junto con la configuración de alertas y notificaciones que mejor se adapte a sus necesidades. En Service Health, puede ver el mantenimiento planeado y pasado. También puede establecer alertas para recibir una notificación del próximo mantenimiento.

Configuración de Connection Monitor para ExpressRoute

Connection Monitor es una solución de supervisión de red basada en la nube que supervisa la conectividad entre las implementaciones de nube de Azure y las ubicaciones locales (sucursales, etc.) Connection Monitor es una solución basada en agente.

Configuración de la supervisión y alertas de estado de la puerta de enlace

Configure la supervisión mediante la disponibilidad, el rendimiento y la escalabilidad de la puerta de enlace de Azure Monitor para ExpressRoute. Al implementar una puerta de enlace de ExpressRoute, Azure administra el proceso y las funciones de la puerta de enlace. Hay varias métricas de puerta de enlace disponibles para comprender mejor el rendimiento de la puerta de enlace.