ExpressRoute ile yüksek kullanılabilirlik için tasarlamaDesigning for high availability with ExpressRoute

ExpressRoute, Microsoft kaynaklarına yönelik taşıyıcı sınıfı özel ağ bağlantısı sağlamak için yüksek kullanılabilirlik için tasarlanmıştır.ExpressRoute is designed for high availability to provide carrier grade private network connectivity to Microsoft resources. Diğer bir deyişle, Microsoft ağı içindeki ExpressRoute yolunda tek bir hata noktası yoktur.In other words, there is no single point of failure in the ExpressRoute path within Microsoft network. Kullanılabilirliği en üst düzeye çıkarmak için, ExpressRoute devrenizin müşterisi ve hizmet sağlayıcı segmenti de yüksek kullanılabilirlik için de tasarlanmıştır.To maximize the availability, the customer and the service provider segment of your ExpressRoute circuit should also be architected for high availability. Bu makalede, ilk olarak bir ExpressRoute kullanarak sağlam ağ bağlantısı oluşturmaya yönelik ağ mimarisi konularına bakalım, ardından ExpressRoute bağlantı hattının yüksek oranda kullanılabilirliğini geliştirmeye yardımcı olacak ince ayar özelliklerine bakalım.In this article, first let's look into network architecture considerations for building robust network connectivity using an ExpressRoute, then let's look into the fine-tuning features that help you to improve the high availability of your ExpressRoute circuit.

Mimari konularıArchitecture considerations

Aşağıdaki şekilde, bir ExpressRoute bağlantı hattının kullanılabilirliğini en üst düzeye çıkarmak için bir ExpressRoute devresi kullanarak bağlanmak için önerilen yol gösterilmektedir.The following figure illustrates the recommended way to connect using an ExpressRoute circuit for maximizing the availability of an ExpressRoute circuit.

[![1]][1][![1]][1]

Yüksek kullanılabilirlik için, ExpressRoute bağlantı hattının, uçtan uca ağ genelinde yedekliliğe karşı korunması önemlidir.For high availability, it's essential to maintain the redundancy of the ExpressRoute circuit throughout the end-to-end network. Diğer bir deyişle, şirket içi ağınızda yedekliliğe sahip olmanız ve hizmet sağlayıcı ağınız içindeki yedekliliğe güvenmemeniz gerekir.In other words, you need to maintain redundancy within your on-premises network, and shouldn't compromise redundancy within your service provider network. En düşük düzeyde yedekliliğe sahip olmak, tek bir ağ arızasından kaçınarak.Maintaining redundancy at the minimum implies avoiding single point of network failures. Ağ cihazları için yedekli güç ve soğutma olması, yüksek kullanılabilirliği daha da iyileştirir.Having redundant power and cooling for the network devices will further improve the high availability.

İlk mil fiziksel katman tasarımı konularıFirst mile physical layer design considerations

Hem bir ExpressRoute devresine ait birincil ve ikincil bağlantıyı aynı müşteri şirket Ekipmanı (CPE) üzerinde sonlandırabilirsiniz, şirket içi ağınızda yüksek kullanılabilirliğe sahip olursunuz.If you terminate both the primary and secondary connections of an ExpressRoute circuits on the same Customer Premises Equipment (CPE), you're compromising the high availability within your on-premises network. Ayrıca, hem birincil hem de ikincil bağlantıyı aynı bir CPE bağlantı noktası üzerinden yapılandırırsanız (farklı alt arabirimler altında iki bağlantıyı sonlandırarak ya da iş ortağı ağı içindeki iki bağlantıyı birleştirerek), iş ortağını zorlıyoruz Ayrıca, ağ kesimlerinde yüksek kullanılabilirlik sağlamak için.Additionally, if you configure both the primary and secondary connections via the same port of a CPE (either by terminating the two connections under different subinterfaces or by merging the two connections within the partner network), you're forcing the partner to compromise high availability on their network segment as well. Bu uzlaşma aşağıdaki şekilde gösterilmiştir.This compromise is illustrated in the following figure.

[![2]][2][![2]][2]

Öte yandan, bir ExpressRoute devresine ait birincil ve ikincil bağlantıları farklı coğrafi konumlarda sona erdirdiğinizde, bağlantının ağ performansını tehlikeye atmanız gerekebilir.On the other hand, if you terminate the primary and the secondary connections of an ExpressRoute circuits in different geographical locations, then you could be compromising the network performance of the connectivity. Trafik, birincil ve farklı coğrafi konumlarda sonlandırılan ikincil bağlantılar arasında etkin bir şekilde yük dengelemesi yapıldıysa, iki yol arasındaki ağ gecikmesi üzerinde potansiyel büyük farklılık, ağın büyük bir sonucudur mının.If traffic is actively load balanced across the primary and the secondary connections that are terminated on different geographical locations, potential substantial difference in network latency between the two paths would result in suboptimal network performance.

Coğrafi olarak yedekli Tasarım konuları için bkz. ExpressRoute ile olağanüstü durum kurtarma Için tasarlama.For geo-redundant design considerations, see Designing for disaster recovery with ExpressRoute.

Etkin-etkin bağlantılarActive-active connections

Microsoft ağı, ExpressRoute devrelerinin birincil ve ikincil bağlantılarını etkin-etkin modda çalışacak şekilde yapılandırılmıştır.Microsoft network is configured to operate the primary and secondary connections of ExpressRoute circuits in active-active mode. Ancak, rota reklamlarınız aracılığıyla bir ExpressRoute devresine ait gereksiz bağlantıları aktif-pasif modda çalışacak şekilde zorlayabilirsiniz.However, through your route advertisements, you can force the redundant connections of an ExpressRoute circuit to operate in active-passive mode. Daha özel yollar ve BGP 'yi önceden bekleyen olarak bildirme, bir yolu diğeri üzerinde tercih etmek için kullanılan yaygın tekniklerdir.Advertising more specific routes and BGP AS path prepending are the common techniques used to make one path preferred over the other.

Yüksek kullanılabilirliği artırmak için, bir ExpressRoute bağlantı hattının her ikisini de etkin-etkin modda çalıştırmak önerilir.To improve high availability, it's recommended to operate both the connections of an ExpressRoute circuit in active-active mode. Bağlantıların etkin-etkin modda çalışmasına izin verirseniz, Microsoft ağ trafiği her akış temelinde bağlantılar üzerinden dengeleyebilir.If you let the connections operate in active-active mode, Microsoft network will load balance the traffic across the connections on per-flow basis.

Aktif-pasif modda bir ExpressRoute devresine ait birincil ve ikincil bağlantıları çalıştırmak, her iki bağlantının da etkin yoldaki bir hatayı takip eden riskini olumsuz yönde çalıştırmıyor.Running the primary and secondary connections of an ExpressRoute circuit in active-passive mode face the risk of both the connections failing following a failure in the active path. Üzerinde geçiş sırasında oluşan yaygın nedenler, pasif bağlantının etkin yönetiminin ve eski yolların pasif bağlantısının olmamasından kaynaklanır.The common causes for failure on switching over are lack of active management of the passive connection, and passive connection advertising stale routes.

Alternatif olarak, bir ExpressRoute devresine ait birincil ve ikincil bağlantıları etkin-etkin modda çalıştırmak, bir ExpressRoute bağlantı hatasından sonra, akışların yalnızca yarısı ve yeniden yönlendirilme hakkında bilgi elde edin.Alternatively, running the primary and secondary connections of an ExpressRoute circuit in active-active mode, results in only about half the flows failing and getting rerouted, following an ExpressRoute connection failure. Bu nedenle, etkin-etkin mod, kurtarma süresini (MTTR) önemli ölçüde artırmaya yardımcı olur.Thus, active-active mode will significantly help improve the Mean Time To Recover (MTTR).

Microsoft eşlemesi için NATNAT for Microsoft peering

Microsoft eşlemesi, genel uç noktaları arasındaki iletişim için tasarlanmıştır.Microsoft peering is designed for communication between public end-points. Yaygın olarak, şirket içi özel uç noktalar, Microsoft eşlemesi üzerinden iletişim kurmadan önce müşteri veya iş ortağı ağı üzerinde genel IP ile çevrilmiş (NATed) ağ adresidir.So commonly, on-premises private endpoints are Network Address Translated (NATed) with public IP on the customer or partner network before they communicate over Microsoft peering. Etkin-etkin modda hem birincil hem de ikincil bağlantıları kullandığınız varsayılarak, burada ve NAT, ExpressRoute bağlantılarından birindeki bir başarısızlığı izleyen ne kadar hızlı bir şekilde kurtardığınız konusunda ne kadar hızlı bir şekilde etkilenirsiniz.Assuming you use both the primary and secondary connections in active-active mode, where and how you NAT has an impact on how quickly you recover following a failure in one of the ExpressRoute connections. İki farklı NAT seçeneği aşağıdaki şekilde gösterilmiştir:Two different NAT options are illustrated in the following figure:

[![03]][3][![3]][3]

1. seçenekte, ExpressRoute 'ın birincil ve ikincil bağlantıları arasında trafik bölünmeden sonra NAT uygulanır.In the option 1, NAT is applied after splitting the traffic between the primary and secondary connections of the ExpressRoute. NAT 'nin durum bilgisi olan gereksinimlerini karşılamak için, birincil ve ikincil cihazlar arasında bağımsız NAT havuzları kullanılır. böylece, dönüş trafiği akışın altında bulunduğu uç cihaza ulaşır.To meet the stateful requirements of NAT, independent NAT pools are used between the primary and the secondary devices so that the return traffic would arrive to the same edge device through which the flow egressed.

2. seçenekte, ExpressRoute 'ın birincil ve ikincil bağlantıları arasında trafiği bölmek için ortak bir NAT havuzu kullanılır.In the option 2, a common NAT pool is used before splitting the traffic between the primary and secondary connections of the ExpressRoute. Trafiği bölmeden önce ortak NAT havuzunun fark edilmesi, yüksek kullanılabilirliğe güvendiğinden, tek bir hata noktası geldiğini ifade etmez.It's important to make the distinction that the common NAT pool before splitting the traffic does not mean introducing single-point of failure thereby compromising high-availability.

1 seçeneğiyle, bir ExpressRoute bağlantı hatasından sonra karşılık gelen NAT havuzuna ulaşma özelliği bozulur.With the option 1, following an ExpressRoute connection failure, ability to reach the corresponding NAT pool is broken. Bu nedenle, tüm bozuk akışların, karşılık gelen pencere zaman aşımından sonra TCP veya uygulama katmanı tarafından yeniden oluşturulması gerekir.Therefore, all the broken flows have to be re-established either by TCP or application layer following the corresponding window timeout. Şirket içi sunuculardan herhangi birinin ön eki için NAT havuzlarından herhangi biri kullanılırsa ve ilgili bağlantı başarısız olursa, bağlantı düzeltilene kadar şirket içi sunuculara Azure 'dan ulaşılamaz.If either of the NAT pools are used to frontend any of the on-premises servers and if the corresponding connectivity were to fail, the on-premises servers cannot be reached from Azure until the connectivity is fixed.

2. seçenek ile, NAT, birincil veya ikincil bağlantı hatasından sonra bile erişilebilir.Whereas with the option 2, the NAT is reachable even after a primary or secondary connection failure. Bu nedenle, ağ katmanının kendisi paketleri yeniden yönlendirebilir ve hatanın ardından daha hızlı kurtarmaya yardımcı olabilir.Therefore, the network layer itself can reroute the packets and help faster recovery following the failure.

Not

NAT seçeneği 1 (birincil ve ikincil ExpressRoute bağlantıları için bağımsız NAT havuzları) kullanıyorsanız ve bir IP adresi bağlantı noktasını NAT havuzundan bir şirket içi sunucuya eşlediğinizde, karşılık gelen bağlantı başarısız olur.If you use NAT option 1 (independent NAT pools for primary and secondary ExpressRoute connections) and map a port of an IP address from one of the NAT pool to an on-premises server, the server will not be reachable via the ExpressRoute circuit when the corresponding connection fails.

Özel eşleme için ince ayar özellikleriFine-tuning features for private peering

Bu bölümde, ExpressRoute devrenizin yüksek oranda kullanılabilir hale getirmenize yardımcı olacak isteğe bağlı (Azure dağıtımınıza ve ne kadar gizli olduğuna bağlı olarak).In this section, let us review optional (depending on your Azure deployment and how sensitive you're to MTTR) features that help improve high availability of your ExpressRoute circuit. Özellikle, ExpressRoute sanal ağ geçitleri ve çift yönlü Iletme algılaması (BFD) için bölgeye duyarlı dağıtımı gözden geçirelim.Specifically, let's review zone-aware deployment of ExpressRoute virtual network gateways, and Bidirectional Forwarding Detection (BFD).

Kullanılabilirlik alanına duyarlı ExpressRoute sanal ağ geçitleriAvailability Zone aware ExpressRoute virtual network gateways

Bir Azure bölgesindeki kullanılabilirlik bölgesi bir hata etki alanının ve bir güncelleştirme etki alanının birleşimidir.An Availability Zone in an Azure region is a combination of a fault domain and an update domain. Bölgesel olarak yedekli Azure IaaS dağıtımını kabul ediyorsanız, ExpressRoute özel eşlemesini sonlandıran, bölgesel olarak yedekli sanal ağ geçitlerini da yapılandırmak isteyebilirsiniz.If you opt for zone-redundant Azure IaaS deployment, you may also want to configure zone-redundant virtual network gateways that terminate ExpressRoute private peering. Daha fazla bilgi için bkz. Azure kullanılabilirlik alanları bölgesel olarak yedekli sanal ağ geçitleri hakkında.To learn further, see About zone-redundant virtual network gateways in Azure Availability Zones. Bölgesel olarak yedekli sanal ağ geçidini yapılandırmak için, bkz. Azure kullanılabilirlik alanları bölge yedekli sanal ağ geçidi oluşturma.To configure zone-redundant virtual network gateway, see Create a zone-redundant virtual network gateway in Azure Availability Zones.

Hata algılama süresini iyileştirmeImproving failure detection time

ExpressRoute, özel eşleme üzerinde BFD 'yi destekler.ExpressRoute supports BFD over private peering. BFD, Microsoft Enterprise Edge (MSEE) ile şirket içi ve BGP komşuları arasındaki, bir saniyeden kısa bir süredir 3 dakikadan (varsayılan) arasında katman 2 ağ üzerinden hatanın algılanma süresini azaltır.BFD reduces detection time of failure over the Layer 2 network between Microsoft Enterprise Edge (MSEEs) and their BGP neighbors on the on-premises side from about 3 minutes (default) to less than a second. Hızlı hata algılama süresi hastening hata kurtarmaya yardımcı olur.Quick failure detection time helps hastening failure recovery. Daha fazla bilgi için bkz. ExpressRoute üzerinde BFD 'Yi yapılandırma.To learn further, see Configure BFD over ExpressRoute.

Sonraki adımlarNext steps

Bu makalede, bir ExpressRoute bağlantı hattı bağlantısının yüksek kullanılabilirlik için nasıl tasarlanacağını tartıştık.In this article, we discussed how to design for high availability of an ExpressRoute circuit connectivity. Bir ExpressRoute devre eşleme noktası, coğrafi bir konuma sabitlenmiştir ve bu nedenle tüm konumu etkileyen çok zararlı bir hatadan etkilenebilir.An ExpressRoute circuit peering point is pinned to a geographical location and therefore could be impacted by catastrophic failure that impacts the entire location.

Microsoft omurgasına coğrafi olarak yedekli ağ bağlantısı oluşturmaya yönelik tasarım konuları için, tüm bölgeyi etkileyen çok zararlı hatalara yol açabilir, bkz. ExpressRoute özel eşlemesi ile olağanüstü durum kurtarma Için tasarlama.For design considerations to build geo-redundant network connectivity to Microsoft backbone that can withstand catastrophic failures, which impact an entire region, see Designing for disaster recovery with ExpressRoute private peering.

[]: ./media/designing-for-high-availability-with-expressroute/exr-reco.png "ExpressRoute kullanarak bağlanmak için önerilen 1 yol" [1]: ./media/designing-for-high-availability-with-expressroute/exr-reco.png "Recommended way to connect using ExpressRoute" [2]: ./media/designing-for-high-availability-with-expressroute/suboptimal-lastmile-connectivity.png "en son mil bağlantıyı" etkinleştir [3]: ./media/designing-for-high-availability-with-expressroute/nat-options.png "NAT seçeneği"