Progettazione per il ripristino di emergenza con peering privato ExpressRouteDesigning for disaster recovery with ExpressRoute private peering

ExpressRoute è progettato per garantire un'elevata disponibilità per la connettività di rete privata di livello vettore alle risorse Microsoft.ExpressRoute is designed for high availability to provide carrier grade private network connectivity to Microsoft resources. In altre parole, non esiste un singolo punto di errore nel percorso ExpressRoute all'interno della rete Microsoft.In other words, there is no single point of failure in the ExpressRoute path within Microsoft network. Per considerazioni sulla progettazione per ottimizzare la disponibilità di un circuito ExpressRoute, vedere progettazione per la disponibilità elevata con ExpressRoute.For design considerations to maximize the availability of an ExpressRoute circuit, see Designing for high availability with ExpressRoute.

Tuttavia, prendendo in considerazione l'Adagio più comune diMurphy, inquesto articolo, in questo articolo ci concentreremo sulle soluzioni che vanno oltre gli errori che possono essere risolti usando un unico circuito ExpressRoute.However, taking Murphy's popular adage--if anything can go wrong, it will--into consideration, in this article let us focus on solutions that go beyond failures that can be addressed using a single ExpressRoute circuit. In altre parole, in questo articolo vengono esaminate le considerazioni sull'architettura di rete per la creazione di una connettività di rete back-end affidabile per il ripristino di emergenza usando circuiti ExpressRoute con ridondanza geografica.In other words, in this article let us look into network architecture considerations for building robust backend network connectivity for disaster recovery using geo-redundant ExpressRoute circuits.

Necessità di una soluzione di connettività ridondanteNeed for redundant connectivity solution

Sono disponibili possibilità e istanze in cui un intero servizio a livello di area (ovvero Microsoft, provider di servizi di rete, cliente o altri provider di servizi cloud) viene ridotto.There are possibilities and instances where an entire regional service (be it that of Microsoft, network service providers, customer, or other cloud service providers) gets degraded. La causa principale di questo effetto sul servizio a livello di area è la calamità naturale.The root cause for such regional wide service impact include natural calamity. Per la continuità aziendale e per le applicazioni mission-critical è quindi importante pianificare il ripristino di emergenza.Therefore, for business continuity and mission critical applications it is important to plan for disaster recovery.

Indipendentemente dal fatto che si eseguano applicazioni mission-critical in un'area di Azure o in locale o in qualsiasi altra posizione, è possibile usare un'altra area di Azure come sito di failover.Irrespective of whether you run your mission critical applications in an Azure region or on-premises or anywhere else, you can use another Azure region as your failover site. Gli articoli seguenti illustrano il ripristino di emergenza dalle applicazioni e dalle prospettive di accesso front-end:The following articles addresses disaster recovery from applications and frontend access perspectives:

Se si fa affidamento sulla connettività ExpressRoute tra la rete locale e Microsoft per le operazioni cruciali, il piano di ripristino di emergenza deve includere anche la connettività di rete con ridondanza geografica.If you rely on ExpressRoute connectivity between your on-premises network and Microsoft for mission critical operations, your disaster recovery plan should also include geo-redundant network connectivity.

Problemi relativi all'uso di più circuiti ExpressRouteChallenges of using multiple ExpressRoute circuits

Quando si esegue l'interconnessione dello stesso set di reti utilizzando più di una connessione, si introducono percorsi paralleli tra le reti.When you interconnect the same set of networks using more than one connection, you introduce parallel paths between the networks. I percorsi paralleli, quando non progettati correttamente, possono causare il routing asimmetrico.Parallel paths, when not properly architected, could lead to asymmetrical routing. Se sono presenti entità con stato (ad esempio, NAT, firewall) nel percorso, il routing asimmetrico potrebbe bloccare il flusso del traffico.If you have stateful entities (for example, NAT, firewall) in the path, asymmetrical routing could block traffic flow. In genere, tramite il percorso di peering privato di ExpressRoute non si arriveranno entità con stato, ad esempio NAT o firewall.Typically, over the ExpressRoute private peering path you won't come across stateful entities such as NAT or Firewalls. Pertanto, il routing asimmetrico sul peering privato ExpressRoute non blocca necessariamente il flusso del traffico.Therefore, asymmetrical routing over ExpressRoute private peering does not necessarily block traffic flow.

Tuttavia, se si esegue il bilanciamento del carico del traffico tra percorsi paralleli con ridondanza geografica, indipendentemente dal fatto che si disponga o meno di entità con stato, si verificheranno prestazioni di rete incoerenti.However, if you load balance traffic across geo-redundant parallel paths, irrespective of whether you have stateful entities or not, you would experience inconsistent network performance. Questo articolo illustra come risolvere questi problemi.In this article, let's discuss how to address these challenges.

Considerazioni sulla rete locale da piccole a medieSmall to medium on-premises network considerations

Si prenda in considerazione la rete di esempio illustrata nel diagramma seguente.Let's consider the example network illustrated in the following diagram. Nell'esempio viene stabilita la connettività ExpressRoute con ridondanza geografica tra una posizione locale di Contoso e VNet di Contoso in un'area di Azure.In the example, geo-redundant ExpressRoute connectivity is established between a Contoso's on-premises location and Contoso's VNet in an Azure region. Nel diagramma la linea verde continua indica il percorso preferito (tramite ExpressRoute 1) e l'oggetto punteggiato rappresenta il percorso di standby (tramite ExpressRoute 2).In the diagram, solid green line indicates preferred path (via ExpressRoute 1) and the dotted one represents stand-by path (via ExpressRoute 2).

11

Quando si progetta la connettività ExpressRoute per il ripristino di emergenza, è necessario prendere in considerazione quanto segue:When you are designing ExpressRoute connectivity for disaster recovery, you need to consider:

  • uso di circuiti ExpressRoute con ridondanza geograficausing geo-redundant ExpressRoute circuits
  • uso di diverse reti di provider di servizi per diversi circuiti ExpressRouteusing diverse service provider network(s) for different ExpressRoute circuit
  • progettazione di ognuno dei circuiti ExpressRoute per la disponibilità elevatadesigning each of the ExpressRoute circuit for high availability
  • terminazione del circuito ExpressRoute diverso in una posizione diversa nella rete del clienteterminating the different ExpressRoute circuit in different location on the customer network

Per impostazione predefinita, se si annunciano le route in modo identico su tutti i percorsi di ExpressRoute, Azure bilancia il carico del traffico associato locale in tutti i percorsi di ExpressRoute usando il routing a più percorsi (ECMP) a costo uguale.By default, if you advertise routes identically over all the ExpressRoute paths, Azure will load-balance on-premises bound traffic across all the ExpressRoute paths using Equal-cost multi-path (ECMP) routing.

Tuttavia, con i circuiti ExpressRoute con ridondanza geografica è necessario prendere in considerazione le diverse prestazioni di rete con percorsi di rete diversi, in particolare per la latenza di rete.However, with the geo-redundant ExpressRoute circuits we need to take into consideration different network performances with different network paths (particularly for network latency). Per ottenere prestazioni di rete più coerenti durante il normale funzionamento, è consigliabile preferire il circuito ExpressRoute che offre la latenza minima.To get more consistent network performance during normal operation, you may want to prefer the ExpressRoute circuit that offers the minimal latency.

È possibile influenzare Azure per preferire un circuito ExpressRoute a un altro usando una delle tecniche seguenti, elencate in ordine di efficienza:You can influence Azure to prefer one ExpressRoute circuit over another one using one of the following techniques (listed in the order of effectiveness):

  • inoltro più specifico della pubblicità sul circuito ExpressRoute preferito rispetto ad altri circuiti ExpressRouteadvertising more specific route over the preferred ExpressRoute circuit compared to other ExpressRoute circuit(s)
  • configurazione di un peso di connessione superiore per la connessione che collega la rete virtuale al circuito ExpressRoute preferitoconfiguring higher Connection Weight on the connection that links the virtual network to the preferred ExpressRoute circuit
  • annuncio delle route su un circuito ExpressRoute meno preferibile con un percorso più lungo (come percorso anteposto)advertising the routes over less preferred ExpressRoute circuit with longer AS Path (AS Path prepend)

Route più specificheMore specific route

Il diagramma seguente illustra la selezione del percorso ExpressRoute usando un annuncio di route più specifico.The following diagram illustrates influencing ExpressRoute path selection using more specific route advertisement. Nell'esempio illustrato, l'intervallo IP di Contoso locale/24 viene annunciato come due intervalli di indirizzi tramite il percorso preferito (ExpressRoute 1) e As/24 tramite il percorso autonomo (ExpressRoute 2).In the illustrated example, Contoso on-premises /24 IP range is advertised as two /25 address ranges via the preferred path (ExpressRoute 1) and as /24 via the stand-by path (ExpressRoute 2).

22

Poiché/25 è più specifico, rispetto a/24, Azure invia il traffico destinato a 10.1.11.0/24 tramite ExpressRoute 1 nello stato normale.Because /25 is more specific, compared to /24, Azure would send the traffic destined to 10.1.11.0/24 via ExpressRoute 1 in the normal state. Se entrambe le connessioni di ExpressRoute 1 si arrestano, il VNet visualizzerà l'annuncio route 10.1.11.0/24 solo tramite ExpressRoute 2; e pertanto il circuito standby viene usato in questo stato di errore.If both the connections of ExpressRoute 1 go down, then the VNet would see the 10.1.11.0/24 route advertisement only via ExpressRoute 2; and therefore the standby circuit is used in this failure state.

Peso della connessioneConnection weight

Lo screenshot seguente illustra la configurazione del peso di una connessione ExpressRoute tramite portale di Azure.The following screenshot illustrates configuring the weight of an ExpressRoute connection via Azure portal.

33

Il diagramma seguente illustra la selezione del percorso ExpressRoute con il peso della connessione.The following diagram illustrates influencing ExpressRoute path selection using connection weight. Il peso predefinito della connessione è 0.The default connection weight is 0. Nell'esempio seguente, il peso della connessione per ExpressRoute 1 è configurato come 100.In the example below, the weight of the connection for ExpressRoute 1 is configured as 100. Quando un VNet riceve un prefisso di route annunciato tramite più di un circuito ExpressRoute, VNet preferisce la connessione con il peso più alto.When a VNet receives a route prefix advertised via more than one ExpressRoute circuit, the VNet will prefer the connection with the highest weight.

44

Se entrambe le connessioni di ExpressRoute 1 si arrestano, il VNet visualizzerà l'annuncio route 10.1.11.0/24 solo tramite ExpressRoute 2; e pertanto il circuito standby viene usato in questo stato di errore.If both the connections of ExpressRoute 1 go down, then the VNet would see the 10.1.11.0/24 route advertisement only via ExpressRoute 2; and therefore the standby circuit is used in this failure state.

COME percorso antepostoAS path prepend

Nel diagramma seguente viene illustrata la selezione del percorso ExpressRoute utilizzando come percorso anteposto.The following diagram illustrates influencing ExpressRoute path selection using AS path prepend. Nel diagramma l'annuncio della route su ExpressRoute 1 indica il comportamento predefinito di eBGP.In the diagram, the route advertisement over ExpressRoute 1 indicates the default behavior of eBGP. Nell'annuncio della route su ExpressRoute 2, il numero ASN della rete locale viene anteposto anche al percorso AS della route.On the route advertisement over ExpressRoute 2, the on-premises network's ASN is prepended additionally on the route's AS path. Quando la stessa route viene ricevuta attraverso più circuiti ExpressRoute, in base al processo di selezione della route eBGP, VNet preferisce la route con il percorso più breve.When the same route is received through multiple ExpressRoute circuits, per the eBGP route selection process, VNet would prefer the route with the shortest AS path.

55

Se entrambe le connessioni di ExpressRoute 1 si arrestano, il VNet visualizzerà l'annuncio route 10.1.11.0/24 solo tramite ExpressRoute 2.If both the connections of ExpressRoute 1 go down, then the VNet would see the 10.1.11.0/24 route advertisement only via ExpressRoute 2. In modo consequenziale, il percorso più lungo diventa irrilevante.Consequentially, the longer AS path would become irrelevant. Pertanto, il circuito standby verrà usato in questo stato di errore.Therefore, the standby circuit would be used in this failure state.

Usando una qualsiasi delle tecniche, se si influisce su Azure per preferire uno dei ExpressRoute rispetto ad altri, è anche necessario assicurarsi che la rete locale preferisca anche lo stesso percorso ExpressRoute per il traffico associato di Azure per evitare flussi asimmetrici.Using any of the techniques, if you influence Azure to prefer one of your ExpressRoute over others, you also need to ensure the on-premises network also prefer the same ExpressRoute path for Azure bound traffic to avoid asymmetric flows. In genere, il valore della preferenza locale viene usato per influenzare la rete locale per preferire un circuito ExpressRoute rispetto ad altri.Typically, local preference value is used to influence on-premises network to prefer one ExpressRoute circuit over others. Preferenza locale è una metrica interna BGP (iBGP).Local preference is an internal BGP (iBGP) metric. È preferibile la route BGP con il valore di preferenza locale più elevato.The BGP route with the highest local preference value is preferred.

Importante

Quando si usano determinati circuiti ExpressRoute come stand-by, è necessario gestirli attivamente e testare periodicamente l'operazione di failover.When you use certain ExpressRoute circuits as stand-by, you need to actively manage them and periodically test failover operation.

Rete aziendale distribuita di grandi dimensioniLarge distributed enterprise network

Quando si dispone di una rete aziendale distribuita di grandi dimensioni, è probabile che siano presenti più circuiti ExpressRoute.When you have a large distributed enterprise network, you're likely to have multiple ExpressRoute circuits. In questa sezione viene illustrato come progettare il ripristino di emergenza usando i circuiti ExpressRoute Active-Active, senza che siano necessari circuiti stand-by aggiuntivi.In this section, let's see how to design disaster recovery using the active-active ExpressRoute circuits, without needing additional stand-by circuits.

Si prenda in considerazione l'esempio illustrato nella figura seguente.Let's consider the example illustrated in the following diagram. Nell'esempio Contoso dispone di due percorsi locali connessi a due distribuzioni di Contoso IaaS in due diverse aree di Azure tramite circuiti ExpressRoute in due diverse località di peering.In the example, Contoso has two on-premises locations connected to two Contoso IaaS deployment in two different Azure regions via ExpressRoute circuits in two different peering locations.

66

Il modo in cui si progetta il ripristino di emergenza influisca sulla modalità di indirizzamento del traffico tra le aree geografiche tra le località (regione1/region2 e Location2/location1).How we architect the disaster recovery has an impact on how cross regional to cross location (region1/region2 to location2/location1) traffic is routed. Consideriamo due diverse architetture di emergenza che indirizzano in modo diverso il traffico tra le aree geografiche.Let's consider two different disaster architectures that routes cross region-location traffic differently.

Scenario 1Scenario 1

Nel primo scenario viene progettato il ripristino di emergenza, in modo che tutto il traffico tra un'area di Azure e la rete locale scorra attraverso il circuito ExpressRoute locale nello stato stazionario.In the first scenario, let's design disaster recovery such that all the traffic between an Azure region and on-premises network flow through the local ExpressRoute circuit in the steady state. Se il circuito ExpressRoute locale ha esito negativo, il circuito ExpressRoute remoto viene usato per tutti i flussi di traffico tra Azure e la rete locale.If the local ExpressRoute circuit fails, then the remote ExpressRoute circuit is used for all the traffic flows between Azure and on-premises network.

Il diagramma seguente illustra lo scenario 1.Scenario 1 is illustrated in the following diagram. Nel diagramma le linee verdi indicano i percorsi per il flusso del traffico tra VNet1 e le reti locali.In the diagram, green lines indicate paths for traffic flow between VNet1 and on-premises networks. Le linee blu indicano i percorsi per il flusso del traffico tra VNet2 e le reti locali.The blue lines indicate paths for traffic flow between VNet2 and on-premises networks. Le linee continue indicano il percorso desiderato nello stato stazionario e le linee tratteggiate indicano il percorso del traffico nell'errore del circuito ExpressRoute corrispondente che trasporta il flusso di traffico a stato stazionario.Solid lines indicate desired path in the steady-state and the dashed lines indicate traffic path in the failure of the corresponding ExpressRoute circuit that carries steady-state traffic flow.

77

È possibile progettare lo scenario usando il peso della connessione per influenzare reti virtuali per preferire la connessione al percorso di peering locale ExpressRoute per il traffico associato alla rete locale.You can architect the scenario using connection weight to influence VNets to prefer connection to local peering location ExpressRoute for on-premises network bound traffic. Per completare la soluzione, è necessario garantire il flusso del traffico inverso simmetrico.To complete the solution, you need to ensure symmetrical reverse traffic flow. È possibile usare la preferenza locale nella sessione iBGP tra i router BGP (in cui i circuiti ExpressRoute vengono interrotti sul lato locale) per preferire un circuito ExpressRoute.You can use local preference on the iBGP session between your BGP routers (on which ExpressRoute circuits are terminated on on-premises side) to prefer a ExpressRoute circuit. La soluzione è illustrata nella figura seguente.The solution is illustrated in the following diagram.

88

Scenario 2Scenario 2

Lo scenario 2 è illustrato nella figura seguente.The Scenario 2 is illustrated in the following diagram. Nel diagramma le linee verdi indicano i percorsi per il flusso del traffico tra VNet1 e le reti locali.In the diagram, green lines indicate paths for traffic flow between VNet1 and on-premises networks. Le linee blu indicano i percorsi per il flusso del traffico tra VNet2 e le reti locali.The blue lines indicate paths for traffic flow between VNet2 and on-premises networks. Nello stato stazionario (linee continue nel diagramma), tutto il traffico tra reti virtuali e i percorsi locali viene trasmesso tramite backbone Microsoft per la maggior parte e attraversa l'interconnessione tra percorsi locali solo nello stato di errore (linee tratteggiate in diagramma) di un ExpressRoute.In the steady-state (solid lines in the diagram), all the traffic between VNets and on-premises locations flow via Microsoft backbone for the most part, and flows through the interconnection between on-premises locations only in the failure state (dotted lines in the diagram) of an ExpressRoute.

99

La soluzione è illustrata nella figura seguente.The solution is illustrated in the following diagram. Come illustrato, è possibile progettare lo scenario usando una route più specifica (opzione 1) o il percorso come anteposto (opzione 2) per influenzare la selezione del percorso VNet.As illustrated, you can architect the scenario either using more specific route (Option 1) or AS-path prepend (Option 2) to influence VNet path selection. Per influenzare la selezione della route di rete locale per il traffico associato di Azure, è necessario configurare l'interconnessione tra la posizione locale come meno preferibile.To influence on-premises network route selection for Azure bound traffic, you need configure the interconnection between the on-premises location as less preferable. Howe è possibile configurare il collegamento di interconnessione come preferibile a seconda del protocollo di routing usato nella rete locale.Howe you configure the interconnection link as preferable depends on the routing protocol used within the on-premises network. È possibile usare la preferenza locale con iBGP o metrica con IGP (OSPF o IS-IS).You can use local preference with iBGP or metric with IGP (OSPF or IS-IS).

1010

Passaggi successiviNext steps

In questo articolo è stato illustrato come progettare per il ripristino di emergenza di una connettività di peering privato del circuito ExpressRoute.In this article, we discussed how to design for disaster recovery of an ExpressRoute circuit private peering connectivity. Gli articoli seguenti illustrano il ripristino di emergenza dalle applicazioni e dalle prospettive di accesso front-end:The following articles addresses disaster recovery from applications and frontend access perspectives: