Designa för hög tillgänglighet med ExpressRoute

ExpressRoute är utformat för hög tillgänglighet för att tillhandahålla privata nätverksanslutningar i operatörsklass till Microsoft-resurser. Det finns med andra ord ingen enskild felpunkt i ExpressRoute-sökvägen i Microsoft-nätverket. För att maximera tillgängligheten bör kunden och tjänstleverantörssegmentet för din ExpressRoute-krets också byggas för hög tillgänglighet. I den här artikeln ska vi först titta på överväganden för nätverksarkitektur för att skapa robust nätverksanslutning med hjälp av ExpressRoute. Sedan ska vi titta på finjusteringsfunktionerna som hjälper dig att förbättra ExpressRoute-kretsens höga tillgänglighet.

Anteckning

Begreppen som beskrivs i den här artikeln gäller även när en ExpressRoute-krets skapas under Virtual WAN eller utanför den.

Arkitekturöverväganden

Följande bild visar det rekommenderade sättet att ansluta med en ExpressRoute-krets för att maximera tillgängligheten för en ExpressRoute-krets.

1

För hög tillgänglighet är det viktigt att upprätthålla redundansen för ExpressRoute-kretsen i hela hela nätverket. Med andra ord måste du upprätthålla redundans i ditt lokala nätverk och bör inte äventyra redundansen i ditt tjänstleverantörsnätverk. Att upprätthålla redundans på minsta möjliga sätt innebär att undvika fel med en enskild punkt i nätverket. Om du har redundant strömförsörjning och kylning för nätverksenheterna förbättras den höga tillgängligheten ytterligare.

Designöverväganden på den första milen för fysiskt lager

Om du avslutar både de primära och sekundära anslutningarna för en ExpressRoute-krets på samma kundlokal utrustning (CPE) äventyras den höga tillgängligheten i ditt lokala nätverk. Om du dessutom konfigurerar både den primära och den sekundära anslutningen via samma port i en CPE (antingen genom att avsluta de två anslutningarna under olika undergränssnitt eller genom att sammanfoga de två anslutningarna i partnernätverket), tvingar du partnern att kompromettera hög tillgänglighet i deras nätverkssegment. Den här komprometten illustreras i följande bild.

2

Å andra sidan, om du avslutar den primära och sekundära anslutningen för en ExpressRoute-krets på olika geografiska platser, kan du äventyra nätverkets prestanda för anslutningen. Om trafiken aktivt belastningsutjämnas över den primära och de sekundära anslutningar som avslutas på olika geografiska platser, skulle en potentiell betydande skillnad i nätverksfördröjning mellan de två sökvägarna resultera i icke-optimala nätverksprestanda.

Information om geo-redundant design finns i Utforma för haveriberedskap med ExpressRoute.

Aktiv-aktiv-anslutningar

Microsoft-nätverket är konfigurerat för att använda de primära och sekundära anslutningarna för ExpressRoute-kretsar i aktivt-aktivt läge. Men via dina vägannonseringar kan du tvinga redundanta anslutningar för en ExpressRoute-krets att fungera i aktivt-passivt läge. Annonsering av mer specifika vägar och förestående BGP AS-sökväg är vanliga tekniker som används för att göra den ena vägen prioriterad framför den andra.

För att förbättra hög tillgänglighet rekommenderar vi att du använder båda anslutningarna för en ExpressRoute-krets i aktivt-aktivt läge. Om du låter anslutningarna fungera i aktivt-aktivt läge belastningsutjämnar Microsoft-nätverket trafiken mellan anslutningarna per flöde.

Att köra de primära och sekundära anslutningarna för en ExpressRoute-krets i aktivt-passivt läge riskerar båda anslutningarna att misslyckas efter ett fel i den aktiva sökvägen. De vanligaste orsakerna till fel vid växling är bristen på aktiv hantering av den passiva anslutningen och passiv anslutning som annonserar inaktuella vägar.

Du kan också köra de primära och sekundära anslutningarna för en ExpressRoute-krets i aktivt-aktivt läge, vilket resulterar i att bara ungefär hälften av flödena misslyckas och omdirigeras, efter ett ExpressRoute-anslutningsfel. Läget aktiv-aktiv bidrar därmed avsevärt till att förbättra MTTR (Mean Time To Recover).

Anteckning

Under en underhållsaktivitet eller vid oplanerade händelser som påverkar en av anslutningarna, föredrar Microsoft att använda AS-sökvägen som väntar för att tömma trafik över till den felfria anslutningen. Du måste se till att trafiken kan dirigeras via den felfria sökvägen när sökvägsförberedelserna har konfigurerats från Microsoft och nödvändig vägannonsering har konfigurerats på rätt sätt för att undvika avbrott i tjänsten.

NAT för Microsoft-peering

Microsoft-peering är utformat för kommunikation mellan offentliga slutpunkter. Lokala privata slutpunkter är alltså nätverksadressöversatt (NATed) med offentlig IP-adress i kundens eller partnernätverkets innan de kommunicerar via Microsoft-peering. Förutsatt att du använder både primära och sekundära anslutningar i aktivt-aktivt läge, där och hur din NAT påverkar hur snabbt du återställer efter ett fel i en av ExpressRoute-anslutningarna. Två olika NAT-alternativ illustreras i följande bild:

3

Alternativ 1:

NAT tillämpas när trafiken har delats mellan de primära och sekundära anslutningarna för ExpressRoute-kretsen. För att uppfylla de tillståndsfulla kraven för NAT används oberoende NAT-pooler för de primära och sekundära enheterna. Returtrafiken anländer på samma gränsenhet genom vilken flödet utgående.

Om ExpressRoute-anslutningen misslyckas bryts sedan möjligheten att nå motsvarande NAT-pool. Därför måste alla brutna nätverksflöden antingen upprättas igen av TCP eller av programlagret efter motsvarande tidsgräns för fönstret. Under felet kan Azure inte nå de lokala servrarna med hjälp av motsvarande NAT förrän anslutningen har återställts för antingen de primära eller sekundära anslutningarna för ExpressRoute-kretsen.

Alternativ 2:

En gemensam NAT-pool används innan du delar upp trafiken mellan de primära och sekundära anslutningarna för ExpressRoute-kretsen. Det är viktigt att göra skillnad på att den gemensamma NAT-poolen innan trafiken delas inte innebär att en felpunkt uppstår, eftersom den äventyras av hög tillgänglighet.

NAT-poolen kan nås även efter att den primära eller sekundära anslutningen har misslyckats. Det är därför själva nätverkslagret kan omdirigera paketen och hjälpa till att återställa snabbare efter ett fel.

Anteckning

  • Om du använder NAT-alternativ 1 (oberoende NAT-pooler för primära och sekundära ExpressRoute-anslutningar) och mappar en port för en IP-adress från en AV NAT-poolen till en lokal server kan servern inte nås via ExpressRoute-kretsen när motsvarande anslutning misslyckas.
  • Att avsluta ExpressRoute BGP-anslutningar på tillståndsfulla enheter kan orsaka problem med redundans under planerat eller oplanerat underhåll av Microsoft eller din ExpressRoute-provider. Du bör testa din konfigurerade för att säkerställa att trafiken redundanser korrekt, och när det är möjligt, avsluta BGP-sessioner på tillståndslösa enheter.

Finjusteringsfunktioner för privat peering

I det här avsnittet går vi igenom valfria funktioner (beroende på din Azure-distribution och hur känslig du är för MTTR) som förbättrar hög tillgänglighet för din ExpressRoute-krets. Mer specifikt ska vi granska zonmedveten distribution av virtuella ExpressRoute-nätverksgatewayer och VIRTUALD (Dubbelriktad identifiering av vidarebefordran).

Tillgänglighetszonsmedvetna virtuella ExpressRoute-nätverksgatewayer

En tillgänglighetszon i en Azure-region är en kombination av en feldomän och en uppdateringsdomän. Om du väljer zonredundant Azure IaaS-distribution kanske du även vill konfigurera zonredundanta virtuella nätverksgatewayer som avslutar privat ExpressRoute-peering. Mer information finns i Om zonredundant virtuella nätverksgatewayer i Azure-tillgänglighetszoner. Information om hur du konfigurerar zonredundant virtuell nätverksgateway finns i Skapa en zonredundant virtuell nätverksgateway i Azure-tillgänglighetszoner.

Förbättra tiden för felidentifiering

ExpressRoute stöder BFD via privat peering. BFD minskar tiden för felidentifiering i Layer 2-nätverket mellan Microsoft Enterprise Edge (MRE) och deras BGP-grannar på den lokala sidan från cirka 3 minuter (standard) till mindre än en sekund. Snabb felidentifieringstid hjälper till att påskynda återställning av fel. Mer information finns i Konfigurera BFD via ExpressRoute.

Nästa steg

I den här artikeln har vi diskuterat hur du utformar för hög tillgänglighet för en ExpressRoute-kretsanslutning. En ExpressRoute-krets-peeringpunkt fästs på en geografisk plats och kan därför påverkas av ett oåterkalleligt fel som påverkar hela platsen.

Designöverväganden för att skapa geo-redundant nätverksanslutning till Microsoft-stamnät som kan klara oåterkalleliga fel, som påverkar en hel region, finns i Utforma för haveriberedskap med privat ExpressRoute-peering.