Návrh pro zajištění vysoké dostupnosti pomocí ExpressRoute

Služba ExpressRoute je navržena tak, aby zajišťovala vysokou dostupnost a aby pro prostředky Microsoftu poskytovala privátní síťové připojení na úrovni operátora. Jinými slovy, v cestě ExpressRoute v síti Microsoftu neexistuje jediný bod selhání. Aby se maximalizovala dostupnost, měl by být segment zákazníka a poskytovatele služeb okruhu ExpressRoute také navržen pro zajištění vysoké dostupnosti. V tomto článku se nejprve podíváme na aspekty síťové architektury pro vytváření robustního síťového připojení pomocí ExpressRoute a pak se podíváme na jemně vyladěné funkce, které vám pomůžou zlepšit vysokou dostupnost okruhu ExpressRoute.

Poznámka:

Koncepty popsané v tomto článku platí stejně, když se okruh ExpressRoute vytvoří ve službě Virtual WAN nebo mimo něj.

Aspekty architektury

Následující obrázek znázorňuje doporučený způsob připojení pomocí okruhu ExpressRoute pro maximalizaci dostupnosti okruhu ExpressRoute.

0

Pro zajištění vysoké dostupnosti je nezbytné udržovat redundanci okruhu ExpressRoute v celé koncové síti. Jinými slovy, potřebujete zachovat redundanci v rámci místní sítě a neměli byste ohrozit redundanci v síti poskytovatele služeb. Zachování redundance minimálně znamená, že se vyhnete kritickým bodům selhání sítě. Redundantní napájení a chlazení síťových zařízení dále zvyšuje vysokou dostupnost.

Aspekty návrhu fyzické vrstvy první míle

Pokud ukončíte primární i sekundární připojení okruhů ExpressRoute na stejném zařízení CPE (Customer Premises Equipment), dojde k ohrožení vysoké dostupnosti v rámci místní sítě. Pokud navíc nakonfigurujete primární i sekundární připojení pomocí stejného portu CPE, vynutíte partnera ohrozit vysokou dostupnost i v segmentu sítě. K této události může dojít buď ukončením dvou připojení pod různými podinterfaces, nebo sloučením těchto dvou připojení v rámci partnerské sítě. Tento kompromis je znázorněn na následujícím obrázku.

2

Pokud na druhou stranu ukončíte primární a sekundární připojení okruhů ExpressRoute v různých geografických umístěních, můžete ohrozit výkon sítě připojení. Pokud je provoz aktivně vyrovnává zatížení mezi primárními a sekundárními připojeními, která jsou ukončena v různých geografických umístěních, může potenciálně významný rozdíl v latenci sítě mezi těmito dvěma cestami vést k neoptimálnímu výkonu sítě.

Informace o geograficky redundantním návrhu najdete v tématu Návrh zotavení po havárii pomocí ExpressRoute.

Aktivní-aktivní připojení

Síť Microsoftu je nakonfigurovaná pro provoz primárních a sekundárních připojení okruhů ExpressRoute v režimu aktivní-aktivní. Prostřednictvím inzerování tras však můžete vynutit, aby redundantní připojení okruhu ExpressRoute fungovala v režimu aktivní-pasivní. Inzerování konkrétnějších tras a předřazování AS PATH protokolu BGP jsou běžnými technikami, jak zajistit upřednostňování jedné cesty před druhou.

V zájmu zlepšení vysoké dostupnosti doporučujeme provozovat připojení okruhu ExpressRoute v režimu aktivní-aktivní. Pokud povolíte provoz připojení v režimu aktivní-aktivní, síť Microsoftu bude vyrovnávat zatížení provozu napříč připojeními na základě jednotlivých toků.

Spuštění primárního a sekundárního připojení okruhu ExpressRoute v režimu aktivní-pasivní čelí riziku selhání obou připojení po selhání v aktivní cestě. Běžné příčiny selhání při přepínání jsou nedostatek aktivní správy pasivního připojení a pasivní připojení inzerce zastaralých tras.

Alternativní možnost, spuštění primárního a sekundárního připojení okruhu ExpressRoute v režimu aktivní-aktivní, má za následek pouze přibližně polovinu selhání toků a jejich přesměrování. Proto aktivní-aktivní připojení významně pomáhá zlepšit průměrnou dobu obnovení (MTTR).

Poznámka:

Během aktivity údržby nebo v případě neplánovaných událostí, které mají vliv na jedno z připojení, bude Společnost Microsoft upřednostňovat použití cesty AS, která předem vyprázdní provoz přes připojení v pořádku. Budete muset zajistit, aby provoz mohl směrovat přes cestu, která je v pořádku, když je předem nakonfigurovaná cesta od Microsoftu, a aby nedošlo k přerušení služeb, nakonfiguruje se odpovídajícím způsobem požadované inzerování tras.

Překlad adres (NAT) pro partnerský vztah Microsoftu

Partnerský vztah Microsoftu je navržený pro komunikaci mezi veřejnými koncovými body. Místní privátní koncové body se proto běžně používají jako překlad adres (NATed) s veřejnou IP adresou zákazníka nebo partnerské sítě, než budou komunikovat přes partnerský vztah Microsoftu. Za předpokladu, že v nastavení aktivní-aktivní používáte jak primární, tak sekundární připojení. Kde a jak má překlad adres (NAT) vliv na to, jak rychle se obnovíte po selhání v jednom z připojení ExpressRoute. Na následujícím obrázku jsou znázorněny dvě různé možnosti překladu adres (NAT):

3

Možnost 1:

Překlad adres (NAT) se použije po rozdělení provozu mezi primární a sekundární připojení okruhu ExpressRoute. Pro splnění stavových požadavků překladu adres (NAT) se pro primární a sekundární zařízení používají nezávislé fondy překladu adres (NAT). Návratový provoz přichází na stejném hraničním zařízení, přes které tok ustupoval.

Pokud se připojení ExpressRoute nezdaří, možnost spojit se s odpovídajícím fondem PŘEKLADU adres (NAT) se přeruší. Proto všechny poškozené síťové toky musí být znovu vytvořeny protokolem TCP nebo aplikační vrstvou za odpovídajícím časovým limitem okna. Během selhání se Azure nemůže spojit s místními servery pomocí odpovídajícího překladu adres (NAT), dokud se připojení neobnoví pro primární nebo sekundární připojení okruhu ExpressRoute.

Možnost 2:

Před rozdělením provozu mezi primární a sekundární připojení okruhu ExpressRoute se používá společný fond překladu adres (NAT). Před rozdělením provozu je důležité rozlišovat, že společný fond překladu adres (NAT) neznamená, že představuje kritický bod selhání, jako je například ohrožení vysoké dostupnosti.

Fond NAT je dostupný i po selhání primárního nebo sekundárního připojení. Samotná síťová vrstva tedy může směrovat pakety a rychleji se zotavit po selhání.

Poznámka:

  • Pokud pro primární a sekundární připojení ExpressRoute použijete možnost NAT 1 (nezávislé fondy PŘEKLADU ADRES) a namapujete port IP adresy z jednoho z fondu NAT na místní server, nebude server dostupný prostřednictvím okruhu ExpressRoute, pokud se odpovídající připojení nezdaří.
  • Ukončení připojení BGP ExpressRoute na stavových zařízeních může způsobit problémy s převzetím služeb při selhání při plánované nebo neplánované údržbě Microsoftem nebo vaším poskytovatelem ExpressRoute. Měli byste otestovat nastavení, abyste zajistili správné převzetí služeb při selhání provozu a pokud je to možné, ukončete relace protokolu BGP na bezstavových zařízeních.

Vyladění funkcí privátního partnerského vztahu

V této části si projdeme volitelné funkce (v závislosti na nasazení Azure a citlivosti na MTTR), které pomáhají zlepšit vysokou dostupnost okruhu ExpressRoute. Konkrétně si projdeme nasazení bran virtuální sítě ExpressRoute s podporou zón a bidirectional Forwarding Detection (BFD).

Brány virtuální sítě ExpressRoute pracující se zónou dostupnosti

Zóna dostupnosti v oblasti Azure je kombinací domény selhání a aktualizační domény. Pokud chcete dosáhnout nejvyšší odolnosti a dostupnosti, měli byste nakonfigurovat zónově redundantní bránu virtuální sítě ExpressRoute. Další informace najdete v tématu o zónově redundantních branách virtuální sítě v Azure Zóny dostupnosti. Pokud chcete nakonfigurovat zónově redundantní bránu virtuální sítě, přečtěte si téma Vytvoření zónově redundantní brány virtuální sítě v Azure Zóny dostupnosti.

Zlepšení doby detekce selhání

ExpressRoute podporuje BFD přes privátní partnerský vztah. BFD zkracuje dobu detekce selhání sítě vrstvy 2 mezi microsoft Enterprise Edge (MSEE) a jejich sousedy protokolu BGP na místní straně z přibližně 3 minut (výchozí) na méně než sekundu. Rychlá doba detekce selhání pomáhá urychlit obnovení selhání. Další informace najdete v tématu Konfigurace BFD přes ExpressRoute.

Další kroky

V tomto článku jsme probrali, jak navrhnout vysokou dostupnost připojení okruhu ExpressRoute. Bod partnerského vztahu okruhu ExpressRoute je připnutý k zeměpisnému umístění, a proto je ovlivněn katastrofickým selháním, které ovlivňuje celé umístění.

Aspekty návrhu pro sestavení geograficky redundantního síťového připojení k páteřní síti Microsoftu, které můžou odolat katastrofickým selháním, které ovlivňují celou oblast, najdete v tématu Návrh zotavení po havárii s využitím privátního partnerského vztahu ExpressRoute.