Använda Azure Stack HCI-stretchade kluster för haveriberedskap

Azure Blob Storage
Azure Backup
Azure Monitor
Azure Stack HCI

Följande referensarkitektur visar hur du utformar och implementerar haveriberedskap för Azure Stack HCI med hjälp av stretchkluster.

Arkitektur

Diagram som illustrerar ett aktivt-aktivt och ett aktivt-passivt Azure Stack HCI-sträckt kluster, med lagringsvolymer och klusterprestandahistorik som replikeras via Storage Replica. I aktivt-aktivt läge finns replikeringstrafik i varje riktning, där båda platserna är värdar för virtuella Azure Stack HCI-datorer. I aktivt-passivt läge är replikeringen enkelriktad, med den aktiva platsen som är värd för virtuella Azure Stack HCI-datorer.

Ladda ned en Visio-fil med den här arkitekturen.

Komponenter

Arkitekturen innehåller följande komponenter och funktioner:

  • Azure Stack HCI (20H2). Azure Stack HCI är en klusterlösning för hyperkonvergerad infrastruktur (HCI) som är värd för virtualiserade Windows- och Linux-arbetsbelastningar och deras lagring i en lokal hybridmiljö. Det utsträckta klustret kan bestå av mellan fyra och 16 fysiska noder.
  • Lagringsreplik. Storage Replica är en Windows Server-teknik som möjliggör volymreplikering mellan servrar eller kluster för haveriberedskap.
  • Direktmigrering. Direktmigrering är en Hyper-V-funktion i Windows Server som gör att du smidigt kan flytta virtuella datorer som körs från en Hyper-V-värd till en annan utan upplevd stilleståndstid.
  • Molnvittne. Molnvittne är ett kvorumvittne för redundanskluster som använder Microsoft Azure Blob Storage för att rösta om klusterkvorum.

Scenarioinformation

Du använder vanligtvis den här arkitekturen för haveriberedskap med automatisk redundansväxling av virtuella Azure Stack HCI-datorer och filresurser mellan två fysiska platser inom ett intervall på 5 ms fördröjning i nätverket.

Rekommendationer

Följande rekommendation gäller för de flesta scenarier. Följ rekommendationen om du inte har ett specifikt krav som åsidosätter den.

Använda stretchkluster för att implementera automatisk haveriberedskap för virtualiserade arbetsbelastningar och filresurser som finns i Azure Stack HCI

För att förbättra den inbyggda återhämtningstiden för Azure Stack HCI implementerar du ett utsträckt Azure Stack HCI-kluster som består av två grupper med noder, med en grupp per plats. Varje grupp måste innehålla minst två noder. Det totala antalet noder i ett kluster får inte överskrida det maximala antalet noder som stöds av ett Azure Stack HCI-kluster. Noderna måste uppfylla standardkraven för HCI-maskinvara.

Ett sträckt Azure Stack HCI-kluster förlitar sig på Storage Replica för att utföra synkron lagringsreplikering mellan lagringsvolymer som hanteras av de två nodgrupperna på respektive fysiska platser. Om ett fel påverkar tillgängligheten för den primära platsen, övergår klustret automatiskt sina arbetsbelastningar till noder på den överlevande platsen för att minimera potentiell stilleståndstid. För planerade eller förväntade stilleståndstider på den primära platsen kan du använda Hyper-V Live Migration för att sömlöst överföra arbetsbelastningar till den andra platsen, vilket undviker driftstopp helt och hållet. I det här scenariot bör du tänka på lagringsplatsen. Du bör först vända replikeringsriktningen för Storage Replica och sedan utföra direktmigreringen av de virtuella datorerna. Prestanda kommer att påverkas tills direktmigreringen har slutförts.

Anteckning

Synkron replikering säkerställer kraschkonsekvens med noll dataförlust på filsystemnivå under en redundansväxling.

Varning

Det synkrona replikeringskravet som gäller för stretchkluster medför en gräns på 5 ms tur och retur-nätverksfördröjning mellan två grupper av klusternoder på de replikerade platserna. Beroende på egenskaperna för den fysiska nätverksanslutningen översätts den här begränsningen vanligtvis till cirka 20–30 fysiska mil.

Anteckning

Lagringsreplikens signerings- och krypteringsfunktion skyddar automatiskt replikeringstrafiken.

Överväganden

Microsoft Azure Well-Architected Framework är en uppsättning vägledande principer som följs i den här referensarkitekturen. Följande överväganden är inramade i samband med dessa grundsatser.

Tillförlitlighet

Tillförlitlighet säkerställer att ditt program kan uppfylla de åtaganden du gör för dina kunder. Mer information finns i Översikt över grundpelare för tillförlitlighet.

  • Feldomäner på platsnivå. Varje fysisk plats i ett Azure Stack HCI-sträckt kluster representerar distinkta feldomäner som ger ytterligare återhämtning. En feldomän är en uppsättning maskinvarukomponenter som delar en enskild felpunkt (single point of failure). För att vara feltolerant mot en viss nivå behöver du flera feldomäner på den nivån.

Anteckning

Om varje plats motsvarar en separat AD DS-plats konfigurerar klusteretableringsprocessen automatiskt platstilldelningen. Om det inte finns några separata AD DS-platser som representerar de två platserna, men noderna finns på två olika undernät, identifierar klusteretableringsprocessen platser baserat på undernätstilldelningarna. Om noderna finns i samma undernät måste du uttryckligen definiera platstilldelning.

  • Webbplatsmedvetenhet. Med platsmedvetenhet kan du styra placeringen av virtualiserade arbetsbelastningar genom att ange deras önskade platser. Det finns många fördelar med att ange önskad plats för ett stretchkluster, inklusive möjligheten att gruppera arbetsbelastningar på platsnivå och anpassa alternativ för kvorumröstning. Som standard använder alla virtuella datorer den önskade platsen under en kallstart, även om det också är möjligt att konfigurera den önskade platsen på klusterrollen eller gruppnivån. På så sätt kan du allokera specifika virtuella datorer till deras respektive platser i aktivt-aktivt läge. Ur kvorumperspektivet påverkar det önskade webbplatsvalet tilldelningen av röster på ett sätt som gynnar webbplatsen. Om anslutningen mellan de två platserna som är värd för sträckta klusternoder misslyckas och klustervittnet inte kan nås, förblir den önskade platsen online, medan noderna på den andra platsen tas bort.

  • Förbättrad Lagringsdirigering volymreparationshastighet. Lagringsdirigering ger automatisk omsynkronisering av följande händelser som påverkar tillgängligheten för diskar i lagringspoolen, till exempel att stänga av en av klusternoderna eller ett lokaliserat maskinvarufel. Azure Stack HCI implementerar en förbättrad omsynkroniseringsprocess som fungerar mycket finare än Windows Server 2019. Den här processen minskar avsevärt varaktigheten för omsynkroniseringsåtgärden och minimerar den potentiella effekten av flera överlappande maskinvarufel.

  • Återhämtningsgränser. Azure Stack HCI ger flera återhämtningsnivåer, men på grund av dess hyperkonvergerade arkitektur omfattas återhämtning av begränsningar som inte bara tillämpas av klusterkvorumet utan även av poolkvorumet.

  • Integrering med en rad Azure-tjänster som ger ytterligare återhämtningsfördelar. Du kan integrera virtualiserade arbetsbelastningar som körs i Azure Stack HCI-kluster med azure-tjänster som Azure Backup och Azure Site Recovery.

  • Snabbare redundans. Du kan optimera nätverksinfrastrukturen och dess konfiguration för att påskynda slutförandet av en redundansväxling på platsnivå. Du kan till exempel använda utsträckta virtuella LAN (VLAN), nätverkstrationsenheter och kortare TTL-värden (Time to Live) i DNS-poster som representerar klustrade resurser. Överväg också att sänka standardåterhämtningsperioden, som avgör den tidsperiod under vilken en klustrad virtuell dator tillåts köras i isolerat tillstånd.

Varning

Att använda stretchkluster med SDN anses vara en avancerad konfiguration och du bör kontakta systemintegreraren eller Microsoft Support för ytterligare hjälp.

Säkerhet

Säkerhet ger garantier mot avsiktliga attacker och missbruk av värdefulla data och system. Mer information finns i Översikt över säkerhetspelare.

  • Skydd under överföring. Storage Replica erbjuder inbyggd säkerhet för replikeringstrafiken, som omfattar paketsignering, fullständig datakryptering i AES-128-GCM, stöd för Intel AES-NI-krypteringsacceleration och skydd mot förautentiseringsintegritet för man-in-the-middle-angrepp. Storage Replica använder också Kerberos AES256 för autentisering mellan replikeringsnoderna.

  • Kryptering i vila. Azure Stack HCI stöder BitLocker-enhetskryptering för sina datavolymer, vilket underlättar efterlevnaden av standarder som FIPS 140-2 och HIPAA.

  • Integrering med en rad Azure-tjänster som ger ytterligare säkerhetsfördelar. Du kan integrera virtualiserade arbetsbelastningar som körs i Azure Stack HCI-kluster med azure-tjänster som Microsoft Defender för molnet

  • Brandväggsvänlig konfiguration. Storage Replica-trafik kräver ett begränsat antal öppna portar mellan replikeringsnoderna.

Varning

Storage Replica- och Azure Stack HCI-stretchkluster måste fungera i en AD DS-miljö. När du planerar distributionen av Azure Stack HCI-stretchkluster kontrollerar du anslutningen till AD DS-domänkontrollanter på varje plats som är värd för klusternoder.

Kostnadsoptimering

Kostnadsoptimering handlar om att titta på sätt att minska onödiga utgifter och förbättra driftseffektiviteten. Mer information finns i Översikt över grundpelare för kostnadsoptimering.

  • Aktiv-aktiv kontra aktiv-passiv konfiguration. Utsträckta Azure Stack HCI-kluster stöder aktiv-passiva och aktiva-aktiva lägen. I aktivt-passivt läge replikeras en utsedd primär plats endirigering till en annan plats som tillhandahåller haveriberedskapsfunktionen. I aktivt-aktivt läge replikerar två platser sina respektive volymer endirigering till varandra, vilket ger redundans vid ett fel på någon av platserna. Det aktiva-aktiva läget hjälper till att minimera kostnaderna för affärskontinuitet genom att eliminera behovet av en dedikerad haveriberedskapsplats.

  • Molnvittne jämfört med filresursvittne. En vittnesresurs är en obligatorisk komponent i Azure Stack HCI-kluster. Om du vill implementera det väljer du antingen ett Azure-molnvittne eller ett filresursvittne. Ett Azure-molnvittne förlitar sig på en blob i ett Azure Storage-konto som du anger som skiljepunkt för att förhindra scenarier med delad hjärna. Ett filresursvittne förlitar sig på en SMB-filresurs (Server Message Block) för att uppnå samma mål.

Anteckning

Azure Cloud Witness är det rekommenderade valet för Azure Stack HCI-stretchkluster, förutsatt att alla servernoder i klustret har tillförlitliga Internetanslutningar. Motsvarande Azure-avgifter är försumbara. De baseras på priset för en liten blob med ovanliga uppdateringar som motsvarar ändringar i klustertillståndet. I scenarier som involverar stretchkluster bör ett filresursvittne finnas på en tredje plats, vilket avsevärt kan öka implementeringskostnaderna om inte den tredje platsen redan är tillgänglig och har befintliga, tillförlitliga anslutningar till de platser som är värdar för stretchklusternoderna.

  • Datadeduplicering. Azure Stack HCI och Storage Replica stöder datadeduplicering. Från och med Windows Server 2019 är deduplicering tillgängligt på volymer som är formaterade med ReFS (Resilient File System), vilket är det rekommenderade filsystemet för Azure Stack HCI. Deduplicering hjälper till att öka användbar lagringskapacitet genom att identifiera dubbletter av filer och bara lagra dem en gång.

Varning

Även om du bör installera rolltjänsten datadedupliceringsserver på både käll- och målservrarna ska du inte aktivera Datadeduplicering på målnoderna i ett Azure Stack HCI-stretchkluster. Eftersom Datadeduplicering hanterar skrivningar bör den endast köras på källklusternoder. Målnoder tar alltid emot deduplicerade kopior av varje volym.

Utmärkt driftseffektivitet

Driftseffektivitet omfattar de driftsprocesser som distribuerar ett program och håller det igång i produktion. Mer information finns i Översikt över grundpelare för driftseffektivitet.

  • Automatisk redundans och återställning. Ett fel på den primära platsen utlöser automatisk redundans. Efter redundansväxlingen sker även processen för att upprätta replikering från den nya primära/tidigare sekundära platsen tillbaka till den nya sekundära/tidigare primära platsen. För att förhindra potentiell dataförlust förhindrar klustret återställning efter fel tills de replikerade volymerna har synkroniserats fullständigt.

  • Förenklad etablering och hantering med hjälp av Windows Admin Center. Guiden Skapa kluster i Windows Admin Center innehåller ett guidedrivet gränssnitt som vägleder dig genom processen att skapa ett Azure Stack HCI-stretchkluster. Guiden identifierar om klusternoder finns på två olika Active Directory Domain Services platser (AD DS) eller om deras IP-adresser tillhör två olika undernät. Om de finns i två olika undernät skapar och konfigurerar guiden automatiskt motsvarande klusterplatser där var och en representerar en separat feldomän. Du kan också ange den önskade webbplatsen. På samma sätt förenklar Windows Admin Center etableringsprocessen för replikerade volymer.

Anteckning

Att skapa volymer och virtuella diskar för stretchkluster är mer engagerat än för kluster med en enda plats. Stretchkluster kräver minst fyra volymer, bestående av två datavolymer och två loggvolymer, med ett data-/loggvolympar på varje plats. När du skapar en replikerad datavolym med hjälp av Windows Admin Center etablerar processen automatiskt loggvolymen på den primära platsen och både data- och loggrelikerade volymer på den sekundära platsen, vilket säkerställer att var och en av dem har den storlek och konfigurationsinställningar som krävs.

  • Stöd för automatiserad etablering av stretchkluster och lagringshantering med hjälp av Windows PowerShell. Du kan köra PowerShell lokalt från någon av Azure Stack HCI-servrarna eller via en fjärranslutning från en hanteringsdator.

  • Integrering med en rad Azure-tjänster som ger ytterligare driftsfördelar. Du kan integrera virtualiserade arbetsbelastningar som körs i Azure Stack HCI-kluster med azure-tjänster som Azure Monitor och Azure Automation lösningar, inklusive Ändringsspårning och inventering och uppdateringshantering. Efter en inledande obligatorisk registrering kan Azure Stack HCI-kluster utnyttja Azure Arc för övervakning och fakturering. Azure Arc-integreringen erbjuder förbättrad integrering med andra hybridtjänster, till exempel Azure Policy och Log Analytics. Registreringen utlöser skapandet av en Azure Resource Manager resurs som representerar ett Azure Stack HCI-kluster, vilket effektivt utökar Azure-hanteringsplanet till Azure Stack HCI.

Prestandaeffektivitet

Prestandaeffektivitet handlar om att effektivt skala arbetsbelastningen baserat på användarnas behov. Mer information finns i Översikt över grundpelare för prestandaeffektivitet.

  • Optimerad replikeringstrafik. När du utformar infrastrukturen för Azure Stack HCI-stretchkluster bör du överväga ytterligare lagringsreplik, direktmigrering och prestandahistorik för Storage Replica-kluster som flödar mellan platserna. Synkron replikering kräver minst 1 Gb fjärråtkomst till direkt minne (RDMA) eller Ethernet/TCP-anslutning mellan stretchklusterplatser. Beroende på mängden replikeringstrafik kan du dock behöva en snabbare RDMA-anslutning. Du bör också etablera flera anslutningar mellan platser, vilket ger återhämtningsfördelar och gör att du kan separera Storage Replica-trafik från Direktmigreringstrafik i Hyper-V.

Varning

RDMA är aktiverat som standard för all trafik mellan klusternoder på samma plats i samma undernät. RDMA är inaktiverat och stöds inte mellan platser eller mellan olika undernät. Du bör antingen inaktivera SMB Direct för trafik mellan platser eller implementera ytterligare bestämmelser som skiljer den från trafik mellan noder på samma plats.

Anteckning

Windows Admin Center tilldelar automatiskt den optimala konfigurationen om du använder den för att etablera stretchklustervolymer.

Nästa steg