Återställning i regionen med hjälp av tillgänglighetszoner och geo-haveriberedskap mellan regioner (Azure Event Grid)

Den här artikeln beskriver hur Azure Event Grid stöder automatisk återställning i regionen av dina Event Grid-resursdefinitioner och data när ett fel inträffar i en region som har tillgänglighetszoner. Den beskriver också hur Event Grid stöder automatisk återställning av Event Grid-resursdefinitioner (inga data) till en annan region när ett fel inträffar i en region som har en länkad region.

Återställning i regionen med hjälp av tillgänglighetszoner

Azure-tillgänglighetszoner är fysiskt separata platser i varje Azure-region som är toleranta mot lokala fel. De är anslutna via ett högpresterande nätverk med en svarstid på mindre än 2 millisekunder. Varje tillgänglighetszon består av ett eller flera datacenter som är utrustade med oberoende infrastruktur för ström, kylning och nätverk. Om en zon påverkas stöds regionala tjänster, kapacitet och hög tillgänglighet av de återstående två zonerna. Mer information om tillgänglighetszoner finns i Regioner och tillgänglighetszoner. I den här artikeln kan du också se listan över regioner som har tillgänglighetszoner.

Event Grid-resursdefinitioner för ämnen, systemämnen, domäner och händelseprenumerationer och händelsedata replikeras automatiskt över tre tillgänglighetszoner (när de är tillgängliga) i regionen. När det uppstår ett fel i någon av tillgänglighetszonerna redundansväxlar Event Grid-resurser automatiskt till en annan tillgänglighetszon utan mänsklig inblandning. För närvarande är det inte möjligt för dig att styra (aktivera eller inaktivera) den här funktionen. När en befintlig region börjar stödja tillgänglighetszoner skulle befintliga Event Grid-resurser automatiskt redväxas för att dra nytta av den här funktionen. Ingen kundåtgärd krävs.

Diagram som visar tillgänglighetszoner som skyddar mot lokaliserade katastrofer och regionala eller stora geografikatastrofer med hjälp av en annan region.

Geo-haveriberedskap mellan regioner

När en Azure-region upplever ett långvarigt avbrott kan du vara intresserad av redundansalternativ till en annan region för affärskontinuitet. Många Azure-regioner har geo-par och andra inte. En lista över regioner som har länkade regioner finns i Replikeringspar för flera regioner i Azure för alla geografiska områden.

För regioner med ett geo-par erbjuder Event Grid en möjlighet att redundansväxla publiceringstrafiken till den kopplade regionen för anpassade ämnen, systemämnen och domäner. I bakgrunden synkroniserar Event Grid automatiskt resursdefinitioner av ämnen, systemämnen, domäner och händelseprenumerationer till den kopplade regionen. Händelsedata replikeras dock inte till den kopplade regionen. I det normala tillståndet lagras händelser i den region som du valde för den resursen. När det uppstår ett regionavbrott och Microsoft initierar redundansväxlingen börjar nya händelser flöda till den geo-kopplade regionen och skickas därifrån utan några åtgärder från dig. Händelser som publicerats och godkänts i den ursprungliga regionen skickas därifrån efter att avbrottet har åtgärdats.

Microsoft-initierad redundans används av Microsoft i sällsynta fall för att redundansväxla Event Grid-resurser från en berörd region till motsvarande geo-kopplade region. Microsoft förbehåller sig rätten att avgöra när det här alternativet ska användas. Den här mekanismen omfattar inte ett användarmedgivande innan användarens trafik red redoveras.

Du kan aktivera eller inaktivera den här funktionen genom att uppdatera konfigurationen för ditt ämne eller din domän. Välj alternativet Kors-Geo (standard) för att aktivera Microsoft-initierad redundans och Regional för att inaktivera den. Detaljerade steg för att konfigurera den här inställningen finns i Konfigurera datahemvist. Om du väljer regionalt replikeras inga data av något slag till en annan region av Microsoft och du kan definiera din egen plan för haveriberedskap. Mer information finns i Skapa en egen haveriberedskapsplan för Azure Event Grid-ämnen och domäner.

Skärmbild som visar sidan Konfiguration för ett anpassat Event Grid-ämne.

Här följer några orsaker till varför du vill inaktivera den Microsoft-initierade redundansfunktionen:

  • Microsoft-initierad redundans utförs på bästa sätt.
  • Vissa geo-par uppfyller inte organisationens krav på datahemvist.

I sådana fall är det rekommenderade alternativet att skapa en egen plan för haveriberedskap för Azure Event Grid-ämnen och domäner. Även om det här alternativet kräver lite mer arbete, möjliggör det snabbare redundans och du har kontroll över att välja sekundära regioner. Om du vill implementera haveriberedskap på klientsidan för Azure Event Grid-ämnen kan du läsa Mer information om att skapa en egen haveriberedskap på klientsidan för Azure Event Grid.

Mål för återställningstid och återställningspunkter (RTO och RPO)

Haveriberedskap mäts med två mått:

  • Mål för återställningspunkt (RPO): minuter eller timmar med data som kan gå förlorade.
  • Mål för återställningstid (RTO): minuter eller timmar som tjänsten kan vara nere.

Event Grids automatiska redundansväxling har olika RRPOs och RTO:er för dina metadata (ämnen, domäner, händelseprenumerationer) och data (händelser). Om du behöver en annan specifikation än följande kan du fortfarande implementera din egen redundans på klientsidan med hjälp av ämnets hälso-API:er.

Mål för återställningspunkt (RPO)

  • RPO för metadata: noll minuter. När en resurs skapas/uppdateras/tas bort för tillämpliga resurser replikeras resursdefinitionen synkront till geo-paret. När en redundansväxling inträffar går inga metadata förlorade.

  • Data-RPO: När en redundansväxling inträffar bearbetas nya data från den kopplade regionen. Så snart avbrottet har åtgärdats för den berörda regionen skickas de obearbetade händelserna därifrån. Om regionåterställningen krävde längre tid än det time-to-live-värde som angetts för händelser kan data tas bort. För att minska dataförlusten rekommenderar vi att du konfigurerar ett mål med obeställbara meddelanden för en händelseprenumeration. Om den berörda regionen går förlorad och inte går att återställa kommer det att uppstå viss dataförlust. I bästa fall håller prenumeranten jämna steg med publiceringsfrekvensen och bara några sekunders data går förlorade. Det värsta scenariot skulle vara när prenumeranten inte aktivt bearbetar händelser och med en maxtid på 24 timmar kan dataförlusten vara upp till 24 timmar.

Mål för återställningstid (RTO)

  • RTO för metadata: Beslutsfattande vid redundans baseras på faktorer som tillgänglig kapacitet i en parad region och kan pågå i intervallet 60 minuter eller mer. När redundansväxlingen har initierats börjar Event Grid inom 5 minuter att acceptera anrop för att skapa/uppdatera/ta bort ämnen och prenumerationer.

  • Data-RTO: Samma som ovanstående information.

Viktigt!

  • Vid haveriberedskap på serversidan kan Event Grid inte initiera redundans om den kopplade regionen inte har någon extra kapacitet att ta på sig ytterligare trafik. Återställningen görs på bästa sätt.
  • Du debiteras inte för att använda den här funktionen.
  • Geo-haveriberedskap stöds inte för partnernamnområden och partnerämnen.

Nästa steg

Mer information finns i Skapa en egen haveriberedskap på klientsidan för Azure Event Grid.