Skydda och återställa i molnhantering

Innan molnhanteringsteamen förbereder sig för ett potentiellt arbetsbelastningsstopp bör de först se till att de uppfyller kraven för:

När de planerar måste teamen börja med ett antagande att något kommer att misslyckas när en katastrof inträffar. Förberedelse för ett avbrott gör att teamen kan identifiera fel tidigare och återställa snabbare. Fokus för det här området ligger på de steg som kommer omedelbart efter ett systemfel. Hur skyddar du arbetsbelastningar så att de kan återställas snabbt när ett avbrott inträffar?

Ingen teknisk lösning kan konsekvent erbjuda ett serviceavtal som garanterar 100 procent drifttid. Lösningar med de mest redundanta arkitekturerna hävdar att de levererar "sex 9:or" eller 99,99999 procent drifttid. Men även en "sex 9s" lösning går ner i 31,6 sekunder under ett visst år. Det är ovanligt att en lösning garanterar en stor, pågående driftsinvestering som krävs för att nå "sex 9:e" drifttid.

Översätta skydds- och återställningskonversationer

De arbetsbelastningar som driver verksamheten består av:

  • program
  • data
  • virtuella datorer (VM)
  • andra tillgångar

Varje tillgång kan kräva en egen metod för skydd och återställning. Det viktiga målet med det här området är att upprätta ett konsekvent åtagande inom baslinjen för hantering, vilket kan utgöra en utgångspunkt för affärsdiskussioner.

Molnhanteringsteam bör som minst skapa en baslinjemetod för varje tillgång, med ett tydligt åtagande om snabb återställning och minimal dataförlust.

Mål för återställningstid (RTO)

Ett mål för återställningstid är hur lång tid det tar att återställa alla system till dess tillstånd före en katastrof. Detta omfattar den tid som krävs för att:

  • återställa minimal funktionalitet till virtuella datorer och program
  • återställa data som krävs av program.

I affärstermer representerar RTO den tid som affärsprocesserna inte är i drift. För verksamhetskritiska arbetsbelastningar bör den här variabeln vara relativt låg, så att affärsprocesser kan återupptas snabbt. För arbetsbelastningar med lägre prioritet kanske standardnivån RTO inte har någon märkbar inverkan på företagets prestanda.

Ett företag bör skapa en baslinje för hantering som upprättar en standard-RTO för icke-verksamhetskritiska arbetsbelastningar. Företaget kan sedan använda baslinjen som ett sätt att motivera ytterligare investeringar i återställningstider.

Mål för återställningspunkt (RPO)

I de flesta molnhanteringssystem samlar någon form av dataskydd regelbundet in och lagrar data. Återställningspunkten refererar till den senaste gången data hämtades. När ett system misslyckas kan det bara återställas till den senaste återställningspunkten.

Återställningspunktmålet mäts från den senaste återställningspunkten till ett avbrott. Om RPO mäts i timmar resulterar ett systemfel i dataförlust för timmarna mellan den senaste återställningspunkten och avbrottet. Om RPO mäts i dagar resulterar ett systemfel i dataförlust för dagarna mellan den senaste återställningspunkten och avbrottet. Ett endags-RPO skulle teoretiskt sett leda till förlust av alla transaktioner under dagen som ledde fram till misslyckandet.

För verksamhetskritiska system kan mätning av ett återställningspunktpunktsmål på några minuter eller sekunder bidra till att undvika förlust av intäkter eller vinster. En kortare RPO resulterar dock i allmänhet i ökade hanteringskostnader. För att minimera dessa kostnader bör ett företag skapa en baslinje för hantering som fokuserar på det längsta godtagbara återställningspunktobjektet. Företaget kan sedan minska RPO för de specifika plattformar eller arbetsbelastningar som kräver mer investeringar.

Skydda och återställa arbetsbelastningar

De flesta arbetsbelastningar i en IT-omgivningsstöd en specifik affärsprocess eller teknisk process. System som inte har någon systemisk inverkan på verksamheten garanterar vanligtvis inte den ökade investering som krävs för att återställa system snabbt eller minimera dataförlust. Genom att upprätta en baslinje kan ett företag ta reda på vilken nivå av återställningsstöd de behöver till en prispunkt som de konsekvent kan hantera. Genom att förstå detta kan affärsintressenter utvärdera värdet av ökade investeringar i återhämtning.

För de flesta molnhanteringsteam ger en förbättrad baslinje, med specifika RPO/RTO-åtaganden för olika tillgångar, den mest gynnsamma vägen till ömsesidiga affärsåtaganden. I följande avsnitt beskrivs några vanliga förbättrade baslinjer som gör det möjligt för ett företag att enkelt lägga till skydds- och återställningsfunktioner genom en upprepningsbar process.

Skydda och återställa data

Data är utan tvekan den mest värdefulla tillgången i den digitala ekonomin. Förlust av data som driver en produktionsarbetsbelastning leder till förlust av intäkter eller vinster. Den vanligaste förbättrade baslinjen är möjligheten att skydda och återställa data effektivt. Vi uppmuntrar molnhanteringsteam att erbjuda en nivå av förbättrad baslinje för hantering som stöder vanliga dataplattformar.

Innan molnhanteringsteam implementerar plattformsåtgärder är det vanligt att de stöder förbättrade åtgärder för en PaaS-dataplattform (plattform som en tjänst). Det är till exempel enkelt för ett molnhanteringsteam att framtvinga en högre frekvens för säkerhetskopiering eller multiregional replikering för Azure SQL Database- eller Azure Cosmos DB-lösningar. På så sätt kan utvecklingsteamet enkelt förbättra RPO genom att modernisera sina dataplattformar.

Mer information om den här tankeprocessen finns i Avsnittet om plattformsåtgärder.

Skydda och återställa virtuella datorer

De flesta arbetsbelastningar är något beroende av virtuella datorer, som är värdar för olika aspekter av lösningen. Ett företag måste snabbt återställa vissa virtuella datorer för att arbetsbelastningen ska kunna stödja sina processer efter ett systemfel.

Varje minut av stilleståndstid på dessa virtuella datorer kan orsaka förlorade intäkter eller minskade vinster. När stilleståndstiden för virtuella datorer har en direkt inverkan på verksamhetens finanspolitiska prestanda är RTO mycket viktigt. Molnhanteringsteam kan snabbt återställa virtuella datorer genom att replikera dem till en sekundär plats och använda automatisk återställning, en modell som kallas en återställningsmodell med varm värme. Teamen kan också replikera virtuella datorer till en funktionell, sekundär plats i en metod som kallas hot-hot eller hög tillgänglighetsmodell. Metoden hot-hot är dyrare, men den erbjuder det högsta återställningstillståndet.

Var och en av dessa modeller minskar RTO, vilket hjälper företag att återställa sina affärsfunktioner snabbare. Varje modell resulterar dock också i betydligt ökade kostnader för molnhantering.

Observera också att förutom replikering för hög tillgänglighet bör säkerhetskopiering aktiveras för scenarier som:

  • oavsiktlig borttagning
  • skadade data
  • utpressningstrojanattacker

Mer information om den här tankeprocessen finns i Avsnittet om arbetsbelastningsåtgärder.

Nästa steg

När den här baslinjekomponenten för hantering har uppfyllts kan teamet se framåt för att undvika avbrott i sina plattformsåtgärder och arbetsbelastningsåtgärder.