Design för tillgänglighet och återställning

Läkare på Lamna Healthcare har låg tolerans för driftavbrott. De måste ha åtkomst till kliniska IT-system dygnet runt för att säkerställa att de kan ge vård av högsta kvalitet hela tiden. För att uppfylla klinikernas krav på åtkomst dygnet runt måste Lamna Healthcares program kunna hantera fel med minimal påverkan på användarna. Hur ser de till att programmen fortsätter att fungera, både vid lokala incidenter och storskaliga katastrofer?

Här går vi igenom hur du får med tillgänglighet och återställningsbarhet i din arkitekturella utformning.

Tillgänglighet och återställning

I ett komplext program kan en mängd olika saker går fel oavsett skala. Enskilda servrar och hårddiskar kan misslyckas. Ett distributionsproblem kan oavsiktligt ta bort alla tabeller i en databas. Hela datacenter kan bli onåbara. En incident med en utpressningstrojan kan kryptera alla dina data.

Att designa för tillgänglighet fokuserar på att upprätthålla drifttid vid småskaliga incidenter och tillfälliga förhållanden som partiella nätverksavbrott. Du kan kontrollera att ditt program kan hantera lokaliserade fel genom att integrera hög tillgänglighet i varje komponent i ett program och eliminera enskilda felpunkter. En sådan design minskar också påverkan vid infrastrukturunderhåll. Design för hög tillgänglighet syftar vanligtvis till att eliminera effekten av incidenter snabbt och automatiskt och säkerställa till att systemet kan fortsätta att bearbeta begäranden med liten eller ingen inverkan.

Att designa för återställning fokuserar på återställning från dataförlust och större katastrofer. Återställning från dessa typer av incidenter innebär ofta aktiva åtgärder, men automatisk återställning kan minska den tid som krävs för återställning. Dessa typer av incidenter kan leda till avbrott eller permanent förlorade data. Haveriberedskap handlar lika mycket om noggrann planering som utförande.

Att inkludera hög tillgänglighet och återställningsfunktioner i utformningen av din arkitektur skyddar din verksamhet från ekonomiska förluster från driftavbrott och dataförlust. De säkerställer att ditt rykte inte påverkas negativt av en förlust av förtroende från dina kunder.

Designa för tillgänglighet och återställning

Att designa för tillgänglighet och återställningsfunktioner garanterar att ditt program kan uppfylla de åtaganden som du gör mot dina kunder.

För tillgänglighet, identifiera de servicenivåavtal (SLA) som du har utlovat. Granska potentiella funktioner för hög tillgänglighet i ditt program i förhållande till dina SLA och identifiera var du har tillräcklig täckning och var du behöver göra förbättringar. Målet är att lägga till redundans till komponenterna i arkitekturen för att minska sannolikheten att uppleva ett avbrott. Exempel på designkomponenter med hög tillgänglighet inkluderar klustring och lastbalansering. Klustring ersätter en enskild virtuell dator med en uppsättning samordnade virtuella datorer. När en virtuell dator misslyckas eller blir oåtkomlig, kan tjänsterna växla över till en annan som kan hantera begäranden. Lastbalansering sprider ut begäranden över många instanser av en tjänst, identifierar misslyckade instanser och förhindrar att begäranden dirigeras till dem.

För återställningsfunktioner, utför du en analys som undersöker möjliga scenarion med dataförluster och större driftsavbrott. Analysen bör innehålla en förklaring av återställningsstrategier och kostnadsfördelen förhållandet för var och en. Den här övningen ger dig viktig insyn i din organisations prioriteringar och hjälper att tydliggöra rollen för ditt program. Resultatet bör innehålla programmets mål för återställningspunkt (RPO) och återställningstid (RTO).

  • Mål för återställningspunkt (RPO): Maximal varaktighet för acceptabel dataförlust. RPO mäts i tidsenheter, inte i volym: ”30 minuters data”, ”fyra timmars data” och så vidare. RPO handlar om att begränsa och återställa från dataförlust, inte datastöld.
  • Mål för återställningstid (RTO): Den maximala längden på ett acceptabelt driftstopp, där ”driftstopp” måste definieras av din specifikation. Om den godtagbara stilleståndstiden är åtta timmar vid katastrofåterställning är ditt mål för återställningspunkt åtta timmar.

När du har definierat RPO och RTO kan du kan utforma säkerhetskopierings-, återställnings- och replikeringsfunktioner i arkitekturen för att uppfylla målen.

Varje molnprovider erbjuder en uppsättning tjänster och funktioner som du kan använda för att förbättra programmets tillgänglighet och återställningsfunktioner. I den mån det går så bör du använda befintliga tjänster och metodtips och undvika att skapa dina egna.

Hårddiskar kan misslyckas, datacenter kan bli onåbara och hackers kan angripa. Det är viktigt att du bibehåller ett gott rykte mot dina kunder med hjälp av tillgänglighet och återställning. Tillgänglighet fokuserar på att upprätthålla drifttid tack vare villkor som nätverksavbrott och återställningsfunktioner som fokuserar på hämtning av data efter en katastrof.

Testa dina kunskaper

1.

Anta att du vill öka tillgängligheten för ditt system för att kunna ge ett bättre servicenivåavtal (SLA) åt dina kunder. Vilket av följande är en vägledande princip som du kan använda?

2.

Vilket av följande skulle påverkas av ditt definierade återställningspunktmål (RPO)?