Tillförlitlighetsmönster
Tillgänglighet
Tillgängligheten mäts som en procentandel av drifttiden och definierar hur stor del av tiden som ett system är funktionellt och fungerande. Tillgängligheten påverkas av systemfel, infrastrukturproblem, skadliga attacker och systembelastning. Molnprogram ger vanligtvis användarna ett serviceavtal (SLA), vilket innebär att program måste utformas och implementeras för att maximera tillgängligheten.
| Mönster | Sammanfattning |
|---|---|
| Distributionsstämplar | Distribuera flera oberoende kopior av programkomponenter, inklusive datalager. |
| Geodes | Distribuera serverdelstjänster till en uppsättning geografiska noder, som var och en kan betjäna alla klientbegäranden i alla regioner. |
| Övervakning av slutpunktshälsa | Implementera funktionskontroller i ett program som externa verktyg kan komma åt via exponerade slutpunkter med jämna mellanrum. |
| Köbaserad belastningsutjämning | Använd en kö som fungerar som en buffert mellan en uppgift och en tjänst som den anropar för att jämna ut tillfälliga tunga belastningar. |
| Begränsning | Kontrollera förbrukningen av resurser av en instans av ett program, en enskild klientorganisation eller en hel tjänst. |
För att minimera tillgänglighetsrisker från skadliga DDoS-attacker (Distributed Denial of Service) implementerar du den interna Azure DDoS Protection-standardtjänsten eller en funktion från tredje part.
Hög tillgänglighet
Azure-infrastrukturen består av geografiska områden, regioner och Tillgänglighetszoner, som begränsar radien för ett fel och därmed begränsar den potentiella påverkan på kundprogram och data. Den Azure-tillgänglighetszoner har utvecklats för att tillhandahålla en programvaru- och nätverkslösning som skyddar mot datacenterfel och ger våra kunder ökad hög tillgänglighet (HA). Med HA-arkitekturen finns det en balans mellan hög återhämtning, låg latens och kostnad.
| Mönster | Sammanfattning |
|---|---|
| Distributionsstämplar | Distribuera flera oberoende kopior av programkomponenter, inklusive datalager. |
| Geodes | Distribuera serverdelstjänster till en uppsättning geografiska noder, som var och en kan betjäna alla klientbegäranden i alla regioner. |
| Övervakning av slutpunktshälsa | Implementera funktionskontroller i ett program som externa verktyg kan komma åt via exponerade slutpunkter med jämna mellanrum. |
| Bulkhead | Isolera element i ett program i pooler så att de andra fortfarande fungerar om det skulle uppstå ett fel i ett element. |
| Kretsbrytare | Hantera fel som kan ta varierande lång tid att lösa vid anslutning till en fjärrtjänst eller fjärresurs. |
Återhämtning
Återhämtning är möjligheten för ett system att hantera och återställa fel på ett smidigt sätt, både oavsiktligt och skadligt.
Molnprogram har ofta flera klientorganisationer, använder delade plattformstjänster, konkurrerar om resurser och bandbredd, kommunicerar via internet och körs på vanlig maskinvara, så risken för både tillfälliga och permanenta fel är större. Internets anslutna natur och den ökande sofistikerade och volym av attacker ökar sannolikheten för ett säkerhetsavbrott.
Det är nödvändigt att identifiera fel och återställa snabbt och effektivt för att bibehålla återhämtningsförmågan.
| Mönster | Sammanfattning |
|---|---|
| Bulkhead | Isolera element i ett program i pooler så att de andra fortfarande fungerar om det skulle uppstå ett fel i ett element. |
| Kretsbrytare | Hantera fel som kan ta varierande lång tid att lösa vid anslutning till en fjärrtjänst eller fjärresurs. |
| Kompenserande transaktion | Ångra arbete som utförts i en serie steg och som tillsammans eventuellt definierar en konsekvent åtgärd. |
| Övervakning av slutpunktshälsa | Implementera funktionskontroller i ett program som externa verktyg kan komma åt via exponerade slutpunkter med jämna mellanrum. |
| Val av ledare | Samordna de åtgärder som utförs av en samling samverkande uppgiftsinstanser i ett distribuerat program genom att välja en instans som ska ansvara för att hantera de andra instanserna. |
| Köbaserad belastningsutjämning | Använd en kö som fungerar som en buffert mellan en aktivitet och en tjänst den anropar för att utjämna återkommande tunga belastningar. |
| Försök igen | Gör så att ett program kan hantera förväntade, tillfälligt fel vid försök att ansluta till en tjänst eller en nätverksresurs, genom att transparent försöka utföra den misslyckade åtgärden igen. |
| Scheduler-agentövervakare | Samordna en uppsättning åtgärder i en distribuerad uppsättning tjänster och andra fjärranslutna resurser. |