Skydda och återställa i moln hanteringProtect and recover in cloud management

Efter att de har uppfyllt kraven för inventering och synlighet och operativakrav kan moln hanterings team förutse och förbereda för en potentiell arbets belastnings störning.After they've met the requirements for inventory and visibility and operational compliance, cloud management teams can anticipate and prepare for a potential workload outage. När de planerar för moln hantering måste teamen börja med ett antagande om att något kommer att Miss förväntas.As they're planning for cloud management, the teams must start with an assumption that something will fail.

Ingen teknisk lösning kan konsekvent erbjuda ett SLA för 100 procents drift tid.No technical solution can consistently offer a 100 percent uptime SLA. Lösningar med de mest redundanta arkitekturerna är anspråk på att leverera "sex nior" eller 99,9999 procent drift tid.Solutions with the most redundant architectures claim to deliver on "six 9s" or 99.9999 percent uptime. Men även om en "sex nior"-lösning går nere i 31,6 sekunder under ett och samma år.But even a "six 9s" solution goes down for 31.6 seconds in any given year. Sadly är det sällsynt för en lösning att motivera en stor, kontinuerlig drifts investering som krävs för att uppnå "sex nior" av drift tid.Sadly, it's rare for a solution to warrant a large, ongoing operational investment that's required to reach "six 9s" of uptime.

Förberedelse för ett avbrott gör det möjligt för teamet att upptäcka fel snart och återställa snabbare.Preparation for an outage allows the team to detect failures sooner and recover more quickly. Fokus för den här disciplinen finns på de steg som kommer direkt efter ett system som Miss lyckas.The focus of this discipline is on the steps that come immediately after a system fails. Hur skyddar du arbets belastningar så att de kan återställas snabbt när ett avbrott uppstår?How do you protect workloads, so that they can be recovered quickly when an outage occurs?

Översätt skydds-och återställnings konversationerTranslate protection and recovery conversations

Arbets belastningarna som Power Business-åtgärder består av program, data, virtuella datorer och andra till gångar.The workloads that power business operations consist of applications, data, virtual machines (VMs), and other assets. Var och en av dessa till gångar kan kräva en annan metod för skydd och återställning.Each of those assets might require a different approach to protection and recovery. Den viktigaste aspekten av denna disciplin är att upprätta ett konsekvent åtagande inom hanterings bas linjen, vilket kan ge en start punkt under affärs diskussioner.The important aspect of this discipline is to establish a consistent commitment within the management baseline, which can provide a starting point during business discussions.

Som minst bör varje till gång som har stöd för en viss arbets belastning ha en bas linje med ett tydligt åtagande för hastighet på återställnings tiden (återställnings mål, eller RTO) och risken för data förlust (återställnings punkt mål eller återställnings punkter).At a minimum, each asset that supports any given workload should have a baseline approach with a clear commitment to speed of recovery (recovery time objectives, or RTO) and risk of data loss (recovery point objectives, or RPO).

Mål för återställnings tid (RTO)Recovery time objectives (RTO)

När haveriet inträffar är ett återställnings tids mål den tid det tar att återställa systemet till sitt tillstånd före haveriet.When disaster strikes, a recovery time objective is the amount of time it should take to recovery any system to its state prior to the disaster. För varje arbets belastning omfattar det den tid som krävs för att återställa minimi kraven för de virtuella datorerna och programmen.For each workload, that would include the time required to restore minimum necessary functionality for the VMs and applications. Den innehåller också den tid som krävs för att återställa de data som krävs av programmen.It also includes the amount of time required to restore the data that's required by the applications.

I affärs villkor representerar RTO den tid som affärs processen kommer att vara ur drift.In business terms, RTO represents the amount of time that the business process will be out of service. För verksamhets kritiska arbets belastningar bör den här variabeln vara relativt låg, vilket gör det möjligt för affärs processerna att återupptas snabbt.For mission-critical workloads, this variable should be relatively low, allowing the business processes to resume quickly. För arbets belastningar med lägre prioritet kanske en standard nivå av RTO inte har en märkbar inverkan på företagets prestanda.For lower-priority workloads, a standard level of RTO might not have a noticeable impact on company performance.

Hanterings bas linjen bör upprätta en standard RTO för arbets belastningar som inte är verksamhets kritiska.The management baseline should establish a standard RTO for non-mission-critical workloads. Företaget kan sedan använda denna bas linje som ett sätt att motivera ytterligare investeringar i återställnings tider.The business can then use that baseline as a way to justify additional investments in recovery times.

Återställnings punkt mål (återställnings punkt mål)Recovery point objectives (RPO)

I de flesta moln hanterings system samlas data regelbundet in och lagras i en viss form av data skydd.In most cloud management systems, data is periodically captured and stored through some form of data protection. Senaste gången som data samlades in kallas en återställnings punkt.The last time data was captured is referred to as a recovery point. När ett system Miss lyckas kan det bara återställas till den senaste återställnings punkten.When a system fails, it can be restored only to the most recent recovery point.

Om ett system har ett återställnings punkt mål som mäts i timmar eller dagar skulle ett systemfel leda till förlust av data för dessa timmar eller dagar mellan den senaste återställnings punkten och avbrottet.If a system has a recovery point objective that's measured in hours or days, a system failure would result in the loss of data for those hours or days between the last recovery point and the outage. En engångs transaktion skulle teoretiskt leda till förlust av alla transaktioner under den dag som ledde till problemet.A one-day RPO would theoretically result in the loss of all transactions in the day leading up to the failure.

För verksamhets kritiska system kan en återställning som mäts på minuter eller sekunder vara mer lämplig att använda för att undvika förlust av intäkter.For mission-critical systems, an RPO that's measured in minutes or seconds might be more appropriate to use to avoid a loss in revenue. Men en kortare återställning leder vanligt vis till en ökning av de totala hanterings kostnaderna.But a shorter RPO generally results in an increase in overall management costs.

För att minimera kostnaderna bör en hanterings bas linje fokusera på den längsta acceptabla återställningen.To help minimize costs, a management baseline should focus on the longest acceptable RPO. Moln hanterings teamet kan sedan öka återställningen av vissa plattformar eller arbets belastningar, vilket skulle motivera mer investering.The cloud management team can then increase the RPO of specific platforms or workloads, which would warrant more investment.

Skydda och återställa arbets belastningarProtect and recover workloads

De flesta av arbets belastningarna i en IT-miljö stöder en enskild affärs-eller teknisk process.Most of the workloads in an IT environment support a specific business or technical process. System som inte har en system påverkan på verksamheten garanterar inte ofta de ökade investeringar som krävs för att återställa snabbt eller minimera data förlust.Systems that don't have a systemic impact on business operations often don't warrant the increased investments required to recover quickly or minimize data loss. Genom att upprätta en bas linje kan företaget tydligt förstå vilken nivå av återställnings support som kan erbjudas till en konsekvent, hanterbar pris punkt.By establishing a baseline, the business can clearly understand what level of recovery support can be offered at a consistent, manageable price point. Den här förståelsen hjälper affärs intressenter att utvärdera värdet av en ökad investering i återställningen.This understanding helps the business stakeholders evaluate the value of an increased investment in recovery.

För de flesta moln hanterings team ger en förbättrad bas linje med specifika återställnings-/RTO-åtaganden för olika till gångar den mest fördelaktig sökvägen till ömsesidiga affärs åtaganden.For most cloud management teams, an enhanced baseline with specific RPO/RTO commitments for various assets yields the most favorable path to mutual business commitments. I följande avsnitt beskrivs några vanliga utökade bas linjer som ger verksamheten möjlighet att enkelt lägga till skydds-och återställnings funktioner genom en upprepnings bar process.The following sections outline a few common enhanced baselines that empower the business to easily add protection and recovery functionality through a repeatable process.

Skydda och återställa dataProtect and recover data

Data är utan tvekan den värdefulla till gången i den digitala ekonomin.Data is arguably the most valuable asset in the digital economy. Möjligheten att skydda och återställa data på ett mer effektivt sätt är den vanligaste utökade bas linjen.The ability to protect and recover data more effectively is the most common enhanced baseline. För de data som ger en produktions arbets belastning kan förlust av data direkt likställas med förlust av intäkter eller förlust av lönsamhet.For the data that powers a production workload, loss of data can be directly equated to loss in revenue or loss of profitability. Vi uppmuntrar vanligt vis moln hanterings grupper att erbjuda en nivå av utökad hanterings bas linje som stöder gemensamma data plattformar.We generally encourage cloud management teams to offer a level of enhanced management baseline that supports common data platforms.

Innan moln hanterings grupper implementerar plattforms åtgärder är det vanligt att de har stöd för förbättrade åtgärder för en plattform som en tjänst (PaaS) data plattform.Before cloud management teams implement platform operations, it's common for them to support improved operations for a platform as a service (PaaS) data platform. Det är till exempel enkelt för ett moln hanterings team att upprätthålla en högre frekvens av säkerhets kopierings-eller multiregion-replikering för Azure SQL Database-eller Azure Cosmos DB-lösningar.For instance, it's easy for a cloud management team to enforce a higher frequency of backup or multiregion replication for Azure SQL Database or Azure Cosmos DB solutions. På så sätt kan utvecklings teamet enkelt förbättra återställnings möjligheterna genom att använda sina dataplattformar.Doing so allows the development team to easily improve RPO by modernizing their data platforms.

Mer information om den här processen finns i plattforms åtgärds disciplin.To learn more about this thought process, see Platform operations discipline.

Skydda och återställa virtuella datorerProtect and recover VMs

De flesta arbets belastningar har vissa beroenden på virtuella datorer, vilka är värdar för olika aspekter av lösningen.Most workloads have some dependency on virtual machines, which host various aspects of the solution. För att arbets belastningen ska stödja en affärs process efter ett systemfel måste vissa virtuella datorer återställas snabbt.For the workload to support a business process after a system failure, some virtual machines must be recovered quickly.

Varje minut på de virtuella datorerna kan leda till förlust av intäkter eller lägre lönsamhet.Every minute of downtime on those virtual machines could cause lost revenue or reduced profitability. När den virtuella datorns stillestånds tid har direkt inverkan på verksamhetens räkenskaps prestanda är RTO mycket viktigt.When VM downtime has a direct impact on the fiscal performance of the business, RTO is very important. Virtuella datorer kan återställas snabbare med hjälp av replikering till en sekundär plats och automatisk återställning, en modell som kallas snabb och varm återställnings modell.Virtual machines can be recovered more quickly by using replication to a secondary site and automated recovery, a model that's referred to as a hot-warm recovery model. Med det högsta läget för återställning kan virtuella datorer replikeras till en helt funktionell, sekundär plats.At the highest state of recovery, virtual machines can be replicated to a fully functional, secondary site. Den här dyrare metoden kallas för hög tillgänglighet, eller frekvent frekvent återställnings modell.This more expensive approach is referred to as a high-availability, or hot-hot, recovery model.

Var och en av de föregående modellerna minskar RTO, vilket resulterar i en snabbare återställning av affärs processens funktioner.Each of the preceding models reduces the RTO, resulting in a faster restoration of business process capabilities. Varje modell leder dock också till betydligt ökad moln hanterings kostnader.However, each model also results in significantly increased cloud management costs.

Observera också att säkerhets kopieringen, förutom replikering för hög tillgänglighet, är aktive rad för scenarier som oavsiktlig borttagning, skadade data och utpressnings angrepp.Also, please note that, apart from replication for high-availability, backup should be enabled for scenarios such as accidental delete, data corruption and ransomware attacks.

Mer information om den här processen finns i disciplin för arbets belastnings åtgärder.For more information about this thought process, see Workload operations discipline.

Nästa stegNext steps

När den här hanterings bas linje komponenten är uppfylld kan teamet gå vidare för att undvika avbrott i plattformens drift -och arbets belastnings åtgärder.After this management baseline component is met, the team can look ahead to avoid outages in its platform operations and workload operations.