Etablera granskning av driftslämplighetEstablish an operational fitness review

I takt med att ditt företag börjar arbeta med arbets belastningar i Azure är nästa steg att upprätta en process för utvärdering av drifts förmåga.As your enterprise begins to operate workloads in Azure, the next step is to establish a process for operational fitness review. Med den här processen räknas, implementeras och upprepas de icke- funktionella kraven för dessa arbets belastningar.This process enumerates, implements, and iteratively reviews the nonfunctional requirements for these workloads. Icke-funktionella krav är relaterade till tjänstens förväntade drift beteende.Nonfunctional requirements are related to the expected operational behavior of the service.

Det finns fem viktiga kategorier av icke-funktionella krav, som kallas för grundpelarna i arkitektur:There are five essential categories of nonfunctional requirements, known as the pillars of architecture excellence:

  • KostnadsoptimeringCost optimization
  • Utmärkt driftseffektivitetOperational excellence
  • PrestandaeffektivitetPerformance efficiency
  • TillförlitlighetReliability
  • SäkerhetSecurity

En process för granskning av operativa krav garanterar att dina verksamhets kritiska arbets belastningar uppfyller förväntningarna för din verksamhet med avseende på grund stenarna.A process for operational fitness review ensures that your mission-critical workloads meet the expectations of your business with respect to the pillars.

Skapa en process för verksamhets vårds granskning för att helt förstå de problem som uppstår när du kör arbets belastningar i en produktions miljö och hur du kan åtgärda och lösa problemen.Create a process for operational fitness review to fully understand the problems that result from running workloads in a production environment, and how to remediate and resolve those problems. Den här artikeln beskriver en övergripande process för att få en verksamhets vårds recension som ditt företag kan använda för att uppnå det här målet.This article outlines a high-level process for operational fitness review that your enterprise can use to achieve this goal.

Drifts lämplighet hos MicrosoftOperational fitness at Microsoft

Från början har många team i Microsoft varit inblandade i utvecklingen av Azure-plattformen.From the outset, many teams across Microsoft have been involved in the development of the Azure platform. Det är svårt att garantera kvalitet och konsekvens för ett projekt av sådan storlek och komplexitet.It's difficult to ensure quality and consistency for a project of such size and complexity. Du behöver en robust process för att räkna upp och implementera grundläggande icke-funktionella krav regelbundet.You need a robust process to enumerate and implement fundamental nonfunctional requirements on a regular basis.

De processer som Microsoft följer utgör grunden för de processer som beskrivs i den här artikeln.The processes that Microsoft follows form the basis for the processes outlined in this article.

Förstå problemetUnderstand the problem

Som beskrivs i Kom igång: påskynda migreringen, det första steget i företagets digitala omvandling är att identifiera de affärs problem som ska lösas genom att använda Azure.As discussed in Get started: Accelerate migration, the first step in an enterprise's digital transformation is to identify the business problems to be solved by adopting Azure. Nästa steg är att fastställa en lösning på hög nivå för problemet, till exempel migrera en arbets belastning till molnet eller anpassa en befintlig lokal tjänst för att inkludera moln funktioner.The next step is to determine a high-level solution to the problem, such as migrating a workload to the cloud or adapting an existing, on-premises service to include cloud functionality. Slutligen kan du utforma och implementera lösningen.Finally, you design and implement the solution.

Under den här processen är fokus ofta att fokusera på funktionerna i tjänsten: den uppsättning funktions krav som du vill att tjänsten ska utföra.During this process, the focus is often on the features of the service: the set of functional requirements that you want the service to perform. En produkt leverans tjänst kräver till exempel funktioner för att fastställa käll-och mål platser för produkten, spåra produkten under leverans och skicka meddelanden till kunden.For example, a product-delivery service requires features for determining the source and destination locations of the product, tracking the product during delivery, and sending notifications to the customer.

De funktioner som inte fungerar, är däremot relaterade till egenskaper som tjänstens tillgänglighet, återhämtningoch skalbarhet.The nonfunctional requirements, in contrast, relate to properties such as the service's availability, resiliency, and scalability. Dessa egenskaper skiljer sig från funktions kraven eftersom de inte direkt påverkar den slutliga funktionen för en viss funktion i tjänsten.These properties differ from the functional requirements because they don't directly affect the final function of any particular feature in the service. Men inte funktions kraven relaterar till tjänstens prestanda och kontinuitet.However, nonfunctional requirements do relate to the performance and continuity of the service.

Du kan ange vissa krav som inte fungerar i enlighet med ett service avtal (SLA).You can specify some nonfunctional requirements in terms of a service-level agreement (SLA). Du kan till exempel uttrycka tjänste kontinuiteten i procent av tillgängligheten: "tillgänglig 99,99 procent av tiden".For example, you can express service continuity as a percentage of availability: "available 99.99 percent of the time". Andra ej fungerande krav kan vara svårare att definiera och kan ändras när produktions behoven förändras.Other nonfunctional requirements might be more difficult to define and might change as production needs change. En kundorienterad tjänst kan till exempel påverka förväntade data flödes krav efter en överspänning av popularitet.For example, a consumer-oriented service might face unanticipated throughput requirements after a surge of popularity.

Anteckning

Mer information om återhämtnings krav finns i utforma pålitliga Azure-program.For more information about resiliency requirements, see Designing reliable Azure applications. Artikeln innehåller förklaringar av begrepp som återställnings punkt mål (återställnings punkt mål), återställnings tids mål (RTO) och service avtal.That article includes explanations of concepts like recovery-point objective (RPO), recovery-time objective (RTO), and SLA.

Process för översyn av drifts förmågaProcess for operational fitness review

Nyckeln för att upprätthålla prestanda och kontinuitet för ett företags tjänster är att implementera en process för drifts-och tränings granskning.The key to maintaining the performance and continuity of an enterprise's services is to implement a process for operational fitness review.

En översikt över processen för översyn av drifts förmåga

Processen har två faser på hög nivå.At a high level, the process has two phases. I krav fasen upprättas kraven och mappas till stöd för tjänster.In the prerequisites phase, the requirements are established and mapped to supporting services. Den här fasen inträffar sällan: kanske varje år eller när nya åtgärder införs.This phase occurs infrequently: perhaps annually or when new operations are introduced. Utdata från krav fasen används i flödes fasen.The output of the prerequisites phase is used in the flow phase. Flödes fasen förekommer oftare, till exempel varje månad.The flow phase occurs more frequently, such as monthly.

Krav fasPrerequisites phase

Stegen i den här fasen fångar upp kraven för att utföra en regelbunden granskning av de viktiga tjänsterna.The steps in this phase capture the requirements for conducting a regular review of the important services.

  1. Identifiera kritiska affärs åtgärder.Identify critical business operations. Identifiera företagets verksamhets kritiska affärs åtgärder.Identify the enterprise's mission-critical business operations. Affärs åtgärder är oberoende av alla stöd tjänster.Business operations are independent from any supporting service functionality. Med andra ord representerar affärs åtgärder de faktiska aktiviteter som företaget behöver utföra och som stöds av en uppsättning IT-tjänster.In other words, business operations represent the actual activities that the business needs to perform and that are supported by a set of IT services.

    Termen verksamhets kritisk (eller verksamhets kritisk) återspeglar en allvarlig påverkan på verksamheten om åtgärden störs.The term mission-critical (or business-critical) reflects a severe impact on the business if the operation is impeded. En online-detaljist kan till exempel ha en affärs åtgärd, till exempel "göra det möjligt för en kund att lägga till ett objekt i en Shopping vagn" eller "bearbeta en kredit korts betalning".For example, an online retailer might have a business operation, such as "enable a customer to add an item to a shopping cart" or "process a credit card payment." Om någon av dessa åtgärder Miss lyckas kan en kund inte slutföra transaktionen och företaget kan inte realisera försäljning.If either of these operations fails, a customer can't complete the transaction and the enterprise fails to realize sales.

  2. Mappa åtgärder till tjänster.Map operations to services. Mappa kritiska affärs åtgärder till de tjänster som stöder dem.Map the critical business operations to the services that support them. I shopping-shopping-exemplet kan flera tjänster delta, inklusive en inventering av lager hanterings tjänster och en shopping vagns tjänst.In the shopping-cart example, several services might be involved, including an inventory stock-management service and a shopping-cart service. För att kunna bearbeta en kredit korts betalning kan en lokal betalnings tjänst samverka med en tredje part, tjänsten för betalnings bearbetning.To process a credit-card payment, an on-premises payment service might interact with a third-party, payment-processing service.

  3. Analysera tjänst beroenden.Analyze service dependencies. De flesta affärs åtgärder kräver samordning mellan flera stöd tjänster.Most business operations require orchestration among multiple supporting services. Det är viktigt att förstå beroenden mellan tjänsterna och flödet av verksamhets kritiska transaktioner genom dessa tjänster.It's important to understand the dependencies between the services, and the flow of mission-critical transactions through these services.

    Överväg även beroenden mellan lokala tjänster och Azure-tjänster.Also consider the dependencies between on-premises services and Azure services. I shopping-shopping-exemplet kan inventeringen av lager hanterings tjänsten finnas lokalt och mata in data som anges av anställda från ett fysiskt lager.In the shopping-cart example, the inventory stock-management service might be hosted on-premises and ingest data entered by employees from a physical warehouse. Det kan dock lagra data från andra platser i en Azure-tjänst, till exempel Azure Storageeller en databas, till exempel Azure Cosmos DB.However, it might store data off-premises in an Azure service, such as Azure Storage, or a database, such as Azure Cosmos DB.

Utdata från dessa aktiviteter är en uppsättning styrkorts mått för tjänst åtgärder.An output from these activities is a set of scorecard metrics for service operations. Styrkortet mäter kriterier som tillgänglighet, skalbarhet och haveri beredskap.The scorecard measures criteria such as availability, scalability, and disaster recovery. Styrkortets mått uttrycker de operativa villkor som du förväntar dig att tjänsten ska uppfylla.Scorecard metrics express the operational criteria that you expect the service to meet. Dessa mått kan uttryckas på alla nivåer av granularitet som är lämpliga för tjänst åtgärden.These metrics can be expressed at any level of granularity that's appropriate for the service operation.

Styrkortet bör uttryckas i enkla termer för att under lätta en meningsfull diskussion mellan företagets ägare och teknik.The scorecard should be expressed in simple terms to facilitate meaningful discussion between the business owners and engineering. Ett styrkorts Mät värde för skalbarhet kan till exempel vara färgkodat på ett enkelt sätt.For example, a scorecard metric for scalability might be color-coded in a simple way. Grönt innebär att de definierade villkoren uppfylls, gult innebär att det inte går att uppfylla de definierade kriterierna, men aktivt implementera en planerad åtgärd och rött innebär att det inte går att uppfylla de definierade kriterierna utan någon plan eller åtgärd.Green means meeting the defined criteria, yellow means failing to meet the defined criteria but actively implementing a planned remediation, and red means failing to meet the defined criteria with no plan or action.

Det är viktigt att betona att dessa mått bör vara direkt reflekterar affärs behoven.It's important to emphasize that these metrics should directly reflect business needs.

Tjänst – gransknings fasService-review phase

Tjänsten för granskning av tjänster är kärnan i den operativa tränings granskningen.The service-review phase is the core of the operational fitness review. Det omfattar följande steg:It involves these steps:

  1. Mät tjänst mått.Measure service metrics. Använd styrkortets mått för att övervaka tjänsterna för att säkerställa att tjänsterna uppfyller affärs förväntningarna.Use the scorecard metrics to monitor the services, to ensure that the services meet the business expectations. Tjänst övervakning är viktigt.Service monitoring is essential. Om du inte kan övervaka en uppsättning tjänster med avseende på de funktioner som inte fungerar, bör du överväga att motsvarande styrkorts mått är röda.If you can't monitor a set of services with respect to the nonfunctional requirements, consider the corresponding scorecard metrics to be red. I det här fallet är det första steget för reparation att implementera lämplig tjänst övervakning.In this case, the first step for remediation is to implement the appropriate service monitoring. Om företaget till exempel förväntar sig att en tjänst ska fungera med 99,99 procents tillgänglighet, men det inte finns någon produktions telemetri på plats för att mäta tillgänglighet, förutsätter vi att du inte uppfyller kravet.For example, if the business expects a service to operate with 99.99 percent availability, but there is no production telemetry in place to measure availability, assume that you're not meeting the requirement.

  2. Planera reparation.Plan remediation. För varje tjänst åtgärd där måtten unders tiger ett acceptabelt tröskelvärde bestämmer du kostnaden för att åtgärda tjänsten för att vidta åtgärder på en acceptabel nivå.For each service operation for which metrics fall below an acceptable threshold, determine the cost of remediating the service to bring operation to an acceptable level. Om kostnaden för att åtgärda tjänsten är större än den förväntade intäkten av tjänsten kan du gå vidare för att ta hänsyn till de immateriella kostnaderna, till exempel kund upplevelse.If the cost of remediating the service is greater than the expected revenue generation of the service, move on to consider the intangible costs, such as customer experience. Om kunderna till exempel har svårt att placera en lyckad beställning med hjälp av tjänsten kan de välja en konkurrent i stället.For example, if customers have difficulty placing a successful order by using the service, they might choose a competitor instead.

  3. Implementera reparation.Implement remediation. När företags ägarna och teknik teamet samtycker till en plan implementerar du den.After the business owners and engineering team agree on a plan, implement it. Rapportera status för implementeringen när du granskar styrkortets mått.Report the status of the implementation whenever you review scorecard metrics.

Den här processen är iterativ och det är idealiskt att ditt företag har ett team avsett för IT.This process is iterative, and ideally your enterprise has a team dedicated to it. Det här teamet bör uppfylla regelbundet för att granska befintliga reparations projekt, inleda den grundläggande granskningen av nya arbets belastningar och spåra företagets övergripande styrkort.This team should meet regularly to review existing remediation projects, kick off the fundamental review of new workloads, and track the enterprise's overall scorecard. Teamet bör även ha befogenhet att hålla reparations teamen beroende av om de ligger bakom schemat eller inte uppfyller måtten.The team should also have the authority to hold remediation teams accountable if they're behind schedule or fail to meet metrics.

Gransknings teamets strukturStructure of the review team

Teamet som ansvarar för den operativa tränings granskningen består av följande roller:The team responsible for operational fitness review is composed of the following roles:

  • Företags ägare: Ger kunskap om verksamheten för att identifiera och prioritera varje verksamhets kritisk affärs åtgärd.Business owner: Provides knowledge of the business to identify and prioritize each mission-critical business operation. Den här rollen Jämför även minsknings kostnaderna med påverkan på verksamheten och bedriver det slutliga beslutet om reparation.This role also compares the mitigation cost to the business impact, and drives the final decision on remediation.

  • Affärs advokat: Delar upp affärs åtgärder i diskret-delar och mappar dessa delar till tjänster och infrastruktur, oavsett om de finns lokalt eller i molnet.Business advocate: Breaks down business operations into discreet parts, and maps those parts to services and infrastructure, whether on-premises or in the cloud. Rollen kräver djupgående kunskap om den teknik som är kopplad till varje affärs åtgärd.The role requires deep knowledge of the technology associated with each business operation.

  • Tekniker ägare: Implementerar de tjänster som är associerade med affärs åtgärden.Engineering owner: Implements the services associated with the business operation. Dessa personer kan delta i utformningen, implementeringen och distributionen av lösningar för problem som inte är av en funktion som inte kan hanteras av gransknings teamet.These individuals might participate in the design, implementation, and deployment of any solutions for nonfunctional requirement problems that are uncovered by the review team.

  • Tjänst ägare: Driver verksamhetens program och tjänster.Service owner: Operates the business's applications and services. Dessa personer samlar in loggnings-och användnings data för dessa program och tjänster.These individuals collect logging and usage data for these applications and services. Dessa data används både för att identifiera problem och för att verifiera korrigeringar när de har distribuerats.This data is used both to identify problems and to verify fixes after they're deployed.

Granska möteReview meeting

Vi rekommenderar att ditt gransknings team uppfyller vanliga villkor.We recommend that your review team meet on a regular basis. Teamet kan till exempel mötas per månad och sedan rapportera status och mått till chefens ledarskaps period.For example, the team might meet monthly, and then report status and metrics to senior leadership on a quarterly basis.

Anpassa informationen om processen och mötet så att den passar just dina behov.Adapt the details of the process and meeting to fit your specific needs. Vi rekommenderar följande uppgifter som utgångs punkt:We recommend the following tasks as a starting point:

  1. Företagets ägare och affärs rådgivare räknar upp och avgör de funktions krav som ställs för varje affärs åtgärd, med inmatat från tekniker och tjänst ägare.The business owner and business advocate enumerate and determine the nonfunctional requirements for each business operation, with input from the engineering and service owners. Granska och verifiera prioritet för affärs åtgärder som har identifierats tidigare.For business operations that have been identified previously, review and verify the priority. Tilldela en prioritet i den befintliga listan för nya affärs åtgärder.For new business operations, assign a priority in the existing list.

  2. Teknik-och tjänst ägarna mappar affärs verksamhetens aktuella tillstånd till motsvarande lokala tjänster och moln tjänster.The engineering and service owners map the current state of business operations to the corresponding on-premises and cloud services. Mappningen är en lista över komponenterna i varje tjänst, orienterade som ett beroende träd.The mapping is a list of the components in each service, oriented as a dependency tree. Tjänste ägarnas tekniker och tjänster avgör sedan de kritiska Sök vägarna i trädet.The engineering and service owners then determine the critical paths through the tree.

  3. Teknik-och tjänst ägarna granskar det aktuella läget för drifts loggning och övervakning av de tjänster som anges i föregående steg.The engineering and service owners review the current state of operational logging and monitoring for the services listed in the previous step. Robust loggning och övervakning är kritiskt: de identifierar tjänst komponenter som bidrar till att det inte går att uppfylla icke-funktionella krav.Robust logging and monitoring are critical: they identify service components that contribute to a failure to meet nonfunctional requirements. Om det inte finns tillräckligt med loggning och övervakning på plats måste teamet placera dem på plats genom att skapa och implementera en plan.If sufficient logging and monitoring aren't in place, the team must put them in place by creating and implementing a plan.

  4. Teamet skapar styrkorts mått för nya affärs åtgärder.The team creates scorecard metrics for new business operations. Styrkortet består av listan över komponent komponenter för varje tjänst som identifieras i steg 2.The scorecard consists of the list of constituent components for each service identified in step 2. Det är justerat med de infunktionella kraven och innehåller ett mått på hur väl varje komponent uppfyller kraven.It's aligned with the nonfunctional requirements, and includes a measure of how well each component meets the requirements.

  5. För komponenter som inte uppfyller kraven, utformar teamet en hög nivå lösning och tilldelar en teknisk ägare.For constituent components that fail to meet nonfunctional requirements, the team designs a high-level solution, and assigns an engineering owner. I detta läge upprättar företags ägaren och affärs advokaten en budget för reparations arbetet, baserat på den förväntade intäkterna från affärs verksamheten.At this point, the business owner and business advocate establish a budget for the remediation work, based on the expected revenue of the business operation.

  6. Slutligen genomför teamet en granskning av det pågående reparations arbetet.Finally, the team conducts a review of the ongoing remediation work. Varje styrkorts mått för pågående arbete granskas mot de förväntade kriterierna.Each of the scorecard metrics for work in progress is reviewed against the expected criteria. För komponenter som uppfyller mått villkoren visar tjänst ägaren loggnings-och övervaknings data för att bekräfta att villkoren är uppfyllda.For constituent components that meet metric criteria, the service owner presents logging and monitoring data to confirm that the criteria are met. För de komponenter som inte uppfyller Mät värdena förklarar varje ingenjörs ägare de problem som förhindrar att villkor uppfylls och presenterar nya design funktioner för reparation.For those constituent components that don't meet metric criteria, each engineering owner explains the problems that are preventing criteria from being met, and presents any new designs for remediation.

  • Microsoft Azure Well-Architected Framework: Lär dig mer om att identifiera Tenets för att förbättra kvaliteten på en arbets belastning.Microsoft Azure Well-Architected Framework: Learn about guiding tenets for improving the quality of a workload. Ramverket består av fem grundpelare för en utmärkt arkitektur:The framework consists of five pillars of architecture excellence:
    • KostnadsoptimeringCost optimization
    • Utmärkt driftseffektivitetOperational excellence
    • PrestandaeffektivitetPerformance efficiency
    • TillförlitlighetReliability
    • SäkerhetSecurity
  • Tio design principer för Azure-program.Ten design principles for Azure applications. Följ de här designprinciperna för att göra programmet mer skalbart, återhämtningsbart och hanterbart.Follow these design principles to make your application more scalable, resilient, and manageable.
  • Utforma elastiska program för Azure.Designing resilient applications for Azure. Skapa och underhålla pålitliga system med en strukturerad metod under ett programs livs längd, från design och implementering till distribution och drift.Build and maintain reliable systems using a structured approach over the lifetime of an application, from design and implementation to deployment and operations.
  • Design mönster för molnet.Cloud design patterns. Använd design mönster för att skapa program i grundpelarna i arkitektur.Use design patterns to build applications on the pillars of architecture excellence.
  • Azure Advisor.Azure Advisor. Azure Advisor tillhandahåller anpassade rekommendationer baserat på användning och konfigurationer för att optimera resurserna för hög tillgänglighet, säkerhet, prestanda och kostnad.Azure Advisor provides personalized recommendations based on your usage and configurations to help optimize your resources for high availability, security, performance, and cost.