Operazioni del carico di lavoro nella gestione cloudWorkload operations in cloud management

Alcuni carichi di lavoro sono fondamentali per il successo dell'azienda.Some workloads are critical to the success of the business. Per questi carichi di lavoro, una linea di base di gestione non è sufficiente per soddisfare gli impegni aziendali richiesti per la gestione del cloud.For those workloads, a management baseline is insufficient to meet the required business commitments to cloud management. Le operazioni della piattaforma potrebbero non essere sufficienti per soddisfare gli impegni aziendali.Platform operations might not even be sufficient to meet business commitments. Questo subset di carichi di lavoro estremamente importante richiede un'attenzione specializzata sul modo in cui il carico di lavoro funziona e su come è supportato.This highly important subset of workloads requires a specialized focus on the way the workload functions and how it is supported.

In cambio, l'investimento nelle operazioni del carico di lavoro può comportare un miglioramento delle prestazioni, ridurre il rischio di interruzione aziendale e un ripristino più rapido quando si verificano errori di sistema.In return, the investment in workload operations can lead to improved performance, decreased risk of business interruption, and faster recovery when system failures occur. Questo articolo illustra un approccio per investire nelle operazioni continuative di questi carichi di lavoro con priorità alta per favorire un miglioramento degli impegni aziendali.This article discusses an approach to investing in the continued operations of these high priority workloads to drive improved business commitments.

Quando investire nelle operazioni del carico di lavoroWhen to invest in workload operations

Il principio di Pareto (anche noto come regola 80/20) indica che il 80% degli effetti proviene dal 20% delle cause.The Pareto principle (also known as the 80/20 rule) states that 80 percent of effects come from 20 percent of the causes. Quando i portfolio IT sono autorizzati a crescere in modo organico nel tempo, questa regola è spesso illustrata in una revisione del portfolio IT.When IT portfolios are allowed to grow organically over time, this rule is often illustrated in a review of the IT portfolio. A seconda dell'effetto che richiede investimenti, la ragione può variare, ma il principio generale è valido:Depending on the effect that requires investment, the cause can vary but the general principle holds true:

  • il 80% degli errori di sistema tende a essere il risultato del 20% degli errori comuni o dei bug.80 percent of system failures tend to be the result of 20 percent of the common errors or bugs.
  • il 80% del valore aziendale tende a provenire dal 20% dei carichi di lavoro in un portfolio.80 percent of business value tends to come from 20 percent of the workloads in a portfolio.
  • il 80% del lavoro richiesto per la migrazione al cloud deriva dal 20% dei carichi di lavoro spostati.80 percent of the effort to migrate to the cloud comes from 20 percent of the workloads being moved.
  • il 80% delle attività di gestione del cloud supporterà il 20% degli eventi imprevisti del servizio o dei ticket di problema.80 percent of cloud management efforts will support 20 percent of the service incidents or trouble tickets.
  • il 80% dell'impatto aziendale da un'interruzione produrrà dal 20% dei sistemi interessati dall'interruzione del servizio.80 percent of business impact from an outage will come from 20 percent of the systems affected by the outage.

Le operazioni del carico di lavoro devono essere applicate solo quando la strategia di adozione del cloud, i risultati aziendali e le metriche operative sono tutti ben noti.Workload operations should be applied only when the cloud adoption strategy, business outcomes, and operational metrics are each well understood. Si tratta di un cambiamento di paradigma rispetto alla visualizzazione classica.This is a paradigm shift from the classic view of IT. Tradizionalmente, si presumeva che tutti i carichi di lavoro hanno avuto lo stesso livello di supporto e che richiedevano livelli di priorità simili.Traditionally, IT assumed that all workloads experienced the same degree of support and required similar levels of priority.

Prima di investire in operazioni di carico di lavoro approfondite, sia l'IT che l'azienda devono comprendere le motivazioni aziendali e le aspettative di un maggior investimento nella gestione del cloud.Before they invest in deep workload operations, both IT and the business should understand the business justifications and the expectations of increased investment in cloud management.

Partire dai datiStart with the data

Le operazioni sui carichi di lavoro iniziano con una conoscenza approfondita dei requisiti di prestazioni e supporto del carico di lavoroWorkload operations begin with a deep understanding of workload performance and support requirements. Prima di investire nel carico di lavoro, il team deve avere dati avanzati sulle dipendenze del carico di lavoro, le prestazioni delle applicazioni, la diagnostica del database, la telemetria delle macchine virtuali e la cronologia degli eventiBefore the team invests in workload operations, it must have rich data about workload dependencies, application performance, database diagnostics, virtual machine telemetry, and incident history.

Questi dati si basano sulle informazioni approfondite che determinano le operazioni di gestione del carico di lavoro.This data seeds the insights that drive workload operations decisions.

Osservazione continuaContinued observation

I dati iniziali e i dati di telemetria in corso possono contribuire a formulare e testare teorie sulle prestazioni di un carico di lavoro.Initial data and ongoing telemetry can help formulate and test theories about the performance of a workload. Tuttavia, le operazioni in corso sui carichi di lavoro sono radicate in un'osservazione continua ed espansa delle prestazioni del carico di lavoro, con un notevole interesse per le prestazioni dell'applicazione e dei dati.But ongoing workload operations are rooted in a continued and expanded observation of workload performance, with a heavy focus on application and data performance.

Testare l'automazioneTest the automation

A livello di applicazione, i primi requisiti delle operazioni del carico di lavoro sono un investimento nel testing approfondito.At the application level, the first requirements of workload operations, is an investment in deep testing. Per qualsiasi applicazione supportata tramite le operazioni del carico di lavoro, è necessario stabilire un piano di test ed eseguirlo regolarmente per offrire test funzionali e di scalabilità tra le applicazioni.For any application that's supported through workload operations, a test plan should be established and regularly executed to deliver functional and scale testing across the applications.

I dati di telemetria di test regolari possono fornire la convalida immediata di varie ipotesi relative al funzionamento del carico di lavoro.Regular test telemetry can provide immediate validation of various hypotheses about the operation of the workload. Il miglioramento degli schemi operativi e dell'architettura può essere eseguito e testato.Improving operational and architectural patterns can be executed and tested. I Delta risultanti forniscono un'analisi di effetto chiara per guidare gli investimenti continui.The resulting deltas provide a clear impact analysis to guide continued investments.

Informazioni sulle versioniUnderstand releases

Una comprensione chiara dei cicli di rilascio e delle pipeline di versione è un elemento importante delle operazioni del carico di lavoro.A clear understanding of release cycles and release pipelines is an important element of workload operations.

Una comprensione dei cicli può prepararsi a potenziali interruzioni e consentire al team di gestire in modo proattivo le versioni che potrebbero produrre un effetto negativo sulle operazioni.An understanding of cycles can prepare for potential interruptions and allow the team to proactively address any releases that might produce an adverse effect on operations. Questa comprensione consente inoltre al team di gestione del cloud di collaborare con i team di adozione per migliorare costantemente la qualità del prodotto e risolvere eventuali bug che potrebbero influire sulla stabilità.This understanding also allows the cloud management team to partner with adoption teams to continuously improve the quality of the product and address any bugs that might affect stability.

Ancora più importante, una conoscenza delle pipeline di versione può migliorare significativamente l'obiettivo del punto di ripristino (RPO) di un carico di lavoro.More importantly, an understanding of release pipelines can significantly improve the recovery point objective (RPO) of a workload. In molti scenari, il percorso più veloce e più preciso del ripristino di un'applicazione è una pipeline di rilascio.In many scenarios, the fastest and most accurate path to the recovery of an application is a release pipeline. Per i livelli dell'applicazione che cambiano solo quando si verifica una nuova versione, potrebbe essere opportuno investire con maggiore attenzione nell'ottimizzazione della pipeline rispetto al ripristino dell'applicazione dai processi tradizionali di backup.For application layers that change only when a new release happens, it might be wise to invest more heavily in pipeline optimization than on the recovery of the application from traditional back-up processes.

Anche se una pipeline di distribuzione può essere il percorso più veloce per il ripristino, può anche essere il percorso più veloce per la correzione.Although a deployment pipeline can be the fastest path to recovery, it can also be the fastest path to remediation. Quando un'applicazione dispone di una pipeline di rilascio veloce, efficiente e affidabile, il team di gestione cloud ha la possibilità di automatizzare la distribuzione in un nuovo host come una forma di monitoraggio e aggiornamento automatico.When an application has a fast, efficient, and reliable release pipeline, the cloud management team has an option to automate deployment to a new host as a form of automated remediation.

Potrebbero essere presenti molti altri meccanismi più veloci ed efficaci per la correzione e il ripristino.There might be many other faster, more effective mechanisms for remediation and recovery. Tuttavia, quando l'uso di una pipeline esistente può soddisfare gli impegni aziendali e capitalizzare gli investimenti DevOps esistenti, la pipeline esistente potrebbe essere un'alternativa valida.However, when the use of an existing pipeline can meet business commitments and capitalize on existing DevOps investments, the existing pipeline might be a viable alternative.

Comunicare chiaramente le modifiche al carico di lavoroClearly communicate changes to the workload

La modifica a qualsiasi carico di lavoro è tra i maggiori rischi per le operazioni del carico di lavoro.Change to any workload is among the biggest risks to workload operations. Per qualsiasi carico di lavoro nel livello delle operazioni del carico di lavoro di gestione cloud, il team di gestione cloud deve allinearsi strettamente ai team di adozione del cloud per comprendere le modifiche provenienti da ogni versione.For any workload in the workload operations level of cloud management, the cloud management team should closely align with the cloud adoption teams to understand the changes coming from each release. Questo investimento nella comprensione proattiva avrà un impatto diretto e positivo sulla stabilità operativa.This investment in proactive understanding will have a direct, positive impact on operational stability.

Migliorare i risultatiImprove outcomes

Gli investimenti per la comunicazione e i dati in un carico di lavoro produrranno suggerimenti per migliorare le operazioni in corso in una delle tre aree seguenti:The data and communication investments in a workload will yield suggestions for improvements to ongoing operations in one of three areas:

  • Risoluzione del debito tecnicoTechnical debt resolution
  • Correzione automatizzataAutomated remediation
  • Miglioramento della progettazione del sistemaImproved system design

Risoluzione del debito tecnicoTechnical debt resolution

I piani operativi migliori per i carichi di lavoro richiedono ancora la correzione.The best workload operations plans still require remediation. Poiché il team di gestione cloud cerca di rimanere connesso per comprendere le attività e le versioni di adozione, il team deve condividere regolarmente i requisiti di correzione per garantire che il debito tecnico e i bug siano una priorità continua per i team di sviluppo.As your cloud management team seeks to stay connected to understand adoption efforts and releases, the team likewise should regularly share remediation requirements to ensure that technical debt and bugs are a continued priority for your development teams.

Correzione automatizzataAutomated remediation

Applicando il principio di Pareto, si può affermare che il 80% dell'impatto aziendale negativo deriva probabilmente dal 20% degli eventi imprevisti del servizio.By applying the Pareto principle, we can say that 80 percent of negative business impact likely comes from 20 percent of the service incidents. Quando questi eventi imprevisti non possono essere risolti nei normali cicli di sviluppo, gli investimenti nell'automazione della correzione possono ridurre significativamente le interruzioni aziendali.When those incidents can't be addressed in normal development cycles, investments in remediation automation can significantly reduce business interruptions.

Miglioramento della progettazione del sistemaImproved system design

Nei casi di risoluzione del debito tecnico e correzione automatica, i difetti del sistema sono la ragione comune della maggior parte delle interruzioni del sistema.In the cases of technical debt resolution and automated remediation, system flaws are the common cause of most system outages. È possibile avere un maggiore effetto sulle operazioni complessive del carico di lavoro rispettando alcuni principi di progettazione:You can have the greatest impact on overall workload operations by adhering to a few design principles:

  • Scalabilità: Capacità di un sistema di gestire un aumento del carico.Scalability: The ability of a system to handle increased load.
  • Disponibilità: Percentuale di tempo in cui un sistema è funzionante e funzionante.Availability: The percentage of time that a system is functional and working.
  • Resilienza: Possibilità che un sistema recuperi gli errori e continui a funzionare.Resiliency: The ability of a system to recover from failures and continue to function.
  • Gestione: Processi operativi che mantengono un sistema in esecuzione nell'ambiente di produzione.Management: Operations processes that keep a system running in production.
  • Sicurezza: Protezione delle applicazioni e dei dati dalle minacce.Security: Protecting applications and data from threats.

Per migliorare le operazioni complessive, il Microsoft Azure Framework ben architettato fornisce un approccio alla valutazione di carichi di lavoro specifici per l'adesione a questi pilastri.To help improve overall operations, the Microsoft Azure Well-Architected Framework provides an approach to evaluating specific workloads for adherence to these pillars. Applicare i pilastri sia alle operazioni della piattaforma che alle operazioni del carico di lavoro.Apply the pillars to both platform operations and workload operations.

Passaggi successiviNext steps

Con una conoscenza completa della metodologia di gestione all'interno del Framework di adozione del cloud, è ora necessario implementare i principi di gestione del cloud.With a full understanding of the manage methodology within the Cloud Adoption Framework, you are now armed to implement cloud management principles. Informazioni su come rendere operativa questa metodologia all'interno dell'ambiente operativo.Learn how to make this methodology actionable within your operations environment.