Operações de carga de trabalho no gerenciamento de nuvemWorkload operations in cloud management

Algumas cargas de trabalho são críticas para o sucesso dos negócios.Some workloads are critical to the success of the business. Para essas cargas de trabalho, uma linha de base de gerenciamento é insuficiente para atender aos compromissos de negócios necessários para o gerenciamento de nuvem.For those workloads, a management baseline is insufficient to meet the required business commitments to cloud management. As operações de plataforma podem nem mesmo ser suficientes para atender aos compromissos comerciais.Platform operations might not even be sufficient to meet business commitments. Esse subconjunto altamente importante de cargas de trabalho requer um foco especializado na maneira como as funções de carga de trabalho e como há suporte.This highly important subset of workloads requires a specialized focus on the way the workload functions and how it's supported.

Em retorno, o investimento em operações de carga de trabalho pode levar a um desempenho aprimorado, menor risco de interrupção dos negócios e recuperação mais rápida quando ocorrem falhas do sistema.In return, the investment in workload operations can lead to improved performance, decreased risk of business interruption, and faster recovery when system failures occur. Este artigo aborda uma abordagem de investindo nas operações contínuas dessas cargas de trabalho de alta prioridade para impulsionar os compromissos comerciais aprimorados.This article discusses an approach to investing in the continued operations of these high priority workloads to drive improved business commitments.

Quando investir em operações de carga de trabalhoWhen to invest in workload operations

O princípio de Pareto (também conhecido como a regra 80/20) afirma que 80% dos efeitos vêm de 20% das causas.The Pareto principle (also known as the 80/20 rule) states that 80 percent of effects come from 20 percent of the causes. Quando os portfólios de ti têm permissão para aumentar a orgânicamente com o passar do tempo, essa regra geralmente é ilustrada em uma análise do portfólio de ti.When IT portfolios are allowed to grow organically over time, this rule is often illustrated in a review of the IT portfolio. Dependendo do efeito que exige investimento, a causa pode variar, mas o princípio geral é verdadeiro:Depending on the effect that requires investment, the cause can vary but the general principle holds true:

  • 80 por cento das falhas do sistema tendem a ser o resultado de 20% dos erros ou bugs comuns.80 percent of system failures tend to be the result of 20 percent of the common errors or bugs.
  • 80% do valor comercial tende a vir de 20% das cargas de trabalho em um portfólio.80 percent of business value tends to come from 20 percent of the workloads in a portfolio.
  • 80 por cento do esforço para migrar para a nuvem vem de 20% das cargas de trabalho que estão sendo movidas.80 percent of the effort to migrate to the cloud comes from 20 percent of the workloads being moved.
  • 80 por cento dos esforços de gerenciamento de nuvem dará suporte a 20% dos incidentes de serviço ou tíquetes de problema.80 percent of cloud management efforts will support 20 percent of the service incidents or trouble tickets.
  • 80 por cento do impacto nos negócios de uma interrupção será proveniente de 20% dos sistemas afetados pela interrupção.80 percent of business impact from an outage will come from 20 percent of the systems affected by the outage.

As operações de carga de trabalho devem ser aplicadas somente quando a estratégia de adoção de nuvem, os resultados comerciais e as métricas operacionais são bem compreendidas.Workload operations should be applied only when the cloud adoption strategy, business outcomes, and operational metrics are each well understood. Essa é uma mudança de paradigma da exibição clássica da ti.This is a paradigm shift from the classic view of IT. Tradicionalmente, supõe-se que todas as cargas de trabalho tiveram o mesmo grau de suporte e que exigiam níveis semelhantes de prioridade.Traditionally, IT assumed that all workloads experienced the same degree of support and required similar levels of priority.

Antes que eles invistam em operações de carga de trabalho profundas, a ti e a empresa devem entender as justificativas de negócios e as expectativas do aumento do investimento no gerenciamento de nuvem.Before they invest in deep workload operations, both IT and the business should understand the business justifications and the expectations of increased investment in cloud management.

Iniciar com os dadosStart with the data

As operações de carga de trabalho começam com uma compreensão profunda dos requisitos de desempenho e suporte da carga de trabalho.Workload operations begin with a deep understanding of workload performance and support requirements. Antes que a equipe investe em operações de carga de trabalho, ela deve ter dados avançados sobre dependências de carga de trabalho, desempenho de aplicativos, diagnósticos de banco, telemetria de máquina virtual e histórico de incidentes.Before the team invests in workload operations, it must have rich data about workload dependencies, application performance, database diagnostics, virtual machine telemetry, and incident history.

Esses dados propagam as informações que orientam as decisões de operações de carga de trabalho.This data seeds the insights that drive workload operations decisions.

Observação continuadaContinued observation

Os dados iniciais e a telemetria contínua podem ajudar a formular e testar teorias sobre o desempenho de uma carga de trabalho.Initial data and ongoing telemetry can help formulate and test theories about the performance of a workload. Mas as operações de carga de trabalho contínuas têm raiz em uma observação contínua e expandida do desempenho da carga de trabalho, com um foco intenso no desempenho de aplicativos e dados.But ongoing workload operations are rooted in a continued and expanded observation of workload performance, with a heavy focus on application and data performance.

Testar a automaçãoTest the automation

No nível do aplicativo, os primeiros requisitos de operações de carga de trabalho são um investimento em testes detalhados.At the application level, the first requirements of workload operations, is an investment in deep testing. Para qualquer aplicativo com suporte por meio de operações de carga de trabalho, um plano de teste deve ser estabelecido e executado regularmente para fornecer testes funcionais e de escala nos aplicativos.For any application that's supported through workload operations, a test plan should be established and regularly executed to deliver functional and scale testing across the applications.

A telemetria de teste regular pode fornecer validação imediata de várias informações sobre a operação da carga de trabalho.Regular test telemetry can provide immediate validation of various hypotheses about the operation of the workload. Melhorar os padrões de arquitetura e operacionais pode ser executado e testado.Improving operational and architectural patterns can be executed and tested. Os deltas resultantes fornecem uma análise de impacto clara para orientar os investimentos contínuos.The resulting deltas provide a clear impact analysis to guide continued investments.

Entender as versõesUnderstand releases

Uma compreensão clara dos ciclos de liberação e dos pipelines de lançamento é um elemento importante das operações de carga de trabalho.A clear understanding of release cycles and release pipelines is an important element of workload operations.

Uma compreensão dos ciclos pode se preparar para possíveis interrupções e permitir que a equipe resolva proativamente todas as versões que possam produzir um efeito adverso nas operações.An understanding of cycles can prepare for potential interruptions and allow the team to proactively address any releases that might produce an adverse effect on operations. Essa compreensão também permite que a equipe de gerenciamento de nuvem entre em parceria com as equipes de adoção para melhorar continuamente a qualidade do produto e resolver quaisquer bugs que possam afetar a estabilidade.This understanding also allows the cloud management team to partner with adoption teams to continuously improve the quality of the product and address any bugs that might affect stability.

Mais importante, uma compreensão dos pipelines de versão pode melhorar significativamente o RPO (objetivo de ponto de recuperação) de uma carga de trabalho.More importantly, an understanding of release pipelines can significantly improve the recovery point objective (RPO) of a workload. Em muitos cenários, o caminho mais rápido e mais preciso para a recuperação de um aplicativo é um pipeline de lançamento.In many scenarios, the fastest and most accurate path to the recovery of an application is a release pipeline. Para camadas de aplicativo que são alteradas somente quando ocorre uma nova versão, pode ser recomendável investir mais fortemente na otimização de pipeline do que na recuperação do aplicativo de processos de backup tradicionais.For application layers that change only when a new release happens, it might be wise to invest more heavily in pipeline optimization than on the recovery of the application from traditional back-up processes.

Embora um pipeline de implantação possa ser o caminho mais rápido para a recuperação, ele também pode ser o caminho mais rápido para a correção.Although a deployment pipeline can be the fastest path to recovery, it can also be the fastest path to remediation. Quando um aplicativo tem um pipeline de lançamento rápido, eficiente e confiável, a equipe de gerenciamento de nuvem tem uma opção para automatizar a implantação em um novo host como forma de correção automatizada.When an application has a fast, efficient, and reliable release pipeline, the cloud management team has an option to automate deployment to a new host as a form of automated remediation.

Pode haver muitos outros mecanismos mais rápidos e eficientes para correção e recuperação.There might be many other faster, more effective mechanisms for remediation and recovery. No entanto, quando o uso de um pipeline existente pode atender a compromissos comerciais e capitalizar investimentos DevOps existentes, o pipeline existente pode ser uma alternativa viável.However, when the use of an existing pipeline can meet business commitments and capitalize on existing DevOps investments, the existing pipeline might be a viable alternative.

Comunique claramente as alterações na carga de trabalhoClearly communicate changes to the workload

A mudança para qualquer carga de trabalho está entre os maiores riscos para as operações de carga de trabalho.Change to any workload is among the biggest risks to workload operations. Para qualquer carga de trabalho no nível de operações de carga de trabalho do gerenciamento de nuvem, a equipe de gerenciamento de nuvem deve alinhar-se fortemente às equipes de adoção de nuvem para entender as alterações provenientes de cada versão.For any workload in the workload operations level of cloud management, the cloud management team should closely align with the cloud adoption teams to understand the changes coming from each release. Esse investimento em compreensão proativa terá um impacto direto e positivo sobre a estabilidade operacional.This investment in proactive understanding will have a direct, positive impact on operational stability.

Melhorar os resultadosImprove outcomes

Os investimentos de dados e comunicação em uma carga de trabalho produzirão sugestões para melhorias em operações contínuas em uma das três áreas:The data and communication investments in a workload will yield suggestions for improvements to ongoing operations in one of three areas:

  • Resolução técnica de dívidasTechnical debt resolution
  • Correção automatizadaAutomated remediation
  • Melhor design do sistemaImproved system design

Resolução técnica de dívidasTechnical debt resolution

Os planos de operações de melhor carga de trabalho ainda exigem correção.The best workload operations plans still require remediation. À medida que sua equipe de gerenciamento de nuvem busca se manter conectado para entender os esforços de adoção e as versões, a equipe da mesma forma deve compartilhar regularmente os requisitos de correção para garantir que a dívida técnica e os bugs sejam uma prioridade contínua para suas equipes de desenvolvimento.As your cloud management team seeks to stay connected to understand adoption efforts and releases, the team likewise should regularly share remediation requirements to ensure that technical debt and bugs are a continued priority for your development teams.

Correção automatizadaAutomated remediation

Ao aplicar o princípio de Pareto, podemos dizer que 80% do impacto de negócios negativo provavelmente vem de 20% dos incidentes de serviço.By applying the Pareto principle, we can say that 80 percent of negative business impact likely comes from 20 percent of the service incidents. Quando esses incidentes não podem ser resolvidos em ciclos normais de desenvolvimento, os investimentos na automação de correção podem reduzir significativamente as interrupções de negócios.When those incidents can't be addressed in normal development cycles, investments in remediation automation can significantly reduce business interruptions.

Melhor design do sistemaImproved system design

Nos casos de resolução de dívidas técnicas e correção automatizada, as falhas do sistema são a causa comum da maioria das interrupções do sistema.In the cases of technical debt resolution and automated remediation, system flaws are the common cause of most system outages. Você pode ter o maior impacto sobre as operações gerais de carga de trabalho ao aderir a alguns princípios de design:You can have the greatest impact on overall workload operations by adhering to a few design principles:

  • Escalabilidade: A capacidade de um sistema de lidar com a carga aumentada.Scalability: The ability of a system to handle increased load.
  • Disponibilidade: A porcentagem de tempo em que um sistema está funcionando e funcionando.Availability: The percentage of time that a system is functional and working.
  • Resiliência: A capacidade de um sistema de se recuperar de falhas e continuar a funcionar.Resiliency: The ability of a system to recover from failures and continue to function.
  • Gerenciamento: Processos de operações que mantêm um sistema em execução na produção.Management: Operations processes that keep a system running in production.
  • Segurança: Proteção de aplicativos e dados contra ameaças.Security: Protecting applications and data from threats.

Para ajudar a melhorar as operações gerais, o Microsoft Azure Well-Architected Framework fornece uma abordagem para avaliar cargas de trabalho específicas para adesão a esses pilares.To help improve overall operations, the Microsoft Azure Well-Architected Framework provides an approach to evaluating specific workloads for adherence to these pillars. Aplique os pilares às operações da plataforma e às operações de carga de trabalho.Apply the pillars to both platform operations and workload operations.

Próximas etapasNext steps

Com uma compreensão total da metodologia de gerenciamento dentro da estrutura de adoção de nuvem, agora você está armado para implementar princípios de gerenciamento de nuvem.With a full understanding of the Manage methodology within the Cloud Adoption Framework, you are now armed to implement cloud management principles. Saiba como tornar essa metodologia acionável em seu ambiente de operações.Learn how to make this methodology actionable within your operations environment.