Operações de carga de trabalho na gestão da nuvemWorkload operations in cloud management

Algumas cargas de trabalho são cruciais para o sucesso do negócio.Some workloads are critical to the success of the business. Para essas cargas de trabalho, uma linha de base de gestão é insuficiente para satisfazer os compromissos empresariais necessários para a gestão da nuvem.For those workloads, a management baseline is insufficient to meet the required business commitments to cloud management. As operações da plataforma podem nem ser suficientes para cumprir os compromissos comerciais.Platform operations might not even be sufficient to meet business commitments. Este subconjunto de cargas de trabalho altamente importante requer um foco especializado na forma como a carga de trabalho funciona e como é suportada.This highly important subset of workloads requires a specialized focus on the way the workload functions and how it is supported.

Em troca, o investimento em operações de carga de trabalho pode levar a um melhor desempenho, a um menor risco de interrupção do negócio e a uma recuperação mais rápida quando ocorrem falhas no sistema.In return, the investment in workload operations can lead to improved performance, decreased risk of business interruption, and faster recovery when system failures occur. Este artigo discute uma abordagem para investir na continuação das operações destas cargas de trabalho de alta prioridade para impulsionar a melhoria dos compromissos empresariais.This article discusses an approach to investing in the continued operations of these high priority workloads to drive improved business commitments.

Quando investir em operações de carga de trabalhoWhen to invest in workload operations

O princípio pareto (também conhecido como a regra 80/20) afirma que 80 por cento dos efeitos provêm de 20 por cento das causas.The Pareto principle (also known as the 80/20 rule) states that 80 percent of effects come from 20 percent of the causes. Quando as carteiras de TI são autorizadas a crescer organicamente ao longo do tempo, esta regra é muitas vezes ilustrada numa revisão do portfólio de TI.When IT portfolios are allowed to grow organically over time, this rule is often illustrated in a review of the IT portfolio. Dependendo do efeito que requer investimento, a causa pode variar, mas o princípio geral é verdadeiro:Depending on the effect that requires investment, the cause can vary but the general principle holds true:

  • 80% das falhas do sistema tendem a ser o resultado de 20% dos erros ou erros comuns.80 percent of system failures tend to be the result of 20 percent of the common errors or bugs.
  • 80% do valor do negócio tende a vir de 20% das cargas de trabalho de uma carteira.80 percent of business value tends to come from 20 percent of the workloads in a portfolio.
  • 80% do esforço para migrar para a nuvem provém de 20% das cargas de trabalho que estão a ser movidas.80 percent of the effort to migrate to the cloud comes from 20 percent of the workloads being moved.
  • 80% dos esforços de gestão na nuvem apoiarão 20% dos incidentes de serviço ou bilhetes problemáticos.80 percent of cloud management efforts will support 20 percent of the service incidents or trouble tickets.
  • 80% do impacto do negócio devido a uma paralisação virá de 20% dos sistemas afetados pela paralisação.80 percent of business impact from an outage will come from 20 percent of the systems affected by the outage.

As operações de carga de trabalho só devem ser aplicadas quando a estratégia de adoção em nuvem, os resultados do negócio e as métricas operacionais forem bem compreendidas.Workload operations should be applied only when the cloud adoption strategy, business outcomes, and operational metrics are each well understood. Esta é uma mudança de paradigma da visão clássica da TI.This is a paradigm shift from the classic view of IT. Tradicionalmente, a TI assumiu que todas as cargas de trabalho experimentaram o mesmo grau de apoio e exigiam níveis de prioridade semelhantes.Traditionally, IT assumed that all workloads experienced the same degree of support and required similar levels of priority.

Antes de investirem em operações de carga de trabalho profunda, tanto as TI como o negócio devem compreender as justificações do negócio e as expectativas de um maior investimento na gestão da nuvem.Before they invest in deep workload operations, both IT and the business should understand the business justifications and the expectations of increased investment in cloud management.

Comece com os dadosStart with the data

As operações de carga de trabalho começam com uma compreensão profunda do desempenho da carga de trabalho e dos requisitos de suporte.Workload operations begin with a deep understanding of workload performance and support requirements. Antes que a equipa invista em operações de carga de trabalho, deve ter dados ricos sobre dependências de carga de trabalho, desempenho de aplicação, diagnósticos de bases de dados, telemetria de máquina virtual e histórico de incidentes.Before the team invests in workload operations, it must have rich data about workload dependencies, application performance, database diagnostics, virtual machine telemetry, and incident history.

Estes dados semeam os insights que impulsionam as decisões de operações de carga de trabalho.This data seeds the insights that drive workload operations decisions.

Observação contínuaContinued observation

Os dados iniciais e a telemetria em curso podem ajudar a formular e testar teorias sobre o desempenho de uma carga de trabalho.Initial data and ongoing telemetry can help formulate and test theories about the performance of a workload. Mas as operações de carga de trabalho em curso estão enraizadas numa observação contínua e alargada do desempenho da carga de trabalho, com um forte foco na aplicação e desempenho dos dados.But ongoing workload operations are rooted in a continued and expanded observation of workload performance, with a heavy focus on application and data performance.

Teste a automatizaçãoTest the automation

A nível de aplicação, os primeiros requisitos das operações de carga de trabalho são um investimento em testes profundos.At the application level, the first requirements of workload operations, is an investment in deep testing. Para qualquer aplicação suportada através de operações de carga de trabalho, deve ser estabelecido um plano de teste e executado regularmente para fornecer testes funcionais e de escala em todas as aplicações.For any application that's supported through workload operations, a test plan should be established and regularly executed to deliver functional and scale testing across the applications.

A telemetria de teste regular pode fornecer validação imediata de várias hipóteses sobre o funcionamento da carga de trabalho.Regular test telemetry can provide immediate validation of various hypotheses about the operation of the workload. A melhoria dos padrões operacionais e arquitetónicos pode ser executada e testada.Improving operational and architectural patterns can be executed and tested. Os deltas resultantes fornecem uma análise clara de impacto para orientar os investimentos contínuos.The resulting deltas provide a clear impact analysis to guide continued investments.

Compreender lançamentosUnderstand releases

Uma compreensão clara dos ciclos de libertação e dos gasodutos de libertação é um elemento importante das operações de carga de trabalho.A clear understanding of release cycles and release pipelines is an important element of workload operations.

Uma compreensão dos ciclos pode preparar-se para possíveis interrupções e permitir que a equipa aborde proativamente quaisquer lançamentos que possam produzir um efeito adverso nas operações.An understanding of cycles can prepare for potential interruptions and allow the team to proactively address any releases that might produce an adverse effect on operations. Este entendimento também permite que a equipa de gestão de nuvem se associe a equipas de adoção para melhorar continuamente a qualidade do produto e abordar quaisquer bugs que possam afetar a estabilidade.This understanding also allows the cloud management team to partner with adoption teams to continuously improve the quality of the product and address any bugs that might affect stability.

Mais importante ainda, uma compreensão dos gasodutos de libertação pode melhorar significativamente o objetivo do ponto de recuperação (RPO) de uma carga de trabalho.More importantly, an understanding of release pipelines can significantly improve the recovery point objective (RPO) of a workload. Em muitos cenários, o caminho mais rápido e preciso para a recuperação de uma aplicação é um oleoduto de libertação.In many scenarios, the fastest and most accurate path to the recovery of an application is a release pipeline. Para as camadas de aplicação que só mudam quando um novo lançamento acontece, pode ser sensato investir mais fortemente na otimização de gasodutos do que na recuperação da aplicação a partir de processos tradicionais de backup.For application layers that change only when a new release happens, it might be wise to invest more heavily in pipeline optimization than on the recovery of the application from traditional back-up processes.

Embora um gasoduto de implantação possa ser o caminho mais rápido para a recuperação, também pode ser o caminho mais rápido para a reparação.Although a deployment pipeline can be the fastest path to recovery, it can also be the fastest path to remediation. Quando uma aplicação tem um oleoduto de libertação rápido, eficiente e fiável, a equipa de gestão de nuvem tem a opção de automatizar a implementação para um novo hospedeiro como forma de remediação automatizada.When an application has a fast, efficient, and reliable release pipeline, the cloud management team has an option to automate deployment to a new host as a form of automated remediation.

Pode haver muitos outros mecanismos mais rápidos e eficazes para a reparação e recuperação.There might be many other faster, more effective mechanisms for remediation and recovery. No entanto, quando a utilização de um gasoduto existente pode cumprir os compromissos comerciais e capitalizar os investimentos existentes em DevOps, o gasoduto existente pode ser uma alternativa viável.However, when the use of an existing pipeline can meet business commitments and capitalize on existing DevOps investments, the existing pipeline might be a viable alternative.

Comunicar claramente alterações à carga de trabalhoClearly communicate changes to the workload

A alteração de qualquer carga de trabalho está entre os maiores riscos para as operações de carga de trabalho.Change to any workload is among the biggest risks to workload operations. Para qualquer carga de trabalho no nível de operações de carga de trabalho de gestão de nuvem, a equipa de gestão de nuvem deve alinhar-se estreitamente com as equipas de adoção em nuvem para entender as mudanças que vêm de cada lançamento.For any workload in the workload operations level of cloud management, the cloud management team should closely align with the cloud adoption teams to understand the changes coming from each release. Este investimento em compreensão proactiva terá um impacto direto e positivo na estabilidade operacional.This investment in proactive understanding will have a direct, positive impact on operational stability.

Melhorar os resultadosImprove outcomes

Os investimentos em dados e comunicações numa carga de trabalho darão sugestões para melhorias nas operações em curso numa das três áreas:The data and communication investments in a workload will yield suggestions for improvements to ongoing operations in one of three areas:

  • Resolução técnica da dívidaTechnical debt resolution
  • Remediação automatizadaAutomated remediation
  • Design melhorado do sistemaImproved system design

Resolução técnica da dívidaTechnical debt resolution

Os melhores planos de operações de carga de trabalho ainda requerem reparação.The best workload operations plans still require remediation. À medida que a sua equipa de gestão de nuvem procura manter-se ligada para compreender os esforços e lançamentos de adoção, a equipa também deve partilhar regularmente os requisitos de remediação para garantir que a dívida técnica e os bugs são uma prioridade contínua para as suas equipas de desenvolvimento.As your cloud management team seeks to stay connected to understand adoption efforts and releases, the team likewise should regularly share remediation requirements to ensure that technical debt and bugs are a continued priority for your development teams.

Remediação automatizadaAutomated remediation

Aplicando o princípio pareto, podemos dizer que 80% do impacto negativo do negócio provavelmente provém de 20% dos incidentes de serviço.By applying the Pareto principle, we can say that 80 percent of negative business impact likely comes from 20 percent of the service incidents. Quando estes incidentes não podem ser abordados em ciclos normais de desenvolvimento, os investimentos em automatização de remediação podem reduzir significativamente as interrupções de negócio.When those incidents can't be addressed in normal development cycles, investments in remediation automation can significantly reduce business interruptions.

Design melhorado do sistemaImproved system design

No caso da resolução técnica da dívida e da reparação automatizada, as falhas do sistema são a causa comum da maioria das falhas do sistema.In the cases of technical debt resolution and automated remediation, system flaws are the common cause of most system outages. Pode ter o maior impacto nas operações globais de carga de trabalho, aderindo a alguns princípios de design:You can have the greatest impact on overall workload operations by adhering to a few design principles:

  • Escalabilidade: A capacidade de um sistema para lidar com a carga aumentada.Scalability: The ability of a system to handle increased load.
  • Disponibilidade: A percentagem de tempo que um sistema é funcional e funcional.Availability: The percentage of time that a system is functional and working.
  • Resiliência: A capacidade de um sistema recuperar de falhas e continuar a funcionar.Resiliency: The ability of a system to recover from failures and continue to function.
  • Gestão: Processos de operações que mantêm um sistema em funcionamento.Management: Operations processes that keep a system running in production.
  • Segurança: Proteger aplicações e dados contra ameaças.Security: Protecting applications and data from threats.

Para ajudar a melhorar as operações globais, o Quadro de Well-Architected do Microsoft Azure fornece uma abordagem para avaliar cargas de trabalho específicas para a adesão a estes pilares.To help improve overall operations, the Microsoft Azure Well-Architected Framework provides an approach to evaluating specific workloads for adherence to these pillars. Aplicar os pilares tanto nas operações da plataforma como nas operações de carga de trabalho.Apply the pillars to both platform operations and workload operations.

Próximos passosNext steps

Com uma compreensão completa da metodologia Manage no âmbito do Quadro de Adoção de Nuvens, está agora armado para implementar princípios de gestão de nuvens.With a full understanding of the Manage methodology within the Cloud Adoption Framework, you are now armed to implement cloud management principles. Saiba como tornar esta metodologia exequível dentro do seu ambiente de operações.Learn how to make this methodology actionable within your operations environment.