Melhores práticas para alertas do Azure Monitor

Este artigo fornece as melhores práticas de arquitetura para alertas do Azure Monitor, regras de processamento de alerta e grupos de ações. As diretrizes se baseiam nos cinco pilares de excelência em arquitetura descritos no Azure Well-Architected Framework.

Para saber mais sobre alertas e notificações, confira Visão geral dos alertas do Azure Monitor.

Confiabilidade

Na nuvem, reconhecemos antecipadamente que as falhas ocorrerão. Em vez de tentar evitar completamente a falha, a meta é minimizar os efeitos de uma falha em um componente individual. Use as informações a seguir para minimizar a falha dos componentes da regra de alerta do Azure Monitor.

Os alertas do Azure Monitor fornecem um alto grau de confiabilidade sem nenhuma decisão de design. As condições em que pode ocorrer uma perda temporária de dados de alerta são muitas vezes atenuadas por recursos de outros componentes do Azure Monitor.

Lista de verificação de projeto

  • Configure as regras de alerta de integridade do serviço.
  • Configure as regras de alerta de integridade de recursos.
  • Evite limites de serviço para regras de alerta que produzem notificações em grande escala.

Recomendações de configuração

Recomendação Benefício
Configure as regras de alerta de integridade do serviço. Os alertas de integridade do serviço enviam notificações sobre interrupções, interrupções de serviço, manutenção planejada e avisos de segurança. Confira Criar ou editar uma regra de alerta.
Configure as regras de alerta de integridade de recursos. Os alertas do Resource Health podem notificá-lo quase em tempo real quando esses recursos apresentam uma alteração em seu status de integridade. Confira Criar ou editar uma regra de alerta.
Evite limites de serviço para regras de alerta que produzem notificações em grande escala. Se você tiver regras de alerta que enviariam um grande número de notificações, poderá atingir os limites do serviço usado para enviar notificações por email ou SMS. Configure ações programáticas ou escolha um método ou provedor de notificação alternativo para lidar com as notificações em grande escala. Confira Limites de serviço para notificações.

Segurança

A Segurança é um dos aspectos mais importantes de qualquer arquitetura. O Azure Monitor fornece recursos para empregar os princípios de privilégios mínimos e defesa em profundidade. Use as informações a seguir para maximizar a segurança dos alertas do Azure Monitor.

Lista de verificação de projeto

  • Usar chaves gerenciadas pelo cliente se precisar de sua própria chave de criptografia para proteger dados e consultas salvas em seus workspaces
  • Usar identidades gerenciadas para aumentar a segurança controlando as permissões
  • Atribua a função de leitor de monitoramento para todos os usuários que não precisam de privilégios de configuração
  • Use ações de webhook seguras
  • Ao usar grupos de ações que usam links privados, use as ações do Hub de eventos

Recomendações de configuração

Recomendação Benefício
Use as chaves gerenciadas pelo cliente se precisar de sua própria chave de criptografia para proteger dados e consultas salvas nos seus workspaces. O Azure Monitor garante que todos os dados e consultas salvos sejam criptografados em repouso com as chaves gerenciadas pela Microsoft (MMK). Se você precisar de sua própria chave de criptografia e coletar dados suficientes para um cluster dedicado, use as chaves gerenciadas pelo cliente para obter maior flexibilidade e controle do ciclo de vida da chave. Se você usar o Microsoft Sentinel, verifique se está familiarizado com as considerações em Configurar a chave gerenciada pelo cliente do Microsoft Sentinel.
Para controlar permissões para regras de alerta de pesquisa de log, use identidades gerenciadas para suas regras de alerta de pesquisa de log. Um desafio comum para desenvolvedores é o gerenciamento de segredos, credenciais, certificados e chaves usados para proteger a comunicação entre serviços. As identidades gerenciadas eliminam a necessidade de os desenvolvedores gerenciarem essas credenciais. Definir uma identidade gerenciada para suas regras de alerta de pesquisa de log fornece controle e visibilidade sobre as permissões exatas da regra de alerta. A qualquer momento, você pode exibir as permissões de consulta de sua regra e adicionar ou remover permissões diretamente de sua identidade gerenciada. Além disso, o uso de uma identidade gerenciada é necessário se a consulta de sua regra estiver acessando o Azure Data Explorer (ADX) ou o Azure Resource Graph (ARG). Confira Identidades gerenciadas.
Atribua a função de leitor de monitoramento para todos os usuários que não precisam de privilégios de configuração. Aprimore a segurança fornecendo aos usuários a menor quantidade de privilégios necessários para sua função. Confira Funções, permissões e segurança no Azure Monitor.
Sempre que possível, use ações de webhook seguras. Se a sua regra de alerta contiver um grupo de ações que usa ações de webhook, prefira usar ações de webhook seguras para autenticação adicional. Confira Configurar a autenticação para o webhook seguro

Otimização de custo

A Otimização de custos se refere a maneiras de reduzir as despesas desnecessárias e melhorar a eficiência operacional. Você pode reduzir consideravelmente seus custos com o Azure Monitor compreendendo as diferentes opções de configuração e oportunidades a fim de reduzir o volume de dados coletados. Confira Custos e uso do Azure Monitor para entender as diferentes maneiras de cobrança do Azure Monitor e como ver sua fatura mensal.

Observação

Confira Otimizar custos no Azure Monitor para obter recomendações de otimização de custos em todos os recursos do Azure Monitor.

Lista de verificação de projeto

  • Os alertas de log de atividades, alertas de integridade do serviço e alertas de integridade de recursos são gratuitos.
  • Ao usar alertas de pesquisa de log, minimize a frequência de alertas de pesquisa de log.
  • Ao usar os alertas de métricas, minimize o número de recursos que estão sendo monitorados.

Recomendações de configuração

Recomendação Benefício
Lembre-se de que os alertas de log de atividades, alertas de integridade do serviço e alertas de integridade de recursos são gratuitos. Os alertas de atividade do Azure Monitor, alertas de integridade do serviço e alertas de integridade de recursos são gratuitos. Se o que você deseja monitorar pode ser alcançado com esses tipos de alerta, use-os.
Ao usar alertas de pesquisa de log, minimize a frequência de alertas de pesquisa de log. Ao configurar alertas de pesquisa de log, tenha em mente que quanto mais frequente a avaliação da regra, maior o custo. Configure suas regras adequadamente.
Ao usar os alertas de métricas, minimize o número de recursos que estão sendo monitorados. Alguns tipos de recursos dão suporte a regras de alerta de métrica que podem monitorar vários recursos do mesmo tipo. Para esses tipos de recursos, tenha em mente que a regra pode se tornar cara se estiver monitorando muitos recursos. Para reduzir custos, você pode reduzir o escopo da regra de alerta de métrica ou usar regras de alerta de pesquisa de log, que são mais baratas para monitorar um grande número de recursos.

Excelência operacional

Excelência operacional refere-se aos processos de operações necessários para manter um serviço em execução confiável na produção. Use as informações a seguir para minimizar os requisitos operacionais para dar suporte aos alertas do Azure Monitor.

Lista de verificação de projeto

  • Use limites dinâmicos em regras de alerta de métrica quando apropriado.
  • Sempre que possível, use uma única regra de alerta para monitorar vários recursos.
  • Para controlar o comportamento em escala, use as regras de processamento de alerta.
  • Aproveitar as propriedades personalizadas para aprimorar o diagnóstico
  • Aproveitar os Aplicativos Lógicos para personalizar, enriquecer e integrar-se a uma variedade de sistemas

Recomendações de configuração

Recomendação Benefício
Use os limites dinâmicos em regras de alerta de métrica quando apropriado. Os limites dinâmicos usam aprendizado de máquina para determinar o limite correto, então você não precisa conhecer o limite correto para configurar. Os limites dinâmicos também são úteis para regras que monitoram vários recursos, quando um único limite não pode ser configurado para todos os recursos. Confira os Limites dinâmicos em alertas de métricas.
Sempre que possível, use uma única regra de alerta para monitorar vários recursos. O uso de regras de alerta que monitoram vários recursos reduz a sobrecarga de gerenciamento, permitindo que você gerencie uma única regra para monitorar um grande número de recursos.
Para controlar o comportamento em escala, use as regras de processamento de alerta. As regras de processamento de alerta podem ser usadas para reduzir o número de regras de alerta que você precisa criar e gerenciar.
Utilize as propriedades personalizadas para aprimorar o diagnóstico. Se a regra de alerta usar grupos de ações, você poderá adicionar suas próprias propriedades para incluir no conteúdo de notificação de alerta. Você pode usar essas propriedades nas ações chamadas pelo grupo de ações, como webhook, função do Azure ou ações de aplicativo lógico.
Use os Aplicativos Lógicos para personalizar o fluxo de notificações e integrar-se com diversos sistemas. Você pode usar os Aplicativos Lógicos do Azure para compilar e personalizar fluxo de trabalho para integração. Use os Aplicativos Lógicos para personalizar as notificações de alerta. Você poderá:
- Personalize o email de alerta usando seu próprio assunto de email e formato de corpo.
- Personalize os metadados de alerta procurando tags para recursos afetados ou buscando um resultado de pesquisa de consulta de log.
- Integre-se a serviços externos usando conectores existentes como Outlook, Microsoft Teams, Slack e PagerDuty. Você também pode configurar o aplicativo lógico para seus próprios serviços.

Eficiência de desempenho

A eficiência do desempenho é a capacidade de dimensionar sua carga de trabalho para atender às demandas colocadas por usuários de maneira eficiente. Os alertas fornecem um alto grau de eficiência de desempenho sem nenhuma decisão de design.

Próxima etapa