Compartilhar via


Trabalhando com eventos usando o Application Diagnostics

Importante

Esta versão do Operations Manager chegou ao fim do suporte. Recomendamos que você atualize para o Operations Manager 2022.

O trabalho com alertas é uma parte padrão do trabalho com o System Center – Operations Manager. Os alertas para o monitoramento de aplicativos .NET mostram as informações que você reconhecerá de outros alertas, como informações gerais e conhecimento do produto. No entanto, um alerta de aplicativo .NET também apresenta um link em sua descrição. Esse link abre o evento que disparou o alerta no Application Diagnostics. Veja mais informações que podem ajudar você a solucionar problemas e identificar o problema e a solução.

Observação

Aprofundar a solução de problemas de alertas do Monitoramento do desempenho de aplicativos normalmente requer acesso ao código-fonte do aplicativo e pode exigir entradas dos desenvolvedores. Você pode instalar o Pacote de Gerenciamento de Sincronização de Item de Trabalho do Team Foundation Server e encaminhar os alertas ao Team Foundation Server usado pela equipe de desenvolvimento. O Pacote de Gerenciamento de Sincronização de Item de Trabalho do Team Foundation Server rastreia e sincroniza as alterações feitas aos itens de trabalho do Team Foundation Server e aos alertas associados do Operations Manager.

Investigando os alertas do Aplicativo .NET

A meta principal do monitoramento de aplicativos no Operations Manager é reduzir o tempo que leva para determinar, atribuir e resolver problemas. Ao receber um alerta, você precisa saber o que o causou, ou seja, o sistema de hospedagem do aplicativo ou o código, mostrar os dados que justificam essa conclusão e visualizar claramente quem pode solucionar o problema. Para saber se é um problema do sistema, você precisa saber o estado do sistema no momento do evento. Para saber onde ocorreu o problema raiz, deve saber qual foi a cadeia de chamadas que ocorreu. Para investigar melhor, você precisa comparar eventos semelhantes e eventos relacionados que ocorreram ao mesmo tempo. Juntos, os detalhes do evento, os contadores de desempenho e os encadeamentos distribuídos ajudarão você a triar quem deve observar o problema primeiro. Se for um erro do sistema, você poderá ajustar os recursos disponíveis ou a configuração do sistema host e resolver o problema no nível do host. Se for uma falha de aplicativo, o problema precisará ir para a equipe de aplicativos junto com a linha de código em que a falha ocorreu. Veja algumas estratégias para usar os modos de exibição, filtros e configurações do Application Diagnostics para ajudar você a chegar à causa raiz, encontrar uma resolução e saber quem deve ser envolvido na correção do problema.

Abrir o Application Diagnostics por meio de um alerta

  1. Como você está respondendo a alertas relacionados a grupos de aplicativos específicos que você configurou, é útil definir o escopo dos alertas ativos e exibi-los por grupo de aplicativos. No console de Operações, no painel de navegação, selecione Monitoramento, expanda Monitoramento de Monitoring.NET de Aplicativos, selecione a pasta com o nome do grupo de aplicativos configurado para monitoramento cujos alertas você deseja investigar e selecione Alertas Ativos.

  2. Clique duas vezes no alerta que deseja abrir.

  3. Na página Propriedades do Alerta , selecione o link no painel Descrição do Alerta . Isso abre o Application Diagnostics, um novo recurso de monitoramento do Operations Manager em navegador da Web. Aqui, na guia Propriedades do evento , você pode ver informações, como as métricas de desempenho, a pilha de chamadas e as anotações de coleção sobre o alerta. Usando as guias, você pode ver eventos semelhantes, eventos relacionados, cadeias de eventos e contadores de desempenho. São informações detalhadas sobre o evento de exceção ou desempenho gerado pelo aplicativo que ajudarão você a diagnosticar se o problema vem do próprio aplicativo, de uma chamada de um serviço Web ou de uma chamada de um banco de dados. Para obter mais informações sobre a guia Propriedades do evento, consulte Detalhes do Evento de Desempenho. Selecione Sim para fechar a janela main depois que as informações do evento forem carregadas.

    Observação

    Esse link para o Application Diagnostics também é exibido na guia Contexto Alerta .

Use os procedimentos a seguir para investigar o alerta. Os profissionais de TI provavelmente desejarão usar as informações das guias Propriedades do evento, Contadores de desempenho e Encadeamentos distribuídos para descobrir o que houve, compreender se um problema do sistema causou o problema em questão e investigar onde a causa raiz ocorreu. Os desenvolvedores provavelmente precisarão usar as informações das guias Encadeamentos distribuídos, Eventos semelhantes e Eventos relacionados para compreender o contexto específico de um problema do código.

Solucionar problemas usando as propriedades do Evento de Exceção no Application Diagnostics

  1. Na janela Diagnóstico do Aplicativo para o alerta de exceção que você está investigando, selecione a guia Propriedades do evento para exibir os principais detalhes sobre o alerta. Esse é o primeiro lugar a verificar para descobrir se o problema de alerta está aparente. Algumas das principais categorias de informações que você verá na página Propriedades do evento são as seguintes:

    • Fonte Para exibir os tempos de carregamento e resposta do aplicativo, selecione o link Origem no canto superior esquerdo. Essas informações mostram a carga sob a qual o sistema estava no contexto da falha do evento de exceção. Para exibir contadores de desempenho e avaliar ainda mais o estado do sistema, na página Origem, selecione a guia Relatórios de tendências . Para ver em quais computadores esse aplicativo está funcionando e ver se pode haver um problema de balanceamento de carga entre computadores, selecione a guia Computadores . Para ver um detalhamento das chamadas relacionadas ou onde os eventos estão acontecendo com base em cadeias, selecione a guia Topologia .

    • Cadeia de Exceções Exibe eventos de exceção. Expanda Cadeia de Exceções para exibir a exceção que realmente ocorreu.

    • Dados de Exceção Exibe eventos de exceção e mostra parâmetros e variáveis configurados para a classe através da exceção.

    • Pilha É a pilha de chamadas, ou seja, a ordem dos acontecimentos. A Exibição de Execuções em Árvore permite a você expandir os nós para investigar as chamadas. Selecione o botão de opção Modo de Exibição do Grupo de Recursos para exibir uma visão geral de onde o tempo foi gasto. Essas respostas mostram em que camada o problema está ou onde ele ocorre.

    • Lista de módulos Isso é exibido para eventos de exceção e mostra os módulos carregados no momento da exceção.

    • Observações da Coleta Exibe as notas sobre o evento.

    Dica

    Nos Eventos de desempenho, Eventos semelhantes, Eventos relacionados, Encadeamentos distribuídos e Contadores de desempenho, adote as mesmas etapas de solução de problemas utilizadas nos Eventos de exceção.

Solucionar problemas usando as propriedades do Evento de Desempenho no Application Diagnostics

  1. Na janela Diagnóstico do Aplicativo para o alerta de desempenho que você está investigando, selecione a guia Propriedades do evento para exibir os principais detalhes sobre o alerta. Esse é o primeiro lugar a verificar para descobrir se o problema de alerta está aparente. Algumas das principais categorias de informações que você verá na página Propriedades de desempenho são as seguintes:

    • Fonte Para exibir os tempos de carregamento e resposta do aplicativo, selecione o link Origem no canto superior esquerdo. Essas informações mostram a carga sob a qual o sistema estava no contexto da falha do evento de exceção. Para exibir contadores de desempenho e avaliar ainda mais o estado do sistema, na página Origem, selecione a guia Relatórios de tendências . Para ver em quais computadores esse aplicativo está funcionando e ver se pode haver um problema de balanceamento de carga entre computadores, selecione a guia Computadores . Para ver um detalhamento das chamadas relacionadas ou onde os eventos estão acontecendo com base em cadeias, selecione a guia Topologia .

    • Nós Mais Lentos É uma lista dos nós mais lentos da Exibição de Execuções em Árvore e a causa mais provável dos problemas de desempenho em seu aplicativo.

    • Pilha É a pilha de chamadas, ou seja, a ordem dos acontecimentos. A Exibição de Execuções em Árvore permite a você expandir os nós para investigar as chamadas. Selecione o botão de opção Modo de Exibição do Grupo de Recursos para exibir uma visão geral de onde o tempo foi gasto. Isso responde em que camada o problema está – onde ele ocorre?

    • Observações da Coleta Exibe as notas sobre o evento.

Solucionar problemas do estado do sistema usando Contadores de desempenho

  1. Para exibir uma tabela ou diagrama dos principais contadores de desempenho, selecione a guia Contadores de desempenho .

    Observação

    Quinze minutos de dados de desempenho são coletados e armazenados em cache no sistema monitorado. Quando uma exceção ou um desempenho é acionado, os dados de desempenho são enviados novamente ao Operations Manager, junto com o evento.

  2. Marque as caixas de seleção do contador de desempenho para os contadores de desempenho que você deseja incluir em suas informações e selecione Aplicar.

  3. Use as informações nesta exibição para avaliar o estado de desempenho do sistema em torno do evento que você está investigando. Por exemplo, se o desempenho estava uniformemente lento no momento do evento, é provável que o alerta esteja atrasado devido a um problema no desempenho do sistema.

Localizar o problema raiz usando Cadeias distribuídas

  1. Selecione a guia Cadeias distribuídas para exibir a ordem das chamadas — a cadeia de eventos da qual o evento faz parte. Isso ajuda você a entender como o evento que você está investigando foi afetado por outros eventos do aplicativo ou aplicativos relacionados.

  2. Na exibição Cadeias distribuídas, selecione uma das chamadas ou links na cadeia. Se houver vários eventos para o mesmo objeto, o Assistente de Encadeamento será aberto. Esse assistente permite a você selecionar possíveis eventos para correlação em um encadeamento de eventos. Para iniciar o Assistente, selecione Avançar.

    Observação

    Obtenha o carimbo de data/hora da chamada selecionada, pois você o emparelha com um evento na próxima página.

  3. Na página Selecionar Evento de Cadeia Possível , selecione o evento que você deseja examinar. O ideal é que ele seja o evento com o carimbo de data/hora mais próximo da chamada selecionada na exibição Cadeias Distribuídas.

  4. O que você vê a seguir depende do tipo de problema que você está investigando. Por exemplo, se você selecionar uma transação em que um servidor não foi encontrado, você poderá ir para a página de propriedades do evento para esse evento. Lá, é possível emparelhar o erro do servidor com o evento inicialmente investigado. Como é um erro de servidor, você sabe que o problema não está no lado do cliente, mas no lado do servidor. Você pode ver um grafo do evento selecionado e ser capaz de dividir um evento de desempenho em termos do tempo de carregamento da página.

  5. Nas propriedades do evento, selecione a chamada do lado do servidor e selecione a guia Contadores de Desempenho para obter mais detalhes.

Solucionar problemas exibindo eventos semelhantes

  1. Selecione a guia Eventos semelhantes para ver se alertas semelhantes foram lançados mais vezes, o que pode significar que há um problema com o aplicativo.

  2. Há várias maneiras de filtrar eventos semelhantes. Selecione o menu suspenso Semelhante por para selecionar como você deseja agrupar os eventos semelhantes: por problema, ação, classe de exceção ou função com falha. Nas caixas de texto De e Até , é possível selecionar o intervalo de datas cujos eventos semelhantes você deseja exibir. Use a guia Eventos semelhantes para exibir se alertas semelhantes tiverem sido gerados mais vezes, o que pode significar que há um problema com o aplicativo.

    • Filtragem por Problema mostra eventos semelhantes que pertençam ao mesmo tipo. Por exemplo, você pode ver todos os eventos semelhantes em que a referência de objeto não está definida como uma instância de um objeto. Selecione o botão Exibição de Diagrama e você pode ver a proporção do número total de eventos para o problema atual e o número total de eventos de outros problemas. São informações que oferecem uma perspectiva rápida da magnitude do problema desse evento. Se muitos dos eventos semelhantes totais atuais tiverem o mesmo problema, pode ser um problema de prioridade mais alto resolve pois terá um alto impacto na redução do número de alertas recebidos.

    • AFiltragem por ação agrupa os eventos semelhantes por aspecto: segurança, desempenho, conectividade e falha no aplicativo. Selecione o botão Modo de Exibição de Diagrama e você pode ver o número de eventos semelhantes por essas categorias de aspecto e ver com mais facilidade a quais problemas o problema pode estar relacionado.

    • Filtrando por Classe de Exceção agrupa os eventos similares de acordo com o modo como eles foram renomeados durante a configuração. Presume-se que esses seriam os nomes que o ajudariam a identificar qual é o tipo de exceções deles, como a classe System.NullReferenceException .

    • Filtrando por Função com Falha agrupa os eventos similares na mesma função que está lançando a exceção. Isso pode significar que há um problema com o ponto de entrada.

    Tenha em mente que todos esses são eventos semelhantes, relacionados por definição, e esses filtros oferecem uma ideia melhor de como eles estão relacionados. Portanto, usando os filtros Eventos Semelhantes, você pode descobrir que a maioria dos eventos totais tem o mesmo problema que o evento que você está exibindo, que é um problema de desempenho, que eles pertencem a uma classe de exceção configurada e que metade dos eventos semelhantes teve a mesma função com falha. Ação: A função vai para o desenvolvedor que precisa atualizar o código de função.

  1. Selecione a guia Eventos relacionados para exibir eventos relacionados por tempo. Essas são exceções correlacionadas com outros eventos que podem fornecer uma visão do problema.

  2. Para exibir os detalhes do evento de um evento na lista, selecione o link na coluna Descrição .

    Nos eventos relacionados, você pode observar que o tempo de resposta é lento para todos os eventos durante um determinado tempo. Isso pode indicar um problema com o sistema, não com o código, portanto, o caso poderá ser redirecionado a um profissional de TI para buscar uma solução.

Próximas etapas