Trabalhando com eventos usando o Application Diagnostics

 

Aplica-se a: System Center 2012 R2 Operations Manager, System Center 2012 - Operations Manager, System Center 2012 SP1 - Operations Manager

O trabalho com alertas é, por padrão, parte do trabalho com o System Center 2012 – Operations Manager. Os alertas do monitoramento de aplicativos .NET mostram dados que você reconhecerá de outros alertas, como as informações gerais e o conhecimento do produto. No entanto, um alerta de aplicativo .NET também apresenta um link em sua descrição. Esse link abre o evento que disparou o alerta no Application Diagnostics. Veja mais informações que podem ajudar você a solucionar problemas e identificar o problema e a solução.

System_CAPS_noteObservação

Aprofundar a solução de problemas de alertas do Monitoramento do desempenho de aplicativos normalmente requer acesso ao código-fonte do aplicativo e pode exigir entradas dos desenvolvedores. Você pode instalar o Pacote de Gerenciamento de Sincronização de Item de Trabalho do Team Foundation Server e encaminhar os alertas ao Team Foundation Server usado pela equipe de desenvolvimento. O Pacote de Gerenciamento de Sincronização de Item de Trabalho do Team Foundation Server rastreia e sincroniza as alterações feitas aos itens de trabalho do Team Foundation Server e aos alertas associados do Operations Manager.

Investigando os alertas de aplicativos .NET

A meta principal do monitoramento de aplicativo no Operations Manager é reduzir o tempo que leva para determinar, atribuir e resolver problemas. Ao receber um alerta, você precisa saber o que o causou – o sistema de hospedagem do aplicativo ou o código –, mostrar os dados que justificam essa conclusão e visualizar nitidamente quem pode solucionar o problema. Para descobrir se é um problema do sistema, você precisa saber qual o estado de seu sistema no momento do evento. Para saber onde ocorreu o problema raiz, deve saber qual foi a cadeia de chamadas que ocorreu. Para investigar melhor, precisa comparar eventos semelhantes e relacionados que ocorreram ao mesmo tempo. Juntos, os detalhes do evento, os contadores de desempenho e os encadeamentos distribuídos ajudarão você a triar quem deve observar o problema primeiro. Se for um erro do sistema, é possível ajustar os recursos disponíveis ou a configuração do sistema host e endereçar o problema no nível do host. Se for uma falha do aplicativo, o problema precisa ser encaminhado à equipe do aplicativo junto com a linha de código em que a falha ocorreu. Veja algumas estratégias para usar os modos de exibição, filtros e configurações do Application Diagnostics para ajudar você a chegar à causa raiz, encontrar uma resolução e saber quem deve ser envolvido na correção do problema.

Para abrir o Application Diagnostics de um alerta

  1. Como você está respondendo a alertas relacionados aos grupos de aplicativos específicos configurados por você, é bom definir o escopo dos alertas ativos e exibi-los por grupo de aplicativos. No painel de navegação do console do Operations Manager, clique no botão Monitoramento, expanda Monitoramento de Aplicativos, expanda Monitoramento .NET, expanda a pasta com o nome do grupo de aplicativos monitorado pelos alertas que você deseja investigar e clique em Alertas Ativos.

  2. Clique duas vezes no alerta que deseja abrir.

  3. Na página Propriedades do Alerta, clique no link do painel Descrição do Alerta. Isso abre o Application Diagnostics, um novo recurso de monitoramento do Operations Manager em navegador da Web. Na guia Propriedades do evento, é possível visualizar informações como métricas de desempenho, pilha de chamadas e observações da coleta sobre o alerta. Usando as guias, você pode ver eventos semelhantes, eventos relacionados, cadeias de eventos e contadores de desempenho. São informações detalhadas sobre o evento de exceção ou desempenho gerado pelo aplicativo que ajudarão você a diagnosticar se o problema vem do próprio aplicativo, de uma chamada de um serviço Web ou de uma chamada de um banco de dados. Para obter mais informações sobre a guia Propriedades do evento, consulte Detalhes do Evento de Desempenho. Clique em Sim para fechar a janela principal depois que as informações do evento forem carregadas.

    System_CAPS_noteObservação

    O link para o Application Diagnostics também é exibido na guia Contexto Alerta.

Use os procedimentos a seguir para investigar o alerta. Os profissionais de TI provavelmente desejarão usar as informações das guias Propriedades do evento, Contadores de desempenho e Encadeamentos distribuídos para descobrir o que houve, compreender se um problema do sistema causou o problema em questão e investigar onde a causa raiz ocorreu. Os desenvolvedores provavelmente precisarão usar as informações das guias Encadeamentos distribuídos, Eventos semelhantes e Eventos relacionados para compreender o contexto específico de um problema do código.

Para solucionar problemas usando as propriedades do Evento de Exceção no Application Diagnostics

  1. Na janela do Application Diagnostics do alerta de exceção que você está investigando, clique na guia Propriedades do evento para exibir os principais detalhes do alerta. Esse é o primeiro lugar a verificar para descobrir se o problema de alerta está aparente. A seguir, veja algumas das principais categorias de informações encontradas na página Propriedades do evento:

    - **Fonte** Para exibir os tempos de resposta e carregamento de aplicativos, clique no link **Fonte** no canto superior esquerdo. Essas informações mostram a carga sob a qual o sistema estava no contexto da falha do evento de exceção. Para exibir os contadores de desempenho e avaliar melhor o estado do sistema, na página Fonte, clique na guia **Relatórios de Tendências**. Para ver em quais computadores o aplicativo está executando e descobrir se há um problema de balanceamento de carga entre eles, clique na guia **Computadores**. Para ver um detalhamento das chamadas relacionadas ou o ponto onde os eventos estão ocorrendo com base nas cadeias, clique na guia **Topologia**.
    
    - **Cadeia de Exceções** Exibe eventos de exceção. Expanda Cadeia de Exceções para exibir a exceção que realmente ocorreu.
    
    - **Dados de Exceção** Exibe eventos de exceção e mostra parâmetros e variáveis configurados para a classe através da exceção.
    
    - **Pilha** É a pilha de chamadas, ou seja, a ordem dos acontecimentos. A Exibição de Execuções em Árvore permite a você expandir os nós para investigar as chamadas. Clique no botão de opção **Exibição de Grupo de Recursos** para exibir uma visão geral dos pontos nos quais o tempo foi gasto. Essas respostas mostram em que camada o problema está ou onde ele ocorre.
    
    - **Lista de Módulos** Exibe os eventos de exceção e mostra os módulos carregados no momento da exceção.
    
    - **Observações da Coleta** Exibe as notas sobre o evento.
    
    System_CAPS_tipDica

    Nos Eventos de desempenho, Eventos semelhantes, Eventos relacionados, Encadeamentos distribuídos e Contadores de desempenho, adote as mesmas etapas de solução de problemas utilizadas nos Eventos de exceção.

Para solucionar problemas usando as Propriedades do evento de Desempenho no Application Diagnostics

  1. Na janela do Application Diagnostics do alerta de desempenho que você está investigando, clique na guia Propriedades do evento para exibir os principais detalhes do evento. Esse é o primeiro lugar a verificar para descobrir se o problema de alerta está aparente. A seguir, veja algumas das principais categorias de informações encontradas na página de propriedades do Desempenho:

    - **Fonte** Para exibir os tempos de resposta e carregamento de aplicativos, clique no link **Fonte** no canto superior esquerdo. Essas informações mostram a carga sob a qual o sistema estava no contexto da falha do evento de exceção. Para exibir os contadores de desempenho e avaliar melhor o estado do sistema, na página Fonte, clique na guia **Relatórios de Tendências**. Para ver em quais computadores o aplicativo está executando e descobrir se há um problema de balanceamento de carga entre eles, clique na guia **Computadores**. Para ver um detalhamento das chamadas relacionadas ou o ponto onde os eventos estão ocorrendo com base nas cadeias, clique na guia **Topologia**.
    
    - **Nós Mais Lentos** É uma lista dos nós mais lentos da Exibição de Execuções em Árvore e a causa mais provável dos problemas de desempenho em seu aplicativo.
    
    - **Pilha** É a pilha de chamadas, ou seja, a ordem dos acontecimentos. A Exibição de Execuções em Árvore permite a você expandir os nós para investigar as chamadas. Clique no botão de opção **Exibição de Grupo de Recursos** para exibir uma visão geral dos pontos nos quais o tempo foi gasto. Isso responde em que camada o problema está – onde ele ocorre?
    
    - **Observações da Coleta** Exibe as notas sobre o evento.
    

Para solucionar problemas no estado do sistema usando os Contadores de desempenho

  1. Para exibir uma tabela ou diagrama dos principais contadores de desempenho, clique na guia Contadores de desempenho.

    System_CAPS_noteObservação

    Quinze minutos de dados de desempenho são coletados e armazenados em cache no sistema monitorado. Quando surge uma exceção ou desempenho, os dados de desempenho são enviados de volta ao Operations Manager junto com o evento.

  2. Assinale as caixas de seleção dos contadores de desempenho que você deseja incluir em suas informações e clique em Aplicar.

  3. Use as informações dessa exibição para avaliar o estado de desempenho do sistema em relação ao evento que você está investigando. Por exemplo, se o desempenho estava uniformemente lento no momento do evento, é provável que o alerta esteja atrasado devido a um problema no desempenho do sistema.

Para localizar o problema raiz usando Encadeamentos distribuídos

  1. Clique na guia Encadeamentos distribuídos para exibir a ordem das chamadas – a cadeia de eventos da qual o evento faz parte. Isso ajuda você a entender como o evento investigado foi afetado por outros eventos do mesmo aplicativo ou de aplicativos relacionados.

  2. Na exibição de Encadeamentos distribuídos, clique em uma das chamadas, ou links, da cadeia. Se houver vários eventos para o mesmo objeto, o Assistente de Encadeamento será aberto. Esse assistente permite a você selecionar possíveis eventos para correlação em um encadeamento de eventos. Para iniciar o Assistente, clique em Avançar.

    System_CAPS_noteObservação

    Obtenha o carimbo de data/hora da chamada selecionada, pois você o emparelhará com um evento da próxima página.

  3. Na página Selecionar Possível Evento de Encadeamento, selecione o evento que deseja examinar. O ideal é selecionar o evento com o carimbo de data/hora mais próximo à chamada selecionada na exibição de Encadeamentos distribuídos.

  4. As próximas instruções variam conforme o tipo de problema investigado. Por exemplo, se você selecionar uma transação em que um servidor não foi encontrado, pode ir até a página de propriedades desse evento. Lá, é possível emparelhar o erro do servidor com o evento inicialmente investigado. Como é um erro do servidor, você sabe que o problema não ocorreu no lado do cliente, e sim no lado do servidor. Você pode ver um gráfico do evento selecionado e detalhar um evento de desempenho quanto ao tempo de carregamento da página.

  5. Nas Propriedades do evento, clique na chamada no lado do servidor e na guia Contadores de desempenho para consultar mais detalhes.

Para solucionar problemas exibindo eventos semelhantes

  1. Clique na guia Eventos semelhantes para ver se alertas semelhantes foram lançados outras vezes, o que pode significar um problema com o aplicativo.

  2. Há várias maneiras de filtrar eventos semelhantes. Clique no menu suspenso Semelhante em para selecionar como deseja agrupar os eventos semelhantes: por problema, ação, classe de exceção ou função com falha. Nas caixas de texto De e Até, é possível selecionar o intervalo de datas cujos eventos semelhantes você deseja exibir. Use a guia Eventos semelhantes para ver se alertas semelhantes foram lançados outras vezes, o que pode significar um problema com o aplicativo.

    - **Filtragem por Problema** mostra eventos semelhantes que pertençam ao mesmo tipo. Por exemplo, você pode ver todos os eventos semelhantes nos quais a referência do objeto não esteja configurada como uma instância do objeto. Clique no botão **Modo de Exibição de Diagrama** para ver o a taxa do número total de eventos em relação ao problema atual e o número total de eventos de outros problemas. São informações que oferecem uma perspectiva rápida da magnitude do problema desse evento. Se muitos dos eventos semelhantes do total atual apresentarem o mesmo problema, a resolução desse problema pode ser considerada prioritária, pois terá alto impacto na redução do número de alertas recebidos.
    
    - A **Filtragem por ação** agrupa os eventos semelhantes por aspecto: segurança, desempenho, conectividade e falha no aplicativo. Clique no botão **Modo de Exibição de Diagrama** para ver o número de eventos semelhantes organizados pelas categorias de aspecto, e para ver mais facilmente os eventos aos quais seu problema pode estar relacionado.
    
    - **Filtrando por Classe de Exceção** agrupa os eventos similares de acordo com o modo como eles foram renomeados durante a configuração. Presume-se que esses seriam os nomes que o ajudariam a identificar qual é o tipo de exceções deles, como a classe **System.NullReferenceException**.
    
    - **Filtrando por Função com Falha** agrupa os eventos similares na mesma função que está lançando a exceção. Isso pode significar que há um problema no ponto de entrada.
    

    Lembre-se de que todos esses eventos são similares (relacionados por definição), e esses filtros dão uma ideia melhor de como eles exatamente estão relacionados. Portanto, usando os filtros Eventos Similares, você poderá descobrir que boa parte de todos os seus eventos tem o mesmo problema do evento que está exibindo, que se trata de um problema de desempenho, que eles pertencem a uma classe de exceção que você configurou e que metade dos eventos similares teve a mesma função com falha. Ação: A função vai para o desenvolvedor que precisa atualizar o código de função.

Para solucionar problemas exibindo eventos relacionados

  1. Clique na guia Eventos Relacionados para exibir os eventos relacionados por hora. Essas são exceções correlacionadas com outros eventos que podem fornecer uma visão mais detalhada do problema.

  2. Para visualizar os detalhes de um evento na lista, clique no link na coluna Descrição.

    Nos eventos relacionados, você poderá notar que o tempo de resposta é muito lento para todos os eventos durante um certo tempo. Isso pode indicar um problema no sistema e não no código e, dessa forma, poderá ser encaminhado ao profissional de TI para solução.