Monitorando e mantendo o SharePoint Server 2010

 

Aplica-se a: SharePoint Server 2010

Tópico modificado em: 2015-03-09

Este artigo fornece informações sobre contadores de desempenho e monitoramento de farms do Microsoft SharePoint Server 2010. Para manter o desempenho do sistema do SharePoint Server 2010, você deve monitorar o servidor para identificar possíveis afunilamentos. Para que você possa monitorar de forma eficaz, é necessário compreender os indicadores-chave que o informarão se uma parte específica do farm exigem atenção e saber interpretar esses indicadores. Se achar que o farm está operando fora das metas definidas, você poderá ajustá-lo adicionando ou removendo recursos de hardware, modificando a topologia ou alterando a forma como os dados são armazenados.

As informações contidas nesta seção se destinam a ajudar os administradores a configurar manualmente os contadores de desempenho e outras configurações. Para obter mais informações sobre monitoramento de integridade e solução de problemas usando as ferramentas de monitoramento de integridade internas à interface da Administração Central do SharePoint, leia os seguintes artigos:

Antes de ler este artigo, você deve ler Visão geral do gerenciamento da capacidade e dimensionamento do SharePoint Server 2010.

Neste artigo:

  • Configurando o monitoramento

  • Removendo afunilamentos

Configurando o monitoramento

A seguir, há uma lista das configurações que você pode modificar para monitorar o ambiente nos estágios iniciais, o que ajudará a determinar se são necessárias alterações. Tenha em mente que o aumento dos recursos de monitoramento afetará a quantidade de espaço em disco de que o banco de dados de uso necessitará. Uma vez que o ambiente esteja estável e o monitoramento detalhado não seja mais necessário, convém reverter as configurações a seguir aos padrões.

Configuração Valor Observações

Proteção contra Saturação do Log de Eventos

Desabilitado

O valor padrão é Habilitado. Ele pode ser desabilitado para coletar a quantidade máxima possível de dados de monitoramento. Para operações normais, deve ser habilitado.

Agenda do Trabalho de Timer

   

Importação de Dados de Uso de Microsoft SharePoint Foundation

5 minutos

O valor padrão é de 30 minutos. Se essa configuração for reduzida, os dados serão importados para o banco de dados de uso com mais frequência. Isso é particularmente útil na solução de problemas. Para operações normais, o valor deve ser de 30 minutos.

Provedores de Diagnóstico

   

Habilitar todos os provedores de diagnóstico

Habilitado

O valor padrão é Desabilitado, exceto para o provedor "Monitoramento da Integridade da Pesquisa - Eventos de Rastreamento". Esses provedores coletam de dados de integridade para vários recursos e componentes. Para operações normais, convém reverter ao padrão.

Definir intervalos de agendamento de "job-diagnostics-performance-counter-wfe-provider" e "job-diagnostics-performance-counter-sql-provider"

1 minuto

O valor padrão é de cinco minutos. Se essa configuração for reduzida, o polling dos dados poderá ser realizado com mais frequência. Isso é particularmente útil na solução de problemas. Para operações normais, o valor deve ser de cinco minutos.

Diversos

   

Habilitar rastreamento de pilha para solicitações de conteúdo

Habilitado

O valor padrão é Desabilitado. Se essa configuração for habilitada, permitirá o diagnóstico de falhas de solicitações de conteúdo usando o rastreamento de pilha de processos. Para operações normais, ela deve ser desabilitada.

Habilitar o Painel do Desenvolvedor

Habilitado

O valor padrão é Desabilitado. Se essa configuração for habilitada, permitirá o diagnóstico de páginas lentas ou outros problemas usando o Painel do Desenvolvedor. Para operações normais e uma vez que a solução de problemas não seja mais necessária, ela deve ser desabilitada.

Coleta de Dados de Uso

   

Uso de Importação de Conteúdo

Uso de Exportação de Conteúdo

Solicitações de Página

Uso de Recursos

Uso de Consultas de Pesquisa

Uso de Inventário de Site

Trabalhos de Timer

Uso de Classificação

Habilitado

A habilitação dos logs desse conjunto de contadores permite coletar mais dados de uso em todo o ambiente e compreender melhor os padrões de tráfego no ambiente.

Contadores de desempenho

Se estiver utilizando o banco de dados de uso, você poderá adicionar os contadores de desempenho que o ajudam a monitorar e avaliar o desempenho do farm para o banco de dados de uso, de tal forma que eles sejam registrados automaticamente em um intervalo específico (30 minutos, por padrão). Dessa forma, você pode consultar o banco de dados de uso para recuperar esses contadores e criar um gráfico dos resultados ao longo do tempo. A seguir há um exemplo do uso do cmdlet Add-SPDiagnosticsPerformanceCounter do PowerShell para adicionar o contador % Tempo de Processador ao banco de dados de uso. Isso só precisa ser executado em um dos servidores Web:

Add-SPDiagnosticsPerformanceCounter -Category "Processor" -Counter "% Processor Time" -Instance "_Total" -WebFrontEnd

Há diversos contadores de desempenho genéricos que você deve monitorar para qualquer sistema de servidor. A tabela a seguir os descreve.

Contador de Desempenho Descrição

Processador

Você deve monitorar o desempenho do processador para garantir que a totalidade de seu uso não permaneça consistentemente elevada (acima de 80 por cento), pois isso indica que o sistema não seria capaz de lidar com picos de atividade repentinos. Além disso, no estado comum, você não verá um efeito dominó em que, um componente falhar, causará problemas nos demais componentes. Por exemplo, se tiver três servidores Web, você deverá garantir que a CPU média em todos os servidores esteja abaixo de 60%, de modo que, se um deles falhar, os outros dois ainda possam assumir a carga adicional.

Interface de rede

Monitore a taxa à qual os dados são enviados e recebidos através da placa de interface de rede. A taxa deve permanecer abaixo de 50% da capacidade da rede.

Discos e Cache

Há diversas opções de disco lógico que você deve monitorar regularmente. O espaço em disco disponível é essencial em qualquer estudo de capacidade, mas você também deve analisar o tempo pelo qual o disco está ocioso. Dependendo dos tipos de aplicativos ou serviços em execução no servidor, você pode examinar os tempos de leitura e gravação de disco. Filas estendidas para as funções de gravação ou leitura afetarão o desempenho. O cache tem grande impacto sobre as operações de leitura e gravação. Você deve monitorar se há maior número de falhas de cache.

Arquivo de Memória e Paginação

Monitore a quantidade de memória física disponível para alocação. Se houver memória insuficiente, isso levará ao uso excessivo do arquivo de paginação e a um aumento no número de falhas de página por segundo.

Contadores do Sistema

A tabela a seguir fornece informações sobre contadores e objetos do sistema que você pode adicionar ao conjunto de contadores monitorados no banco de dados de uso utilizando o SPDiagnosticPerformanceCounter em um servidor Web.

Objetos e contadores Descrição

Processador

 

% Tempo de Processador

Mostra o uso do processador ao longo de um período de tempo. Se o uso for consistentemente elevado demais, você poderá verificar que o desempenho está sendo prejudicado. Lembre-se de contar "Total", em sistemas multiprocessador. Você também pode medir a utilização em cada processador, para garantir um desempenho equilibrado entre os núcleos.

Disco

 

- Comprimento Médio da Fila de Disco

Mostra o número médio de solicitações de leitura e gravação que foram enfileiradas para o disco selecionado durante o intervalo de amostragem. Um comprimento de fila de disco maior pode não ser um problema, desde que as leitura/gravações de disco não sejam prejudicadas e o sistema esteja funcionando em um estado estável, sem aumentar as filas.

Comprimento Médio da Fila de Leitura de Disco

O número médio de solicitações de leitura que estão na fila.

Comprimento Médio da Fila de Gravação de Disco

O número médio de solicitações de gravação que estão na fila.

Leituras de Disco/s

O número de leituras de disco por segundo.

Gravações de Disco/s

O número de gravações em disco por segundo.

Memória

 

- Mbytes Disponíveis

Mostra a quantidade de memória física disponível para alocação. Se houver memória insuficiente, isso levará ao uso excessivo do arquivo de paginação e a um aumento no número de falhas de página por segundo.

- Falhas de Cache/s

Este contador mostra a taxa à qual ocorrem falhas quando uma página é procurada no cache do sistema de arquivos e não é encontrada. Pode se tratar de uma falha leve, quando a página é encontrada na memória, ou de uma falha grave, quando a página está em disco.

O uso efetivo do cache para operações de leitura e gravação pode ter um efeito significativo no desempenho do servidor. Você deve monitorar se há maios falhas de cache, o que é indicado por uma redução em Leituras Rápidas Assíncronas/s ou Leituras Antecipadas/s.

- Páginas/s

Esse contador mostra a taxa à qual as páginas são lidas ou gravadas em disco, para resolver falhas de página graves. Se o valor aumentar, isso indicará problemas de desempenho em todo o sistema.

Arquivo de Paginação

 

- % Usado e % Pico de Uso

O arquivo de paginação do servidor, às vezes chamado de arquivo de troca, tem endereços de memória "virtuais" em disco. Falhas de página ocorrem quando um processo precisa parar e esperar enquanto recursos "virtuais" necessários são recuperados do disco para a memória. Elas serão mais frequentes se a memória física for inadequada.

NIC

 

- Total de Bytes/s

Essa é a taxa à qual os dados são enviados e recebidos através da placa de interface de rede. Talvez seja necessário continuar a investigar, caso essa taxa seja superior a 40-50% da capacidade da rede. Para ajustar a investigação, monitore Bytes recebidos/s e Bytes Enviados/s.

Processo

 

- Conjunto de Trabalho

Este contador indica o tamanho atual (em bytes) do conjunto de trabalho de determinado processo. Essa memória é reservada para o processo, mesmo que não esteja em uso.

- % Tempo de Processador

Esse contador indica a porcentagem de tempo de processador que é usada por determinado processo.

Contagem de Threads (_Total)

O número atual de threads.

ASP.NET

 

Total de Solicitações

O número total de solicitações desde que o serviço foi iniciado.

Solicitações Enfileiradas

O Microsoft SharePoint Foundation 2010 fornece os blocos de construção de páginas HTML que são renderizadas no navegador do usuário através de HTTP. Esse contador mostra o número de solicitações aguardando para serem processadas.

Tempo de Espera da Solicitação

O número de milissegundos que a solicitação mais recente aguardou na fila para processamento. À medida que aumenta o número de eventos de espera, os usuários experimentam desempenho de renderização de páginas degradado.

Solicitações Rejeitadas

O número total de solicitações não executadas devido a recursos insuficientes do servidor para processá-las. Esse contador representa o número de solicitações que retornam um código de status 503 HTTP, indicando que o servidor está muito ocupado.

Solicitações em Execução (_Total)

O número de solicitações em execução no momento.

Solicitações/s (_Total)

O número de solicitações executadas por segundo. Isso representa a produtividade atual do aplicativo. Sob carga constante, esse número deve permanecer dentro de determinado intervalo, com exceção de outro trabalho do servidor (como coleta de lixo, threads de limpeza de cache, ferramentas de servidor externas e assim por diante).

Memória .NET CLR

 

Nº de Coletas da Ger. 0

Exibe o número de vezes que os objetos da geração 0 (ou seja, os objetos mais novos e alocados mais recentemente) foram submetidos a coleta de lixo desde que o aplicativo foi iniciado. Esse número é útil como uma razão de Geração 0: Geração 1: Geração 2 para garantir que o número de conjuntos da Geração 2 não exceda em muito os conjuntos da Geração 0, otimamente por um fator de 2.

Nº de Coletas da Ger. 1

Exibe o número de vezes que os objetos da geração 1 foram submetidos a coleta de lixo desde que o aplicativo foi iniciado.

Nº de Coletas da Ger. 2

Exibe o número de vezes que os objetos da geração 2 foram submetidos a coleta de lixo desde que o aplicativo foi iniciado. O contador é incrementado ao final de uma coleta de lixo da geração 2 (também chamada de coleta de lixo completa).

% Tempo na Coleta de Lixo

Exibe a porcentagem de tempo que foi gasto na execução de uma coleta de lixo desde o último ciclo de coleta de lixo. Esse contador geralmente indica o trabalho feito pelo coletor de lixo para recolher e comprimir memória em nome do aplicativo, sendo atualizado apenas ao final de cada coleta de lixo. Ele não é uma média; seu valor reflete o último valor observado. Esse contador deve ser inferior a 5% em operação normal.

Contadores do SQL Server

A tabela a seguir fornece informações sobre objetos e contadores do SQL Server.

Objetos e contadores Descrição

Estatísticas Gerais

Esse objeto fornece contadores para monitorar a atividade em todo o servidor geral, como o número de conexões atuais e o número de usuários que se conectam e desconectam por segundo de computadores que executam uma instância do SQL Server.

Conexões de Usuário

Esse contador mostra a quantidade de conexões de usuário em sua instância do SQL Server. Se esse número crescer 500 por cento em relação à linha de base, talvez haja uma redução do desempenho.

Bancos de Dados

Esse objeto fornece contadores para monitorar operações de cópia em massa, produtividade de backup e restauração e atividades de log de transações. Monitore as transações e o log de transações para determinar o volume de atividades dos usuários no banco de dados e o quanto o log de transações está ficando cheio. O volume de atividades dos usuários pode determinar o desempenho do banco de dados e afetar o tamanho do log, o bloqueio e a replicação. Monitorar a atividade de log de baixo nível para medir a atividade dos usuários e o uso de recursos pode ajudá-lo a identificar afunilamentos de desempenho.

Transações/s

Esse contador mostra a quantidade de transações por segundo em determinado banco de dados ou em toda a instância do SQL Server. Esse número serve para ajudá-lo a criar uma linha de base e solucionar problemas.

Bloqueios

Esse objeto fornece informações sobre bloqueios do SQL Server em tipos de recursos individuais.

Número de Deadlock/s

Esse contador mostra o número de deadlocks no SQL Server por segundo. Esse valor normalmente deve ser 0.

Tempo de Espera Médio (ms)

Este contador mostra a quantidade média de tempo de espera para cada solicitação de bloqueio que resultou em uma espera.

Tempo de Espera de Bloqueio (ms)

Esse contador mostra o tempo total de espera para bloqueios no último segundo.

Esperas de Bloqueio/s

Este contador mostra o número de bloqueios por segundo que não puderam ser atendidos imediatamente e precisaram esperar recursos

Travas

Esse objeto fornece contadores para monitorar bloqueios internos de recursos do SQL Server chamados travas. O monitoramento de travas para determinar a atividade dos usuários e o uso de recursos pode ajudá-lo a identificar afunilamentos de desempenho.

Tempo Médio de Espera de Trava (ms)

Esse contador mostra o tempo médio de espera de trava para solicitações de trava que precisaram esperar.

Esperas de Trava/s

Esse contador mostra o número de solicitações de trava por segundo que não puderam ser atendidas imediatamente.

Estatísticas SQL

Esse objeto fornece contadores para monitorar a compilação e o tipo de solicitações enviadas a uma instância do SQL Server. O monitoramento do número de compilações e recompilações de consultas e do número de lotes recebidos por uma instância do SQL Server indica a rapidez com que o SQL Server está processando as consultas de usuários e a eficiência com que o otimizador de consulta está processando as consultas.

Compilações de SQL/s

Esse contador indica o número de vezes que o caminho de código de compilação é inserido por segundo.

Recompilações de SQL/s

Esse contador indica o número de vezes que recompilações de declaração são disparadas por segundo.

Cache de Planos

Esse objeto fornece contadores para monitorar como o SQL Server usa a memória para armazenar objetos como procedimentos armazenados, instruções Transact-SQL ad-hoc e preparadas e gatilhos.

Taxa de Acertos do Cache

Esse contador indica a taxa entre acertos e pesquisas de cache para planos.

Cache do buffer

Este objeto fornece contadores para monitorar como o SQL Server usa a memória para armazenar páginas de dados, estruturas de dados internas e o cache de procedimento, bem como contadores para monitorar a E/S física enquanto o SQL Server lê e grava páginas de banco de dados.

Taxa de Acertos do Cache do Buffer

Esse contador mostra a porcentagem de páginas encontradas no cache do buffer sem a necessidade de leitura do disco. A taxa é o número total de acertos de cache dividido pelo número total de pesquisas de cache desde que uma instância do SQL Server foi iniciada.

Removendo afunilamentos

Os afunilamentos do sistema representam um ponto de contenção em que não há recursos suficientes para atender às solicitações de transações do usuário. Elas podem ser de hardware físico, ambiente operacional ou baseadas em aplicativos. Muitas vezes, a razão para o afunilamentos consiste em um código personalizado ineficiente ou em soluções de terceiros, e um exame desses itens poderia render melhores resultados do que a adição de hardware. Outra causa comum de afunilamentos é a configuração incorreta do farm ou uma implementação de solução ineficiente que estrutura os dados de uma maneira que requer mais recursos do que o necessário. Para um administrador de sistema, é essencial gerenciar os afunilamentos monitorando constantemente o desempenho. Ao identificar um problema de desempenho, você deve avaliar a melhor resolução para remover o afunilamento. Os contadores de desempenho e outros aplicativos de monitoramento de desempenho, como o SCOM (System Center Operations Manager), são as principais ferramentas de monitoramento e análise de problemas, para que você possa desenvolver uma solução.

Resolução de afunilamentos físicos

Os afunilamentos físicos são baseados em contenção de processador, disco, memória e rede: muitas solicitações estão disputando muito poucos recursos físicos. Os objetos e contadores descritos no tópico Monitorando o desempenho indicam que o problema de desempenho está localizado, por exemplo, no processador de hardware ou ASP.NET. Para a resolução de afunilamentos, você deve identificar o problema e fazer uma ou mais alterações que atenuam o problema de desempenho.

Os problemas raramente acontecem de forma instantânea; em geral, há uma gradual degradação do desempenho que você poderá rastrear se realizar o monitoramento regularmente, usando sua ferramenta de monitor de desempenho ou um sistema mais sofisticado, como o SCOM. Para ambas as opções, em diferentes graus, é possível inserir soluções em um alerta, em forma de texto de aconselhamento ou comandos com script.

Talvez você tenha que resolver problemas de afunilamento fazendo alterações em configurações de hardware ou do sistema, após determinar que os problemas não são causados por configuração incorreta, código personalizado ineficiente ou soluções de terceiros ou uma implementação de solução ineficiente. As tabelas a seguir identificam limites de problemas e possíveis opções de resolução. Algumas das opções sugerem modificações ou atualizações de hardware.

Objetos e contadores Problema Opções de resolução

Processador

Processador - % Tempo de Processador

Mais de 75-85%

Atualizar o processador

Aumentar o número de processadores

Adicionar servidor(es)

Disco

   

Comprimento Médio da Fila de Disco

Aumentando gradualmente; o sistema não está em um estado de equilíbrio e a fila está aumentando

Aumentar o número ou a velocidade dos discos

Alterar configuração de matriz para distribuição

Mover alguns dados para um servidor alternativo

% Tempo Ocioso

Mais de 90%

Aumentar o número de discos

Mover dados para um disco ou servidor alternativo

% de Espaço Livre

Menos de 30%

Aumentar o número de discos

Mover dados para um disco ou servidor alternativo

Memória

   

Mbytes Disponíveis

Menos de 2 GB em um servidor Web.

Adicionar memória.

Observação

A memória disponível do SQL Server será baixa, por design, e isso nem sempre indica um problema.

Falhas de Cache/s

Mais de 1

Adicionar memória

Aumente a velocidade ou o tamanho do cache, se possível

Mover dados para um disco ou servidor alternativo

Páginas/s

Mais de 10

Adicionar memória

Arquivo de Paginação

   

% Usado e % Pico de Uso

O arquivo de paginação do servidor, às vezes chamado de arquivo de troca, tem endereços de memória "virtuais" em disco. Falhas de página ocorrem quando um processo precisa parar e esperar enquanto recursos "virtuais" necessários são recuperados do disco para a memória. Elas serão mais frequentes se a memória física for inadequada.

Adicionar memória

NIC

   

Total de Bytes/s

Mais de 40-50% da capacidade da rede. Essa é a taxa à qual os dados são enviados e recebidos através da placa de interface de rede.

Continuar a investigar monitorando Bytes recebidos/s e Bytes Enviados/s

Reavaliar a velocidade da placa de rede de interface

Verificar o número, tamanho e uso de buffers de memória

Processo

   

Conjunto de Trabalho

Mais de 80% da memória total

Adicionar memória

% Tempo de Processador

Mais de 75-85%.

Aumentar o número de processadores

Redistribuir a carga de trabalho para servidores adicionais

ASP.NET

   

Reciclagens do Pool de Aplicativos

Várias por dia, causando lentidão intermitente.

Verifique se você não implementou configurações que reciclam automaticamente o pool de aplicativos sem necessidade ao longo de todo o dia.

Solicitações Enfileiradas

Centenas ou milhares de solicitações enfileiradas.

Implementar servidores Web adicionais

O máximo padrão para esse contador é 5.000, e você pode alterar essa configuração no arquivo Machine.config

Tempo de Espera da Solicitação

À medida que aumenta o número de eventos de espera, os usuários experimentam desempenho de renderização de páginas degradado.

Implementar servidores Web adicionais

Solicitações Rejeitadas

Mais de 0

Implementar servidores Web adicionais

See Also

Concepts

Visão geral do gerenciamento da capacidade e dimensionamento do SharePoint Server 2010
Testes de desempenho para SharePoint Server 2010
Planejamento de capacidade para SharePoint Server 2010
Health monitoring (SharePoint Server 2010)
Planejamento e configuração de armazenamento e capacidade do SQL Server (SharePoint Server 2010)