Monitoramento e manutenção do SharePoint Server 2013

APLICA-SE A:yes-img-132013 no-img-16 2016no-img-192019 no-img-seSubscription Edition no-img-sopSharePoint no Microsoft 365

Este artigo discute contadores de monitoramento e desempenho para fazendas do SharePoint Server 2013. Para manter o desempenho do sistema do SharePoint Server 2013, você deve monitorar seu servidor para identificar possíveis gargalos. Antes de poder monitorar com eficácia, você deve entender os principais indicadores que informarão se houver uma parte específica do farm que requer atenção, e como saber interpretar esses indicadores. Se perceber que o farm está operando fora do plano definido, ajuste-o adicionando ou removendo recursos de hardware, modificando a topologia ou alterando a forma de armazenamento dos dados.

As informações desta seção pretendem ajudar os administradores a configurar manualmente os contadores de desempenho e outras configurações. Para obter mais informações sobre monitoramento de integridade e solução de problemas usando as ferramentas de monitoramento de integridade integradas à interface do site da Administração Central do SharePoint, leia os seguintes artigos:

Antes de ler este artigo, você deve ler a visão geral de gerenciamento de capacidade e dimensionamento do SharePoint Server 2013.

Configurando o Monitoramento

Veja abaixo uma lista de configurações que você pode alterar para monitorar seu ambiente nos primeiros estágios; elas o ajudarão a determinar se alguma modificação é ou não necessária. O aumento dos recursos de monitoramento afetará a quantidade de espaço em disco que o banco de dados de uso precisará. Depois que o ambiente estiver estável e que este monitoramento detalhado não for mais necessário, talvez seja preciso reverter as configurações abaixo para os respectivos padrões.

Configuração Valor Anotações
Proteção de Saturação do Log de Eventos
Desabilitado
O valor padrão é Habilitado. Essa proteção pode ser desabilitada para coletar o máximo possível de dados de monitoramento. Em operações normais, ela deve ser habilitada.
Cronograma do Trabalho do Temporizador
Importação de Dados de Uso do Microsoft SharePoint Foundation
5 minutos
O valor padrão é 30 minutos. A diminuição deste valor leva à importação dos dados no banco de dados de uso com mais frequência, o que é especialmente útil na solução de problemas. Em operações normais, esse valor deve ser 30 minutos.
Provedores de Diagnóstico
Habilitar todos os provedores de diagnóstico
Habilitado
O valor padrão é Desabilitado, exceto para o provedor de "Monitoramento da Integridade da Pesquisa - Eventos de Rastreamento". Esses provedores coletam dados de integridade de diversos recursos e componentes. Em operações normais, talvez seja preciso reverter para o padrão.
Defina os Intervalos de Agendamento "job-diagnostics-performance-counter-wfe-provider" e "job-diagnostics-performance-counter-sql-provider"
1 minuto
O valor padrão é 5 minutos. A diminuição deste valor pode extrair dados com mais frequência, o que é especialmente útil na solução de problemas. Em operações normais, esse valor deve ser 5 minutos.
Miscellaneous
Habilitar rastreamento de pilha de solicitações de conteúdo
Habilitado
O valor padrão é Desabilitado. A habilitação desta configuração permite o diagnóstico de falhas de solicitações de conteúdo usando o rastreamento de pilha do processo. Em operações normais, esse rastreamento deve estar desativado.
Habilitar o Painel de Desenvolvimento
Habilitado
O valor padrão é Desabilitado. A habilitação desta configuração permite o diagnóstico de páginas lentas ou de outros problemas com o uso do Painel de Desenvolvimento. Em operações normais, e desde que a solução de problemas não seja mais necessária, deve ser desabilitada.
Coleção de Dados de Uso
Uso da Importação de Conteúdo
Uso da Exportação de Conteúdo
Solicitações de Página
Uso de Recurso
Uso da Consulta de Pesquisa
Uso de Inventário de Site
Trabalhos de Timer
Uso de Classificação
Habilitado
A habilitação deste conjunto de contadores permite coletar mais dados de uso em todo o ambiente e permite uma compreensão melhor dos padrões de tráfego no ambiente.

Contadores de desempenho

Se estiver utilizando o banco de dados de uso, você poderá adicionar contadores de desempenho que o auxiliem no monitoramento e avaliação do desempenho do seu farm para o banco de dados de uso, de tal maneira que eles sejam conectados automaticamente em um intervalo específico (por padrão, 30 minutos). Deste modo, você poderá consultar o banco de dados de uso para recuperar esses contadores e fazer um gráfico dos resultados ao longo do tempo. Veja este guia de uso do cmdlet do PowerShell Add-SPDiagnosticsPerformanceCounter para adicionar o contador % Tempo do Processador ao banco de dados de uso. Ele só precisa ser executado em um dos servidores Web:

Add-SPDiagnosticsPerformanceCounter -Category "Processor" -Counter "% Processor Time" -Instance "_Total" -WebFrontEnd

Há diversos contadores de desempenho genéricos, que você deve monitorar em qualquer sistema de servidor. A tabela abaixo descreve esses contadores de desempenho.

Contador de Desempenho Descrição
Processador
Você deve monitorar o desempenho do processador para garantir que todo o uso do processador permaneça consistentemente alto (acima de 80 por cento), pois isto indica que o sistema não conseguiria lidar com qualquer aumento repentino de atividade. E que, no estado comum, você não verá um efeito dominó, caso uma falha de componente leve a um estado de mau funcionamento dos demais componentes. Se, por exemplo, você tiver três servidores da Web, deverá se assegurar de que a média da CPU em todos os servidores seja menos de 60%, de maneira que, se um falhar, os outros dois consigam absorver a carga adicional.
Interface de Rede
Monitore a taxa de envio e recebimento dos dados pela placa da interface da rede. Essa taxa deve permanecer abaixo de 50 por cento da capacidade da rede.
Discos e Cache
Há várias opções de disco lógico, que você deve monitorar regularmente. O espaço em disco disponível é importante em qualquer estudo de capacidade, mas você também deve revisar o tempo de ociosidade do disco. Dependendo dos tipos de aplicativos ou serviços que esteja executando nos seus servidores, você pode revisar os tempos de leitura e gravação do disco. Uma fila extensa para a função de gravação ou leitura afetará o desempenho. O cache tem um grande efeito sobre as operações de leitura e gravação. Você deve monitorar crescentes falhas do cache.
Arquivo de Paginação e Memória
Monitore a quantidade de memória física disponível para alocação. Memória insuficiente levará ao uso excessivo do arquivo de paginação e a um aumento da quantidade de falhas de paginação por segundo.

Contadores do sistema

A tabela abaixo traz informações sobre contadores e objetos do sistema, que você pode adicionar ao conjunto de contadores monitorados no banco de dados de uso, utilizando o SPDiagnosticPerformanceCounter em um servidor da Web.

Objetos e Contadores Descrição
Processador
% do Tempo do Processador
Aqui você vê o uso do processador ao longo do tempo. Se estiver frequentemente muito alto, você perceberá que o desempenho está sendo negativamente afetado. Lembre-se de fazer a contagem "Total" em sistemas multiprocessadores. Você também pode medir a utilização de cada processador para garantir um desempenho equilibrado entre os núcleos.
Disco
- Comprimento Médio da Fila do Disco
Mostra a quantidade média de solicitações de leitura e gravação enfileiradas para o disco selecionado durante o intervalo da amostra. Um comprimento de fila de disco maior pode não significar um problema, desde que as leituras/gravações de disco não estejam sendo penalizadas e o sistema esteja trabalhando em criação contínua, sem expandir a fila.
Comprimento Médio da Fila de Leitura do Disco
A quantidade média de solicitações de leitura que estão enfileiradas.
Comprimento Médio da Fila de Gravação do Disco
A quantidade média de solicitações de gravação que estão enfileiradas.
Leituras de Disco/seg.
A quantidade de leituras do disco por segundo.
Gravações de Disco/seg.
A quantidade de gravações no disco por segundo.
Memória
- Mbytes Disponíveis
Este dado mostra quanta memória física está disponível para alocação. Memória insuficiente levará ao uso excessivo do arquivo de paginação e a um aumento da quantidade de falhas de paginação por segundo.
- Falhas de Cache/seg.
Este contador mostra o índice de ocorrência de falhas quando uma página é procurada no cache do sistema de arquivo sem ser encontrada. Esta pode ser uma falha de software, quando a página é encontrada na memória, ou uma falha de hardware, quando a página está no disco.
O uso efetivo do cache para operações de leitura e gravação pode ter um efeito significativo no desempenho do servidor. Você deve monitorar o aumento das falhas de cache, indicadas por uma redução nas Leituras Rápidas assíncronas/s ou leitura antecipadas/s.
- Páginas/s
Este contador mostra a taxa em que as páginas são lidas ou gravadas no disco, para solucionar falhas de página de hardware. Se aumentar, a taxa indicará problemas de desempenho do sistema todo.
Arquivo de Paginação
- % Usada e % de Pico Usada
O arquivo de paginação do servidor, também conhecido como arquivo de permuta, mantém endereços de memória "virtual" no disco. As falhas de paginação ocorrem quando um processo precisa parar e esperar enquanto os recursos "virtuais" necessários são recuperados do disco para a memória. Isto será mais frequente se a memória física for insuficiente.
NIC
- Total de Bytes/seg.
Esta é a taxa de envio e recebimento de dados pela placa de interface da rede. Talvez você precise investigar mais se essa taxa tem mais de 40 a 50% de capacidade de rede. Para ajustar sua investigação, monitore Bytes recebidos/s e Bytes Enviados/s.
Processo
- Conjunto de Trabalho
Este contador indica o tamanho atual (em bytes) do conjunto de trabalho de um determinado processo. Esta memória é reservada para o processo, mesmo que não esteja sendo usada.
- % Tempo do Processador
Este contador indica a porcentagem do tempo do processador que é usado por um determinado processo.
Contagem de Threads (_Total)
A quantidade atual de threads.
ASP.NET
Total de Solicitações
A quantidade total de solicitações desde o início do serviço.
Solicitações Enfileiradas
O SharePoint Server 2013 fornece os blocos de construção para páginas HTML renderizadas no navegador de usuário por HTTP. Este contador mostra a quantidade de solicitações à espera de processamento.
Tempo de Espera da Solicitação
A quantidade de milissegundos que a solicitação mais recente esperou na fila de processamento. À medida que a quantidade de eventos de espera aumenta, os usuários vão perceber uma diminuição no desempenho das páginas apresentadas.
Solicitações Rejeitadas
A quantidade total de solicitações não executadas devido à insuficiência de recursos de servidor para processá-las. Este contador representa a quantidade de solicitações que retornam o código de status HTTP 503, indicando que o servidor está ocupado demais.
Solicitações em Execução (_Total)
A quantidade de solicitações sendo executadas no momento.
Solicitações/s (_Total)
A quantidade de solicitações executadas por segundo. Isto representa a taxa de transferência atual do aplicativo. Com carga constante, esta quantidade deve se manter dentro de um certo intervalo, barrando outros trabalhos do servidor (como coleta de lixo, thread de limpeza de cache, ferramentas do servidor externo etc.).
Memória do .NET CLR
No. Coletas Ger 0
Exibe o número de vezes que os objetos de geração 0 (ou seja, os objetos mais jovens e alocados mais recentemente) são recuperados pela coleta de lixo desde que o aplicativo começou. Esse número é útil como uma proporção de #Gen 0: #Gen 1: #Gen 2 para garantir que o número de coleções gen 2 não exceda muito as coleções gen 0, idealmente por um fator de 2.
Nº de Coletas Ger 1
Exibe a quantidade de vezes que os objetos da geração 1 são recuperados pela coleta de lixo desde o início do aplicativo.
Nº de Coletas Ger 2
Exibe a quantidade de vezes que os objetos da geração 2 são recuperados pela coleta de lixo desde o início do aplicativo. O contador é incrementado no fim de uma coleta de lixo da geração 2 (também conhecida como coleta total de lixo).
% Tempo Gasto em CL
Exibe o percentual de tempo decorrido que foi gasto executando uma coleta de lixo desde o último ciclo de coleta de lixo. Esse contador geralmente indica o trabalho feito pelo coletor de lixo para coletar e compactar memória em nome do aplicativo. Esse contador é atualizado somente no final de cada coleta de lixo. Esse contador não é uma média. Seu valor reflete o último valor observado. Esse contador deve estar abaixo de 5% em operação normal.

Contadores do SQL Server

A tabela a seguir fornece informações sobre SQL Server objetos e contadores.

Objetos e Contadores Descrição
Estatísticas Gerais
Esse objeto fornece contadores para monitorar atividades gerais em todo o servidor, como o número de conexões atuais e o número de usuários conectando e desconectando por segundo de computadores que estão executando uma instância de SQL Server.
Conexões de Usuário
Este contador mostra o número de conexões de usuário em sua instância de SQL Server. Se este número aumentar cerca de 500 por cento em relação à linha de base, provavelmente haverá redução de desempenho.
Bancos de dados
Este objeto fornece contadores para monitorar operações de cópia em massa, taxa de transferência de backup e recuperação e atividades de log de transações. Monitore transações e o log de transações para determinar a atividade de usuário que está ocorrendo no banco de dados e o quão cheio o log de transações está se tornando. A atividade de usuário pode determinar o desempenho do banco de dados e afetar o tamanho do log, o bloqueio e a replicação. O monitoramento da atividade de log de nível baixo para medir a atividade de usuário e o uso de recursos pode ajudar a identificar os gargalos do desempenho.
Transações/s
Este contador mostra o número de transações em um determinado banco de dados ou em toda SQL Server instância por segundo. Este número deve ajudá-lo a criar uma linha de base e a solucionar problemas.
Bloqueios
Esse objeto fornece informações sobre bloqueios de SQL Server em tipos de recursos individuais.
Número de Bloqueios/seg.
Este contador mostra o número de impasses no SQL Server por segundo. Geralmente, deve ser 0.
Tempo de Espera Médio (ms)
Este contador mostra a média do tempo de espera para cada solicitação de bloqueio que tenha resultado em espera.
Tempo de Espera de Bloqueio (ms)
Este contador mostra o tempo total de espera para bloqueios no último segundo.
Esperas de Bloqueio/seg
Este contador mostra a quantidade de bloqueios por segundo que não puderam ser atendidos imediatamente e tiveram que aguardar por recursos.
Travas
Esse objeto fornece contadores para monitorar bloqueios de recursos internos SQL Server chamados travas. O monitoramento das travas para determinar a atividade do usuário e o uso de recursos pode ajudar a identificar gargalos do desempenho.
Tempo Médio de Espera de Trava (ms)
Este contador mostra o tempo médio de espera de solicitações de trava que tiveram que esperar.
Esperas de Trava/seg.
Este contador mostra o número de solicitações de trava por segundo que não puderam ser atendidas imediatamente.
Estatísticas de SQL
Esse objeto fornece contadores para monitorar a compilação e o tipo de solicitações enviadas para uma instância de SQL Server. O monitoramento do número de compilações e de recompilações de consulta e o número de lotes recebidos por uma instância do SQL Server oferece a você uma indicação da rapidez com que o SQL Server está processando consultas de usuário e com que efetividade o otimizador de consultas está processando as consultas.
Compilações do SQL/seg
Este contador indica a quantidade de vezes por segundo que o caminho de código de compilação é inserido.
Recompilações de SQL/seg.
Este contador indica a quantidade de vezes por segundo que as recompilações da instrução são acionadas.
Cache de Planos
Esse objeto fornece contadores para monitorar como SQL Server usa memória para armazenar objetos como procedimentos armazenados, instruções Transact-SQL improvisadas e preparadas e gatilhos.
Taxa de Acertos do Cache
Este contador indica a taxa entre os acertos do cache e pesquisas de planos.
Cache do Buffer
Esse objeto fornece contadores para monitorar como SQL Server usa a memória para armazenar páginas de dados, estruturas de dados internas e o cache de procedimentos e contadores para monitorar a E/S física como SQL Server lê e grava páginas de banco de dados.
Taxa de Acertos do Cache do Buffer
Este contador mostra a porcentagem de páginas encontradas no cache do buffer sem ter que ler do disco. A razão é o número total de acessos de cache divididos pelo número total de pesquisas de cache desde que uma instância de SQL Server foi iniciada.

Removendo gargalos

Os gargalos do sistema representam um ponto de contenção onde há recursos insuficientes para atender as solicitações de transação do usuário. Podem ser recursos de hardware físico, ambiente operacional ou de aplicativo. Geralmente, a causa do gargalo é código personalizado ineficiente ou soluções de terceiros, que se forem revisados podem produzir resultados melhores que a adição de hardware. Outra causa comum dos gargalos é uma configuração incorreta do farm ou uma implementação de solução ineficiente que estruture os dados de maneira a exigir mais recursos que o necessário. O administrador do sistema deve gerenciar gargalos pelo constante monitoramento do desempenho. Ao identificar um problema de desempenho, você deve avaliar a melhor solução para remoção do gargalo. Os contadores de desempenho e outros aplicativos de monitoramento de desempenho, como o SCOM, são as principais ferramentas no acompanhamento e análise de problemas, para que você possa desenvolver uma solução.

Solução de gargalo físico

Gargalos físicos estão relacionados à contenção da rede, memória, disco e processador: excesso de solicitações disputando poucos recursos físicos. Os objetos e contadores descritos no tópico Monitoramento de Desempenho indicam onde está localizado o problema de desempenho; por exemplo, processador de hardware ou ASP.NET. A solução do gargalo exige que você identifique o problema e depois faça uma ou mais alterações que amenizem o problema de desempenho.

Problemas raramente acontecem de maneira instantânea; geralmente, há uma degradação gradual do desempenho, que você pode rastrear se fizer o monitoramento regularmente, usando a ferramenta de monitoramento de desempenho ou um sistema mais sofisticado, como o SCOM. Nas duas opções, em graus variados, você pode incorporar soluções em um alerta, na forma de texto de orientação ou comandos de script.

Você pode ter que resolver problemas de gargalo fazendo alterações em configurações de hardware ou sistema, depois de determinar que elas não são causadas por uma configuração incorreta, código personalizado ineficiente ou soluções de terceiros ou implementação de solução ineficiente. As tabelas abaixo identificam o limiar do problema e as possíveis opções de solução. Algumas das opções sugerem atualizações ou modificações de hardware.

Objetos e Contadores Problema Opções de Solução
Processador
Processador - % Tempo do Processador
Acima de 75-85%
Atualizar o processador
Aumentar o número de processadores
Adicionar outros servidores
Disco
Comprimento Médio da Fila do Disco
Aumentando gradualmente, o sistema não está em criação contínua e a fila está em processo de backup
Aumentar a quantidade ou a velocidade dos discos
Alterar a configuração da matriz para distribuir
Mover alguns dados para um servidor alternativo
% Tempo Ocioso
Menos de 90%
Aumentar o número de discos
Mover dados para um disco ou servidor alternativo
% Espaço Livre
Menos de 30%
Aumentar número de discos
Mover dados para um disco ou servidor alternativo
Memória
Mbytes Disponíveis
Menos de 2GB em um servidor da Web.
Adicionar memória.
>[! OBSERVAÇÃO]> SQL Server memória disponível será baixa, por design e nem sempre indica um problema.
Falhas de Cache/seg.
Mais de 1
Adicionar memória
Aumentar a velocidade ou o tamanho do cache, se possível
Mover dados para um disco ou servidor alternativo
Páginas/s
Mais de 10
Adicionar memória
Arquivo de Paginação
% Usada e % de Pico Usada
O arquivo de paginação do servidor, às vezes chamado de arquivo de permuta, mantém endereços de memória "virtual" no disco. As falhas de paginação ocorrem quando um processo precisa parar e esperar enquanto os recursos "virtuais" necessários são recuperados do disco para a memória. Isto será mais frequente se a memória física for inadequada.
Adicionar memória
NIC
Total de Bytes/seg.
Acima de 40-50% da capacidade da rede. Esta é a taxa de envio e recebimento de dados pela placa de interface da rede.
Investigue mais, monitorando os Bytes Recebidos/seg. e os Bytes Enviados/seg.
Reavalie a velocidade da placa de interface da rede
Verifique a quantidade, tamanho e uso dos buffers de memória
Processo
Conjunto de Trabalho
Maior do que 80% da memória total
Adicionar memória
% Tempo do Processador
Acima de 75-85%.
Aumentar a quantidade de processadores
Redistribuis carga de trabalho para servidores adicionais
ASP.NET
Reciclagens do Pool de Aplicativos
Vários por dia, causando lentidão intermitente.
Verifique se não implementou configurações que automaticamente reciclam o pool de aplicativos desnecessariamente durante todo o dia.
Solicitações Enfileiradas
Centenas ou milhares de solicitações enfileiradas.
Implementar outros servidores da Web
O máximo padrão deste contador é 5.000 e esta configuração pode ser alterada no arquivo Machine.config
Tempo de Espera da Solicitação
À medida que aumenta a quantidade de eventos em espera, os usuários vão percebendo uma degradação no desempenho da apresentação das páginas.
Implementar outros servidores da Web
Solicitações Rejeitadas
Acima de 0
Implementar outros servidores da Web

Confira também

Conceitos

Teste de desempenho para SharePoint Server 2013

Planejamento de capacidade para o SharePoint Server 2013

Outros recursos

Capacity management and sizing overview for SharePoint Server 2013