Мониторинг и обслуживание SharePoint Server 2013

ОБЛАСТЬ ПРИМЕНЕНИЯ:yes-img-132013 no-img-162016 no-img-192019 no-img-seSubscription Edition no-img-sopSharePoint в Microsoft 365

В этой статье описываются счетчики мониторинга и производительности для ферм SharePoint Server 2013. Для обеспечения производительности системы SharePoint Server 2013 необходимо отслеживать работу сервера, чтобы выявлять возможные "узкие места". Для эффективного мониторинга нужно понять основные индикаторы, сообщающие вам о том, что определенные компоненты фермы требуют внимания, и также узнать, как интерпретировать такие индикаторы. Если ферма работает за пределами заданных целевых показателей, вы можете добавить или удалить аппаратные ресурсы, изменить топологию или способ хранения данных.

Информация в этом разделе предназначена, чтобы помочь администраторам вручную настраивать счетчики производительности и другие параметры. Дополнительные сведения о мониторинге работоспособности и устранении неполадок с помощью средств мониторинга работоспособности, встроенных в интерфейс веб-сайта центра администрирования SharePoint, см. в следующих статьях:

Перед прочтением этой статьи следует ознакомиться с Capacity management and sizing overview for SharePoint Server 2013.

Настройка мониторинга

Ниже приведен список параметров, которые можно изменить, чтобы отслеживать среду на ранних этапах, что поможет определить, требуются ли какие-либо изменения. Увеличение возможностей мониторинга повлияет на объем дискового пространства, необходимого для базы данных об использовании. После того, как среда станет стабильной и отпадет потребность в подробном мониторинге, может потребоваться восстановить значения по умолчанию для перечисленных ниже параметров.

Параметр Значение Примечания
Защита от переполнения журнала событий
Отключено
Значение по умолчанию — Включено. Этот параметр можно отключить, чтобы собирать как можно больше данных мониторинга. Для нормального режима работы этот параметр нужно включить.
Расписание задания таймера
Импорт данных об использовании Microsoft SharePoint Foundation
5 мин.
Значение по умолчанию — 30 минут. Снижение этого параметра чаще импортирует данные в базу данных об использовании и особенно полезно при устранении неполадок. Для обычных операций это должно быть 30 минут.
Поставщики диагностики
Включение всех поставщиков диагностики
Включена
Значение по умолчанию — Отключено, кроме поставщика "Мониторинг работоспособности поиска — трассировка событий". Эти поставщики собирают данные о работоспособности различных функций и компонентов. Для нормального режима работы может потребоваться восстановить значение по умолчанию.
Установка интервалов расписания "job-diagnostics-performance-counter-wfe-provider" и "job-diagnostics-performance-counter-sql-provider"
1 мин.
Значение по умолчанию — 5 минут. Снижение этого параметра позволяет чаще опрашивание данных, что особенно полезно при устранении неполадок. Для обычных операций это должно быть 5 минут.
Разное
Включение трассировки стека для запросов контента
Включена
Значение по умолчанию — Отключено. Если включить этот параметр, вы сможете диагностировать сбои запросов контента с помощью трассировки стека процессов. Для нормального режима работы этот параметр следует включить.
Включение панели разработчика
Включена
Значение по умолчанию — Отключено. Если включить этот параметр, вы сможете диагностировать медленные страницы и другие проблемы с помощью панели разработчика. Для нормального режима работы этот параметр следует отключить сразу после завершения устранения неполадок.
Сбор данных об использовании
Использование импорта контента
Использование экспорта контента
Запросы страниц
Использование компонентов
Использование запросов поиска
Использование каталога сайтов
Задания таймера
Использование оценок
Включено
Включение ведения журнала для этого набора счетчиков позволит вам собирать больше данных об использовании во всей среде и лучше понимать, какие схемы трафика присутствуют в среде.

Счетчики производительности

Если вы применяете базу данных использования, вы можете добавить счетчики производительности, помогающие отслеживать и оценивать производительность фермы по отношению к базе данных использования, которые будут автоматически записываться в журнал с определенным интервалом (по умолчанию — 30 минут). С учетом этого вы можете запрашивать базу данных использования, чтобы получать эти счетчики и анализировать результаты с течением времени. Далее показано, как использовать командлет Add-SPDiagnosticsPerformanceCounter консоли PowerShell, чтобы добавить счетчик "% загруженности процессора" в базу данных использования. Этот командлет выполняется только на одном из веб-серверов:

Add-SPDiagnosticsPerformanceCounter -Category "Processor" -Counter "% Processor Time" -Instance "_Total" -WebFrontEnd

Существует несколько универсальных счетчиков производительности, которые следует отслеживать для любой серверной системы. Они описываются в следующей таблице.

Счетчик производительности Описание
Процессор
Следует отслеживать производительность процессора, чтобы гарантировать, что все использование процессора не остается постоянно высоким (более 80 процентов), так как это означает, что система не сможет справиться с резкими всплесками активности. И что в общем состоянии вы не увидите эффект домино, если сбой одного из компонентов приведет остальные компоненты к неработоспособности. Например, если у вас три веб-сервера, следует убедиться, что средний объем ЦП на всех серверах не ниже 60 %, чтобы в случае сбоя одного из них по-прежнему было место для того, чтобы поглощать дополнительную нагрузку для двух других серверов.
Сетевой интерфейс
Отслеживайте скорость передачи и получения данных через сетевой адаптер. Это значение всегда должно быть меньше 50 % пропускной способности сети.
Диски и кэш
Существует несколько параметров логического диска, которые следует регулярно отслеживать. Доступное место на диске важно при любом исследовании емкости, но также следует проверить время простоя диска. В зависимости от типов приложений или служб, которые выполняются на серверах, вы можете просматривать время чтения и записи на диске. Расширенная очередь для функции записи или чтения повлияет на производительность. Кэш оказывает значительное влияние на операции чтения и записи. Необходимо отслеживать увеличение числа сбоев кэша.
Память и файл подкачки
Отслеживайте объем физической памяти, доступный для выделения. Если памяти недостаточно, файл подкачки будет использоваться более интенсивно, а число ошибок страниц в секунду увеличится.

Системные счетчики

В следующей таблице описываются системные объекты и счетчики, которые можно добавить в число отслеживаемых в базе данных использования с помощью SPDiagnosticPerformanceCounter на веб-сервере.

Объекты и счетчики Описание
Процессор
% загруженности процессора
Отображает загрузку процессора с течением времени. Если это значение слишком велико на протяжении длительного времени, производительность может быть значительно снижена. В многопроцессорных системах не забудьте учитывать общее значение. Вы также можете измерять использование каждого процессора, чтобы балансировать нагрузку между ядрами.
Диск
— Средняя длина очереди диска
Этот счетчик показывает среднее количество запросов на чтение и запись, помещенных в очередь для выбранного диска в течение интервала выборки. Большая очередь допустима, если не влияет на операции чтения и записи, а система работает стабильно без расширения очереди.
— Средняя длина очереди чтения диска
Среднее число запросов на чтение в очереди.
Средняя длина очереди записи на диск
Среднее число запросов на запись в очереди.
Количество операций чтения с диска/с
Число операций чтения диска в секунду.
Количество операций записи на диск/с
Число операций записи на диск в секунду.
Память
— Доступно МБ
Этот счетчик показывает объем физической памяти, доступный для выделения. Если памяти недостаточно, файл подкачки будет использоваться более интенсивно, а число ошибок страниц в секунду увеличится.
— Ошибок кэш-памяти/с
Этот счетчик показывает частоту возникновения ошибок при поиске страницы в кэше файловой системы. Это может быть программная ошибка, если страница обнаружена в памяти, или аппаратная ошибка, если страница находится на диске.
Эффективное использование кэша для операций чтения и записи может сильно повлиять на производительность сервера. Необходимо отслеживать увеличение числа ошибок кэша, что обозначается снижением значения Асинхронных быстрых чтений/с или Упреждающих чтений/с.
— Обмен страниц/с
Этот счетчик показывает скорость чтения или записи страниц на диск для устранения ошибок страниц физической памяти. Если его значение увеличивается, существуют проблемы с производительностью всей системы.
Файл подкачки
— % использования и % использования (пик)
Страничный файл сервера, также известный как файл подкачки, содержит "виртуальные" адреса на диске. Ошибки страницы возникают, когда процесс нужно остановить и дождаться, пока необходимые "виртуальные" ресурсы будут скопированы с диска в память. Их будет больше, если объема физической памяти недостаточно.
Сетевой адаптер
— Всего байт/с
Это скорость передачи и получения данных через сетевой адаптер. Если это значение превышает 40-50 % емкости сети, может потребоваться дальнейший анализ. Для более точного исследования отслеживайте значения Получено байт/с и Отправлено байт/с.
Процесс
— Рабочий набор
Этот счетчик указывает текущий размер рабочего набора для заданного процесса в байтах. Этот объем памяти резервируется для процесса, даже если он не используется.
— % загруженности процессора
Этот счетчик показывает процент времени процессора, используемого указанным процессом.
Число потоков (_Total)
Текущее количество потоков.
ASP.NET
Общее число запросов
Общее число запросов с момента запуска службы.
Запросов в очереди
SharePoint Server 2013 предоставляет структурные блоки для HTML-страниц, которые передаются по протоколу HTTP и отображаются в браузере. Этот счетчик показывает число запросов, ожидающих обработки.
Время ожидания запроса
Время ожидания последнего запроса в очереди на обработку в миллисекундах. С увеличением числа событий ожидания пользователи будут замечать снижение производительности при отрисовке страниц.
Отклонено запросов
Общее число запросов, не выполненных из-за недостатка ресурсов сервера для их обработки. Этот счетчик представляет число запросов, возвращающих код состояния HTTP 503, указывающий на то, что сервер занят.
Выполняется запросов (_Total)
Число текущих выполняемых запросов.
Запросов/с (_Total)
Число выполняемых запросов в секунду. Это значение представляет текущую пропускную способность приложения. При постоянной нагрузке это число должно оставаться в определенном диапазоне, препятствуя выполнению других операций (например, сбору мусора, потоку очистки кэша, внешним серверным средствам и т. д.).
Память CLR .NET
Сборов мусора для поколения 0
Отображает количество случаев, когда объекты поколения 0 (т. е. самые молодые, недавно выделенные объекты) освобождаются с помощью сборки мусора с момента запуска приложения. Это число полезно в виде соотношения #Gen 0: #Gen 1: #Gen 2, чтобы убедиться, что количество коллекций 2-го поколения не значительно превышает коллекции поколения 0, оптимально в 2 раз.
Сборов мусора для поколения 1
Отображает число извлечений объектов поколения 1 сборщиком мусора с момента запуска приложения.
Сборов мусора для поколения 2
Отображает число извлечений объектов поколения 2 сборщиком мусора с момента запуска приложения. Этот счетчик увеличивается на 1 после завершения сбора мусора для поколения 2 (что также называют полным сбором мусора).
% времени в GC
Отображает процент времени, затраченного на выполнение сборки мусора с момента последнего цикла сборки мусора. Этот счетчик обычно указывает на работу, проделанную сборщиком мусора для сбора и сжатия памяти от имени приложения. Этот счетчик обновляется только в конце каждой сборки мусора. Этот счетчик не является средним. Его значение отражает последнее наблюдаемое значение. Этот счетчик должен быть не более 5 % в нормальной работе.

Счетчики SQL Server

В следующей таблице приведены сведения об объектах и счетчиках SQL Server.

Объекты и счетчики Описание
Общая статистика
Этот объект содержит счетчики для мониторинга общей работы сервера, такие как счетчик количества текущих подключений и количества пользователей, подключающихся к экземпляру SQL Server и отключающихся от него, в секунду.
Соединений пользователей
Этот счетчик показывает количество пользовательских подключений к вашему экземпляру SQL Server. Повышение этого значения на 500 % относительно исходного уровня может привести к снижению производительности.
Базы данных
Этот объект содержит счетчики для мониторинга массовых операций копирования, пропускной способности резервного копирования и восстановления, а также операций с журналом транзакций. Мониторинг транзакций и журнала транзакций позволяет определить степень активности пользователей в базе данных и степень заполнения журнала транзакций. Степень активности пользователей может оказывать влияние на производительность базы данных, размер журнала, блокировку и репликацию. Мониторинг низкоуровневых операций с журналом для оценки активности пользователей и использования ресурсов помогает определить факторы, ограничивающие производительность.
Транзакций/с
Этот счетчик отображает число транзакций в заданной базе данных или всем экземпляре SQL Server в секунду. Это значение помогает создать базовый план и упрощает устранение неполадок.
Блокировки
Этот объект содержит сведения о блокировках SQL Server для отдельных типов ресурсов.
Число взаимоблокировок/с
Этот счетчик показывает число взаимоблокировок в SQL Server в секунду. Как правило, это значение должно быть равно 0.
Среднее время ожидания блокировки (мс)
Этот счетчик показывает среднее время ожидания для каждого запроса блокировки, который вызвал задержку.
Время ожидания блокировки (мс)
Этот счетчик показывает общее время ожидания блокировок за последнюю секунду.
Ожиданий блокировок/с
Этот счетчик показывает количество блокировок в секунду, которые не были выполнены немедленно и были вынуждены ждать освобождения ресурсов.
Кратковременные блокировки
Этот объект содержит счетчики для мониторинга внутренних блокировок ресурсов SQL Server, которые называются кратковременными блокировками. Мониторинг кратковременных блокировок для определения активности пользователей и использования ресурсов помогает определить факторы, ограничивающие производительность.
Среднее время ожидания кратковременной блокировки (мс)
Этот счетчик показывает среднее время ожидания для запросов кратковременной блокировки.
Ожиданий кратковременных блокировок/с
Этот счетчик показывает число запросов кратковременных блокировок в секунду, которые не удалось выполнить незамедлительно.
Статистика SQL
Этот объект содержит счетчики для мониторинга компиляции и типа запросов, направленных к экземпляру SQL Server. Мониторинг количества компиляций и повторных компиляций, а также количества пакетов, полученных экземпляром SQL Server, позволяет определить скорость обработки запросов пользователей в SQL Server и эффективность обработки запросов оптимизатором запросов.
Компиляций SQL/с
Этот счетчик показывает количество введений пути к компилируемому коду в секунду.
Повторных компиляций SQL/с
Этот счетчик показывает число перекомпиляций инструкций в секунду.
Кэш планов
Этот объект предоставляет счетчики для отслеживания того, как SQL Server использует память для хранения таких объектов, как хранимые процедуры, случайные и подготовленные инструкции Transact-SQL, а также триггеры.
Коэффициент попадания в кэш
Этот счетчик показывает отношение количества попаданий в кэш к количеству поисков для планов.
Буферный кэш
Этот объект содержит счетчики для мониторинга того, как SQL Server использует память для хранения страниц данных, внутренних структур данных и кэша процедур, а также для мониторинга работы физической подсистемы ввода-вывода при чтении и записи страниц базы данных в SQL Server.
Коэффициент попадания в буферный кэш
Этот счетчик показывает процент страниц, которые были найдены в буферном кэше и не требовали считывания с диска. Коэффициент равен отношению общего количества попаданий в кэш к общему количеству поисков в кэше с момента запуска экземпляра SQL Server.

Удаление узких мест

Узкие места в системе — это элементы с недостатком ресурсов для обработки запросов транзакций пользователей. Это может быть физическое устройство, операционная среда или приложение. Зачастую причиной появления узкого места является применение неэффективного пользовательского кода или сторонних решений, поэтому их оптимизация может быть более выгодна, чем установка нового оборудования. Другая распространенная причина — неправильная конфигурация фермы или неэффективная реализация решения, которое структурирует данные так, что для их обработки требуется больше ресурсов, чем нужно на самом деле. Системный администратор должен контролировать появление узких мест, постоянно отслеживая производительность. При выявлении проблемы необходимо определить лучший способ ее устранения. Ключевыми средствами для отслеживания и анализа проблем являются счетчики производительности и другие приложения мониторинга производительности, такие как SCOM.

Устранение физического узкого места

Физические узкие места связаны с недостатком ресурсов процессора, диска, памяти и сети: слишком много запросов для слишком малого числа ресурсов. Объекты и счетчики, описанные в разделе "Мониторинг производительности" позволяют определить, где возникла проблема, например в процессоре или ASP.NET. Для устранения узкого места необходимо выявить проблему и внести соответствующие изменения.

Проблемы редко возникают мгновенно; Обычно происходит постепенное снижение производительности, которое можно отслеживать при регулярном мониторинге с помощью средства мониторинга производительности или более сложной системы, например SCOM. Для обоих этих вариантов можно в разной степени внедрять решения в оповещение в виде текста рекомендаций или команд, заданных скриптами.

Если вы определили, что узкие места не появились из-за неправильной настройки, неэффективного пользовательского кода, стороннего решения или неэффективной реализации решения, возможно, чтобы устранить их, вам придется изменить конфигурацию оборудования или системы. Приведенные ниже таблицы содержат пороговые значения, указывающие на проблемы, и возможные способы устранения последних. В некоторых вариантах предлагается обновление или изменение оборудования.

Объекты и счетчики Проблема Варианты устранения
Процессор
Процессор — % загруженности процессора
Более 75–85 %
Обновить процессор.
Увеличить число процессоров.
Добавить дополнительные серверы.
Диск
Средняя длина очереди диска
Постепенное увеличение, система не находится в стабильном состоянии и выполняется резервное копирование очереди.
Увеличить число или скорость дисков.
Перейти к чередующейся конфигурации массива.
Переместить данные на альтернативный сервер.
% времени простоя
Менее 90 %
Увеличить число дисков.
Переместить данные на другой диск или сервер.
% свободного места
Менее 30 %
Увеличить число дисков.
Переместить данные на другой диск или сервер.
Память
Доступно МБ
Менее 2 ГБ на веб-сервере
Добавить память.
>[! ПРИМЕЧАНИЕ]> SQL Server объем доступной памяти по умолчанию будет низким и не всегда указывает на проблему.
Ошибок кэш-памяти/с
Больше 1
Добавить память.
По возможности увеличить размер и скорость кэша.
Переместить данные на другой диск или сервер.
Обмен страниц/с
Больше 10
Добавить память.
Файл подкачки
% использования и % использования (пик)
Страничный файл сервера, также известный как файл подкачки, содержит "виртуальные" адреса на диске. Ошибки страницы возникают, когда процесс нужно остановить и дождаться, пока необходимые "виртуальные" ресурсы будут скопированы с диска в память. Их будет больше, если объема физической памяти недостаточно.
Добавить память.
Сетевой адаптер
Всего байт/с
Более 40-50 % пропускной способности сети. Это скорость передачи и получения данных через сетевой адаптер.
Дальнейший анализ путем наблюдения за счетчиками "Получено байт/с" и "Отправлено байт/с".
Пересмотреть скорость сетевого адаптера.
Проверить число, размер и загрузку буферов памяти.
Процесс
Рабочий набор
Более 80 % от общего объема памяти
Добавить память.
% загруженности процессора
Более 75–85 %
Увеличить число процессоров.
Перераспределить нагрузку на дополнительные серверы.
ASP.NET
Перезапусков пула приложений
Несколько в день, что вызывает временные задержки
Убедиться, что перезапуск пула приложения в течение дня не вызван используемым настройками.
Запросов в очереди
Сотни или тысячи запросов в очереди
Реализовать дополнительные веб-серверы.
Максимальное значение по умолчанию для этого счетчика — 5 000, вы можете изменить его в файле Machine.config.
Время ожидания запроса
С увеличением числа событий ожидания пользователи будут замечать снижение производительности при отрисовке страниц
Реализовать дополнительные веб-серверы.
Отклонено запросов
Больше 0
Реализовать дополнительные веб-серверы.

См. также

Понятия

Тестирование производительности для SharePoint Server 2013

Планирование мощности для SharePoint Server 2013

Другие ресурсы

Capacity management and sizing overview for SharePoint Server 2013