规划在 SharePoint 服务器监视

适用于:yes-img-132013 yes-img-162016 yes-img-192019 yes-img-seSubscription Edition no-img-sopSharePoint in Microsoft 365

为了确保 SharePoint Server 顺利运行,IT 专业人员必须密切监视场、服务器、应用程序、服务和性能。 您应定期执行预防性维护以防止出现问题,并在出现问题时创建最大程度降低损坏的计划。

Microsoft 提供了许多工具,可帮助你监视 SharePoint Server 环境的整体运行状况。 如果出现任何问题,可以找到大量资源,并使用监视工具来分析日志、确定原因,然后采取正确的操作来解决问题。

还需要计划要监视 SharePoint Server 环境的人数。 然后创建响应计划,以涵盖出现问题时应执行的操作。

监视工具概述

有许多工具可用于监视 SharePoint Server 和排查问题。 每个工具涵盖 SharePoint 环境的不同部分,某些工具可能会重叠区域。 考虑哪些工具可以最大化监视操作。 下列监视工具可用:

  • SharePoint 运行状况分析器

    在管理中心主页上,单击"监视"、"运行状况分析器"。 您可使用此内置功能分析和解决下列区域中的问题:安全性、性能、配置和可用性。 运行状况分析器规则是预定义的,按计划的间隔(如每小时、每天、每周和每月)运行。 如果检测到错误,则将触发对应的规则。 每个规则都有关于错误发生原因的简要说明,并提供了指向包含解决问题的分步帮助的详细文章的链接。 按照帮助过程进行操作时,可以重新运行规则来验证解决方案。 如果错误未在列表中显示,则表示问题已得到解决。

  • 计时器作业

    在管理中心主页上,单击"监视"、"计时器作业"。 SharePoint Server 使用可配置的计时器作业收集运行状况数据,然后将数据写入日志记录文件夹和日志记录数据库。 之后在报告中使用数据以显示场中服务器的运行状况状态。

    您可重新计划计时器作业、启用或禁用它以及按需运行它。 每天、每周和每月计划还包含一个执行时段。 计时器服务将随机选择此间隔中的时间开始在每台适用服务器上运行计时器作业。 此功能适用于在服务器场的多台服务器上运行的高负载作业。

    注意

    同时在服务器场中的所有服务器上运行计时器作业会影响系统性能。 应仔细规划计时器作业,以避免与其他计时器作业重叠。

  • Reporting

    在管理中心主页上,单击"监视"、"报告"。 利用此功能,您可配置诊断日志记录和数据收集,并且可查看管理和运行状况报告。 由于一些配置将耗尽磁盘空间并对系统性能产生不利影响,因此您必须仔细规划要设置的配置。

  • Microsoft PowerShell

    PowerShell 是用于监视 SharePoint Server 的强大工具。 您可运行命令获取要查看的准确日志。 有关详细信息,请参阅 在 SharePoint Server 中查看诊断日志

  • System Center - Operations Manager 和 System Center Management Pack for SharePoint Server

    System Center - Operations Manager 是一个功能强大的监视平台,可用于在单个控制台中监视许多计算机的服务、设备和操作。 通过使用 Operations Manager,可查看状态、运行状况、性能信息以及针对可用性、性能、配置和安全性生成的警报。 有关详细信息,请参阅 Operations Manager

    若要使用 Operations Manager 监视 SharePoint Server,必须安装适用于 SharePoint Server 的 System Center 管理包。 可使用此工具监视事件、在一个中央位置收集特定于 SharePoint 组件的性能计数器以及根据需要引发操作人员干预警报。 下载并安装 System Center Management Pack for SharePoint Server 2016

  • 事件查看器

    事件查看器是一个 Microsoft 管理控制台 (MMC) 管理单元。 通过它,可以浏览和管理事件日志。 它是一个非常方便的问题排查工具。 可筛选多个日志中的特定事件,并将有用的事件筛选器作为自定义视图重复使用。 有关详细信息,请参阅 事件查看器

  • SharePoint 开发人员仪表板

    此工具提供可帮助开发人员或系统管理员分析 SharePoint 网页性能的诊断信息。 此实用工具可在页面加载缓慢、某个 Web 部件未执行或对页面的数据库查询未执行时起到帮助作用。 SharePoint 开发人员仪表板默认情况下是禁用的。 可以使用 PowerShell 启用它。 有关详细信息,请参阅 SharePoint 开发人员仪表板

  • Windows Management Instrumentation (WMI)

    WMI 提供了许多类来监视 SharePoint Server 环境。 对于每个可管理资源,均存在一个对应的 WMI 类。 有关详细信息,请参阅 Windows Management Instrumentation (WMI) 概述

  • SQL Server Reporting Services (SSRS)

    SQL Server Reporting Services 提供了各种现成可用的工具和服务,帮助你为组织创建、部署和管理报告。 它还提供编程功能,方便你扩展和自定义报告功能。 使用 SQL Server Reporting Services,可根据基于 XML 的多维关系数据源生成交互式报告、表格报告、图形报告或自由格式报告。 可按需发布报告、安排报告处理或查看报告。 可使用 SQL Server Reporting Services 根据预定义模型生成报告,还可交互式地浏览模型中的数据。 可从大量查看格式中进行选择,并能将报告导出到其他应用程序中,以及订阅已发布的报告。 创建的报告可通过基于 Web 的连接或作为 Windows 应用程序或 SharePoint 网站的一部分进行查看。 有关详细信息,请参阅 Reporting Services (SSRS)

SharePoint 运行状况分析器、计时器作业、报告和 PowerShell 是内置功能,而 System Center、System Center Management Pack for SharePoint Server 2016 和 SQL Server Reporting Services 是独立的工具。 SharePoint 开发人员仪表板和 WMI 都是内置工具,是为开发人员和系统管理员准备的。 这些工具相互补充,适用于不同的方案。

下表显示的是这些工具的汇总。 您在确定要用于特定方案的工具时必须权衡监视工具的优缺点。

监视工具汇总

工具 可选或内置 所需的技能级别 优点 缺点 资源
SharePoint 运行状况分析程序 内置 基本 提供解决问题的逐步说明。
可自定义。 如果您不需要它们,可禁用一些规则。
不会监视所有可能的问题。
出现问题后,仅触发一条规则。
在 SharePoint Server 中配置 SharePoint 运行状况分析器规则
在 SharePoint Server 中查看和解决 SharePoint 运行状况分析器警报
SharePoint Server 2016 的 SharePoint 运行状况分析器规则参考
计时器作业 内置 高级:您必须考虑启用或禁用计时器作业和更改计划之间的关系。 各种监视项。
重新计划简单。
可自定义。 您可创建新的计时器作业满足您的特定需求。
会影响系统性能,并且会相互冲突。 在 SharePoint Server 2016 中配置 SharePoint 运行状况分析器计时器作业
SharePoint Server 的计时器作业参考
Reporting 内置 查看技能级别:基本 灵活。 使您可配置要记录的事件的安全性、启用事件日志淹没保护和配置跟踪日志。 仅显示管理和运行状况统计信息,没有任何建议的解决方案。
您必须解释日志记录数据。
会影响性能和磁盘使用率。
在 SharePoint Server 2016 中查看报告和日志
PowerShell 内置 高级:必须知道要查找的内容,并且必须运行 PowerShell 命令。 筛选数据,以各种方式显示数据,并将数据输出到网格,你可以使用网格对数据进行筛选、排序、分组和导出到Excel 2016。 必须知道要运行哪些 PowerShell 命令。 在 SharePoint Server 中查看诊断日志
System Center with System Center Management Pack for SharePoint Server 可选,但建议 高级:您需要知道查找内容和如何解释数据。 该工具可以检测、诊断和提醒你有关软件和硬件事件,并参考知识文章。 它通过监视关键方案在人员较少的情况下执行更多监视。 需要部署其他服务器。 SharePoint Server 2016 的 System Center 管理包
事件查看器 内置 基本 您可查看多个事件日志中的事件、将有用的事件筛选器另存为可重复使用的自定义视图、安排任务运行以响应事件以及创建和管理事件订阅。 不会建议解决方案。 事件查看器
SharePoint 开发人员仪表板 内置 高级:您必须知道查找内容和如何解释数据。 分析 SharePoint 页的性能简单。 限制为监视 SharePoint 页的性能。 SharePoint 开发人员仪表板
Windows Management Instrumentation (WMI) 内置 高级:您必须知道查找内容和如何编写针对托管对象的 WMI 脚本。 可监视、跟踪和控制与软件应用程序、硬件组件和网络相关的系统事件。 您必须标识要监视的托管对象。
您必须编写 WMI 脚本。
Windows Management Instrumentation (WMI) 概述
SQL Server Reporting Services 可选,但建议。 高级:您必须设计和管理报告。 用于创建和管理报告的综合性平台。 创建和开发解决方案需要高级技能。 您必须了解 PerformancePoint 仪表板设计器和 Visual Studio。 Reporting Services (SSRS)

对于所含服务器少于 10 台的 SharePoint 场,建议您至少安装下列独立工具:

  • 带有 适用于 SharePoint Server 2013 的 System Center 管理包的 System Center 2012 - Operations Manager

    监视 SharePoint 产品的运行状况状态。

  • SQL Server Reporting Services

    如果使用 Reporting Services 查看报告定义语言 (RDL) 文件则请部署它,并通过 Visual Studio 和 PerformancePoint 仪表板设计器设计报告。

标识监视方案

标识要监视的方案 — 例如,运行状况、工作流、搜索、SQL Server、虚拟环境和性能。 下表显示的是一些关键方案以及可用于监视这些方案的监视工具。

方案和监视工具

工具\方案 运行状况 搜索 Databases 性能 工作流 虚拟环境 Business Data Connectivity 商业智能 Access Services 服务器场 服务器 服务应用程序 Web 应用程序
SharePoint 运行状况分析程序 X X X
计时器作业 X X X X X
报告 X X
PowerShell X
System Center with System Center Management Pack for SharePoint Server X X
事件查看器 X
SharePoint 开发人员仪表板 X X X √* X X X X X X X X X
Windows Management Instrumentation (WMI) X √** X X X X X
SQL Server Reporting Services X

注意:

*:SharePoint 开发人员仪表板仅监视网页的性能。

**:WMI 接口可以管理 Hyper-V 服务。

确定每日、每周和每月监视项

可以决定每天监视哪些项, 每周和每月基于第 45) 页 (“每日任务”部分,第 53) 页上 (“每周任务”部分,第 54) 页上 (“每月任务”部分, sharePoint Server 2013: Operations Framework and Checklists白皮书的第 54) 页上 (“临时任务”部分。

注意

虽然本白皮书涉及 SharePoint 2013,但你仍可以使用此信息来帮助规划 SharePoint Server 的监视计划。

计划监视人员

您必须估计需要多少人才能监视 SharePoint Server 环境。 根据 SharePoint 环境的大小,您可分配专门的人员监视 SharePoint 环境。 对于非常大的企业场,可能需要一两个人专用于每个场。

计划监视人员时,请考虑下列方面:

  • 小服务器场(小型基本用户或业务线 (LOB) 应用程序)

  • 中等服务器场(企业、服务应用程序等)

  • 大型企业服务器场(大型企业、多个服务应用程序、自行设置等)

  • 高可用性要求(服务级别协议)(SLA)

  • 高性能要求(页面呈现时间)

  • 基本用户大小(唯一用户数)

  • 并发用户(同时主动点击门户的用户数)

  • 每秒请求数(还包括高峰时段每秒的请求数)

  • 操作成熟度

  • 管理工具

下表显示的是根据服务器的数量监视 SharePoint 环境所需的不同技能级别的大概人数。 请注意,此表仅提供大致的估计。

所需的监视人员

服务器数量 所需的人员 所需的技能级别
1~4 1 基本
4~10 1~2 高级
10~40 3~4 基本和高级
40~100 5+ 基本和高级
100+ 10+ 基本和高级

创建响应计划

建议创建响应计划,以帮助为潜在问题做好准备,并指定出现问题时要执行的操作。

响应计划应排除已提供切实可行的解决方案的 SharePoint 运行状况分析器规则。 对于没有即时解决方案的问题,您必须使用事件查看器等监视工具研究日志以找出解决方案。

下表显示的是开发响应计划时应考虑的一些因素。

响应计划中建议的项

项目 说明
通知/事件/问题 原义消息、原义事件或问题的说明。
受影响服务/应用程序 将受问题影响的服务或应用程序。
症状 问题的症状。
严重性 问题的严重性。 高严重性问题必须具有高优先级。
必须解决问题(分钟或小时) 可接受的服务经过时间。
可能的原因 问题的可能原因。
解决方案 问题的解决方案。
联系人 此问题出现时应与之联系的人。
呈报 如果解决方案未成功解决问题应与之联系的人或团队。
相关资源 有助于解决问题的任何资源,例如 Microsoft Learn for SharePoint Server 上的文章。
注意 您要突出显示的任何问题。

另请参阅

概念

SharePoint Server 2016 中的监控概述

监视 SharePoint Server 中的 SharePoint 相关应用程序

存储和 SQL Server 容量规划与配置 (SharePoint Server)

在 SharePoint Server 2016 中监控缓存性能

其他资源

Microsoft 网络监视器