Lync Server 2013 中的关键运行状况指标

 

上次修改的主题: 2014-02-10

本文是 关键运行状况指标:维护健康 Lync Server 基础海报的 配套内容,可从下载中心下载。

描述使用 KHI 数据进行故障排除

可以使用此海报了解关键运行状况指标 (KHI) ,即具有阈值的性能计数器,旨在揭示用户体验问题。 收集 KHI 数据通常是实现调用质量方法 (CQM) 的第一步,该方法侧重于确保 Lync 用户获得高质量的音频体验。

如果对如何使用 CQM 有疑问,可以向 cqmfeedback@microsoft.com其提交问题。

海报说明了以下方面:

  • 什么是关键运行状况指标?

  • 收集 KHI 数据

  • 所有服务器角色的修正流

  • 词汇

  • 前端服务器

  • 后端 SQL Server

  • 中介服务器

  • 边缘服务器

什么是关键运行状况指标?

关键运行状况指标是性能计数器,其阈值旨在揭示用户体验问题。 收集 KHI 数据通常是实现调用质量方法 (CQM) 的第一步,该方法侧重于确保 Lync 用户获得高质量的音频体验。

除了标准 Lync 监视解决方案 ((例如 System Center Operations Manager、综合事务、监视服务器) 而不是这些解决方案)之外,还使用 KHI。

收集 KHI 性能计数器,并填充网络指南附带的 KHI 电子表格,以生成一个记分卡,帮助你确定 Lync 部署的服务器运行状况。 填充后,它将指导你修复环境,并为其他利益干系人提供更多见解。 每月评估 KHI,并将其合并到任何部署正在进行的操作流程中。

下载 Lync Server 网络指南 ,查看 KHI 的完整列表并获取相关电子表格。

收集 KHI 数据

  1. 运行每个 Lync Server 上的 Lync Server 网络指南中包含的 KHI 脚本。 这将在性能监视器中创建一个数据收集器,并将其命名为 KHI。 默认情况下,每 15 秒轮询一次数据。

  2. 在公司营业日开始前,转到每个 Lync Server 并启动 KHI 数据收集器。

  3. 在当天结束时,停止 KHI 数据收集器并将数据复制到中心位置。

  4. 使用性能监视器填写 Lync Server 网络指南下载中包含的 KHI 电子表格后,将结果与建议的目标进行比较。

所有服务器角色的修正流

对于 Lync 实现中的每个服务器,首先验证服务器的组件运行状况和系统性能是否达到或高于所需的级别。 之后,才应查看与服务器在整个 Lync 实现中的角色相关的指示器。

首先收集所有服务器的 KHI 性能数据。 对于本文档后面讨论的每个系统角色 (详细信息) 确定基本系统组件是否满足建议的目标。 如果不这样做,请修正系统性能,然后重新收集 KHI 数据并确保系统运行状况,然后再查看特定于服务器在 Lync 实现中的角色的指标。 所有角色的组件运行状况定义为:

  • CPU 利用率 < 80%

  • Avg. 磁盘写入 < 10 毫秒

  • Avg. 磁盘读取 < 10 毫秒

  • 可用内存 >20% 系统总 MB

  • 网络队列长度 < 2

  • 已丢弃的数据包 (入/出) = 0

词汇

此海报中使用了以下术语和首字母缩略词:

AS MCU = 应用程序共享多点控制单元

AV MCU = 音频/视频 MCU

IM MCU = 即时消息 MCU

UCWA = 统一通信 Web API

AV Edge = 通过边缘遍历音频/视频

AV 身份验证 = 音频/视频身份验证

SIP Stack = 包含 Lync 的核心 SIP 实现

数据代理 = 用于边缘会议

LySS = Lync 存储服务

前端服务器

除了基本组件运行状况外,以下建议的 KHI 目标还特定于前端服务器:

功能区域 目标指标

AS/AV/IM MCU

MCU 运行状况状态 <2

Web 组件

分发列表扩展 AD 超时 <0

ABWQ 失败 = 0

LIS 失败 = 0

身份验证错误 < 1/秒

ASP.NET v4 请求被拒绝 = 0

SIP Stack

Avg. 传入消息处理 < 1 秒

传入响应下降 < 1/秒传入请求下降 < 1/秒

队列延迟 < 100 毫秒

Sproc 延迟 < 100 毫秒

受限制的请求 = 0

身份验证错误 < 1/秒

传入消息超 < 时 2

Avg. 传入消息保留 < 1 秒

流控制连接 < 2

Avg. Out Queue Delay < 2 sec

LySS

存储服务 DB < 80 所用空间的百分比

副本复制失败 # = 0

数据丢失事件 # = 0

Sql

页面预期寿命为 > 300 秒。

批处理请求 /秒 < 2500

后端 SQL Server

除了基本组件运行状况外,以下建议的 KHI 目标还特定于 SQL 服务器:

功能区域 目标指标

Sql

页面预期寿命为 > 300 秒。

批处理请求 /秒 < 2500

中介服务器

除了基本组件运行状况外,以下建议的 KHI 目标还特定于中介服务器:

功能区域 目标指标

中介服务器服务

负载呼叫失败索引 = 0

代理 <10 导致的呼叫失败

网关 <10 导致的呼叫失败

调用 () 拒绝 = 0

缺少媒体候选人 = 0

媒体连接检查失败 = 0

边缘服务器

除了基本组件运行状况外,以下建议的 KHI 目标还特定于边缘服务器:

功能区域 目标指标

AV 身份验证

错误请求 < 20/秒

AV Edge

身份验证。失败 <20/秒

分配失败 <20/秒

数据包下降 <300/秒

数据代理

受限制的服务器连接 < 3

系统正在限制 <1

SIP Stack

超过限制的连接已下降 < 1

发送超 <时 10

流控制连接 <100

传入请求下降 < 1/秒

Avg. 消息处理 < 3 秒