Lync Server 2013 中的运行状况配置

 

上次修改的主题: 2012-10-22

在各种网站、Microsoft 知识库文章和 Lync Server 资源工具包工具之间,在运行 Lync Server 时遇到问题的管理员永远不会远离解决这些问题的方法。

显然,无法保证永远不会遇到 Lync Server 2013 的问题,因为 Lync Server 可能会受到产品本身无法控制的许多问题(如网络崩溃和硬件故障)的影响。 通过实施运行状况监视,管理员可以在问题变成实际问题之前识别潜在问题。 例如,管理员可以使用 Lync Server 监视来识别趋势和趋势。 例如,音频/视频会议数量的稳步增加可能表明需要在系统重载之前添加容量。

以类似的方式,管理员可以使用 System Center Operations Manager 执行此类操作,例如在发生指定事件时发出实时警报,以及运行主动测试系统的综合事务。 Lync Server 中使用综合事务来验证用户是否能够成功完成常见任务,例如登录到系统、交换即时消息或拨打位于公共交换电话网络 (PSTN) 的电话。 例如,定期运行这些测试可以提醒你注意用户登录 Lync Server 时遇到的潜在问题,并让你有机会在支持团队被无法建立连接的用户的呼叫淹没之前更正问题。 通过使用 System Center Operations Manager 运行这些综合事务,管理员可以每天连续监视 24 小时的 Lync Server 部署,而无需执行除响应任何可能发出的警报以外的任何操作。

注意

对于 Lync Server 2013,System Center Operations Manager 的管理包还能够检测可能对 Lync Server 产生不利影响的“外部”问题。 例如,如果 Internet Information Services (IIS) 脱机,Lync Server 计算机上的系统资源低于指定数量,或者 Lync Server 计算机遇到硬件故障,则可以通知管理员。

Lync Server 2013 中的运行状况配置是围绕 System Center Operations Manager 和 Lync Server 管理包的使用而构建的。 这些管理包包括许多新功能和增强功能,包括:

  • 任何位置的方案可用性。 Lync Server 2010 管理包引入了使用综合事务监视最终用户方案可用性的概念。 在 Lync Server 2013 中,这些代理具有更多综合事务,可以从企业内部的各种位置、企业外部的远程地理位置、分支机构设备和针对 Lync Server 2010 部署运行,以向旧版 Edge 部署添加覆盖范围。

  • 综合事务日志。 综合事务失败时,管理员有权访问 HTML 日志,以帮助确定失败内容。 这包括了解哪些操作失败、每个操作的延迟、用于运行测试的命令行以及遇到的错误。

  • 提高了呼叫可靠性覆盖范围。 Lync Server 2010 管理包引入了呼叫可靠性警报,以检测影响最终用户音频呼叫的严重连接问题。 Lync Server 2013 管理包添加了对等即时消息 (IM) 和其他基本会议功能的覆盖范围,以最大限度地提高覆盖范围,同时降低噪音。

  • 依赖项监视。 Lync Server 方案可能由于各种外部因素而失败,例如 IIS 脱机、CPU 和内存资源有限以及磁盘问题。 新的管理包检查多个关键依赖项,以确保管理员了解其影响。

  • 增强的报告。 一组报表,可帮助管理员估计方案可用性、规划容量,并查看哪些组件遇到的问题最多。

管理包还包括各种功能,可帮助检测和诊断,从而实时了解 Lync Server 部署的运行状况。 下表列出了这些功能。

管理包功能

功能 说明

综合事务

Windows PowerShell可从不同位置运行的 cmdlet,以确保最终用户方案(如登录、状态、IM 和会议)随时可供最终用户使用。

调用可靠性警报

CDR) (调用详细信息记录的数据库查询。 这些记录由前端服务器编写,以反映最终用户是否能够连接到呼叫或终止呼叫的原因。 这些查询会导致警报指示各种最终用户何时遇到对等呼叫或基本会议功能的连接问题。

媒体质量警报

查看体验质量的数据库查询 (QoE) 客户端在每次调用结束时发布的报表。 这些查询会导致警报能够精确定位用户在通话和会议期间可能遇到媒体质量不佳的情况。 数据基于关键指标(如数据包延迟和丢失)构建,这些指标已知直接有助于调用质量。

组件运行状况

单个服务器组件使用事件日志和性能计数器引发警报。 这些警报指示可能会严重影响一个或多个最终用户方案的失败条件。 这些警报还可以指示各种其他故障情况,包括未运行的服务、高故障率、高消息延迟或连接问题。

依赖项运行状况

由于各种外部原因,可能会发生故障。 管理包现在监视和收集某些关键外部依赖项的数据,这些依赖项可能指示严重问题,包括 IIS 可用性、服务器和进程的 CPU 和内存使用情况,以及磁盘指标。

系统发出的警报分为三个一般类别:

  • 高优先级警报。 这些警报指示会导致大量用户的服务中断的条件。 例如,单台计算机上的组件故障不是高优先级警报,因为 Lync Server 2013 具有内置的高可用性功能。 相反,高优先级警报表示问题严重到“晚上唤醒管理员”。 综合事务和脱机服务检测到的中断 (例如,音频/视频会议) 符合高优先级警报。

  • 中优先级警报。。 这些警报指示影响用户子集或指示呼叫质量下降的条件。 这包括组件故障、呼叫建立延迟或呼叫中音频质量下降等问题。 此类别中的警报是有状态的,并指示问题的当前状态。 例如,假设呼叫建立时间超过警报阈值。 如果呼叫建立时间恢复正常,则会在 System Center Operations Manager 中自动解析这些警报。 对这些警报的期望是管理员会在同一个工作日查看它们。

  • 其他警报。 这些警报来自可能影响特定用户或用户子集的组件。 例如,也许通讯簿服务无法分析给定用户的 Active Directory 条目。 对这些警报的期望是,管理员在有时间可用时会联系他们。