操作系统问题

 

发布时间: 2016年3月

适用对象:System Center 2012 R2 Operations Manager, System Center 2012 - Operations Manager, System Center 2012 SP1 - Operations Manager

本主题描述特定于 UNIX 和 Linux 操作系统的问题。

基于 Solaris 10 的服务器中出现不正确的共享资源报表

监视配置为使用区域的基于 Sun Solaris 10 的服务器时,Operations Manager 似乎会不正确地报告共享资源,如物理磁盘或网络适配器。 此行为的发生是故意的。

在配置为使用区域的基于 Solaris 10 的服务器上,Operations Manager 不区分共享资源,如物理磁盘或网络适配器。 对于共享全局区域资源的任何本地区域,Operations Manager 不报告共享资源。 在基于 Solaris 10 的每个服务器上仅监视每个资源的一个实例。 如果基于 Solaris 10 的服务器上存在两个网络适配器,一个适配器连接至全局区域,而另一个在两个本地区域之间共享,则第一个枚举的本地区域会报告共享资源。 第二个本地区域将没有共享资源的数据。

在 Operations Manager 中,部署在虚拟机中且基于 Solaris 10 的服务器的行为可能与部署在物理计算机上且基于 Solaris 10 的服务器的行为略微不同。 虚拟机中存在的每个网络适配器对基于 Solaris 10 的服务器显示为单独的物理资源。 如果将唯一定义的网络适配器连接到在基于 Solaris 的服务器上配置的每个区域,则 Operations Manager 会收集每个网络适配器的数据。

如果进程达到 Solaris 计算机的文件描述符限制,则代理提供程序可能会失败

在具有大量受监视对象(例如文件系统或处理器)的受监视 Solaris 计算机上,你可能会观察到 Solaris 代理的行为不可靠。 症状可能包括未能发现文件系统、磁盘或其他对象。 这可能是由于代理进程耗尽可用的文件描述符 (FD) 而造成的。

若要确定问题是否是由文件描述符限制所造成,请检查代理日志文件:/var/opt/microsoft/scx/log/scx.log。 如果日志中的任何错误消息包含文本:errno = 24 (Too many open files),则应怀疑是 FD 限制问题。

若要解决此问题,请执行下列步骤:

  1. 修改位于 /opt/microsoft/scx/bin/tools/scx-cimd(Solaris 10 或 Solaris 11)或 /etc/init.d/scx-cimd(Solaris 9)下的 scx-cimd 启动脚本。 查找具有以下行的脚本部分:

    start)
        # Start daemon
        echo "Starting $DESC"
        $DAEMON $OPTIONS -d
        exit $?
        ;;
    

    修改此部分,以在 $DAEMON $OPTIONS –d 行之前包含 ulimit –n 1024 命令,其中“1024”是文件描述符的新进程限制。

    start)
        # Start daemon
        echo "Starting $DESC"
        ulimit –n 1024
        $DAEMON $OPTIONS -d
        exit $?
        ;;
    
  2. 重新启动代理:

    scxadmin -restart
    
  3. 如果问题依然存在,请使用文件描述符限制 2048 再次尝试进行配置,然后重新启动代理。 如果在将文件描述符限制设置为 2048 后进程继续耗尽文件描述符,请与支持部门联系。