Supervisión del rendimiento de Lync Server 2013Monitoring Lync Server 2013 performance

 

Última modificación del tema: 2014-05-15Topic Last Modified: 2014-05-15

El rendimiento de Lync Server 2013 se ve afectado por diversos factores, como los perfiles de usuario, la arquitectura del sistema, el software, los componentes de hardware, los puntos de integración de terceros como puertas de enlace y equipos de telefonía, la conectividad y el rendimiento de la red, el rendimiento y la configuración del servicio Active Directory de Windows, además de la funcionalidad del sistema operativo Windows.Lync Server 2013 performance is affected by various factors such as user profiles, system architecture, software, hardware components, third-party integration points such as gateways and telephony equipment, network connectivity and performance, Windows Active Directory service configuration and performance in addition to the Windows operating system functionality.

En el centro del rendimiento de las implementaciones de Lync Server 2013 es el software y el hardware del servidor en el que se implementa.At the core of a Lync Server 2013 deployments’ performance is the server software and hardware it is implemented on. Por ejemplo, un servidor front-end debe tener suficientes recursos de hardware para hacer frente a la carga de usuarios prevista (a corto plazo).As an example, a front-end server must have sufficient hardware resources to cope with the expected (short-term) user load. Si se requiere un servidor front-end respectivo para proporcionar servicios a usuarios de 10000, un servidor configurado adecuadamente debe cumplir con los requisitos de carga esperados para poder garantizar la mejor experiencia posible del usuario final.If a respective front-end server is required to provide services to 10 thousand users, then an adequately configured server must meet the expected load requirements to ultimately help ensure the best possible end-user experience.

Por lo tanto, el rendimiento del servidor de supervisión es muy importante para evaluar si la infraestructura de servidor implementada tiene recursos de hardware adecuados para los requisitos de carga máxima cotidianos.Monitoring server performance is therefore extremely important to gauge whether the implemented server infrastructure have suitable hardware resources for the day-to-day peak-load requirements. El rendimiento del servidor de supervisión ayuda a identificar cuellos de botella del sistema, lo que permite a los administradores aplicar acciones correctivas antes de que la experiencia del usuario final se vea afectada.Monitoring server performance helps identify system bottlenecks allowing administrators to apply corrective action before the end-user experience is affected. Los datos de rendimiento deben usarse para la planeación de capacidad a largo plazo.The performance data should be used for long-term capacity planning.

Mientras que la información detallada de todos los objetos y contadores de rendimiento que deben tenerse en cuenta está vinculada a en la supervisión de Lync Server 2013 con System Center Operations Manager, algunos contadores de rendimiento que debe seguir pueden proporcionar a los administradores una vista rápida del rendimiento del sistema:While detailed information on all performance objects and counters to be observed is linked to in Monitoring Lync Server 2013 with System Center Operations Manager, some performance counters that you should follow can provide administrators a quick view of the system performance:

  • Para realizar un seguimiento del estado general del sistema del servidor front-end, un buen punto de partida es comprobar \ el procesador% de tiempo de procesador.To track overall system health of the front-end server, a good starting point is to check Processor\% Processor Time. El valor siempre debe ser inferior 80 por ciento.The value should always be below 80 percent.

  • Para realizar un seguimiento del rendimiento de la instancia de software back-end de base de datos de SQL Server utilizada por el grupo de servidores front-end, supervise los siguientes contadores de rendimiento:To track the performance of the back end SQL Server database software instance used by the Front End pool, monitor the following performance counters:

    LC: ServU – 00 – DBStore \ ServU – 002 – latencia en cola (MS)LC:USrv – 00 – DBStore\Usrv – 002 – Queue Latency (msec)

    LC: ServU-00 – DBStore \ ServU – 0 04 – latencia de SPROC (mseg)LC:USrv – 00 – DBStore\Usrv – 0 04– Sproc Latency (msec)

    El servidor en buen estado constante debería mostrar < 100 ms de latencia.The healthy server at steady state should show <100 ms latency values. El mecanismo de limitación se activará cuando la latencia alcance 12 segundos, lo que significa que el servidor front-end empieza a limitar las solicitudes al back-end.The throttling mechanism will engage when latency reaches 12 seconds, which means the front-end server starts throttling requests to the back end. Esto hace que los clientes se inicien recibiendo un mensaje de error de servidor de 503 muy ocupado.This causes clients to start to receive a 503 Server too busy error message.

  • Para realizar un seguimiento del tiempo de procesamiento en el servidor front-end, supervise el siguiente contador:To track the processing time at the front-end server, monitor the following counter:

    LC: SIP-07-Load Management \ SIP-000-tiempo medio de retención de mensajes entrantesLC:SIP - 07 - Load Management\SIP - 000 - Average Holding Time For Incoming Messages

    Este es otro mecanismo de limitación en los servidores front-end, esta vez que comienza cuando el tiempo de procesamiento en el front-end es alto.This is another throttling mechanism on the front-end servers, this time starting when the processing time on the front end is high. Si el tiempo medio de procesamiento es superior a seis segundos, el servidor entra en el modo de limitación y solo permite una transacción pendiente por conexión de cliente.If average processing time is more than six seconds, the server goes into throttling mode and only allows one outstanding transaction per client connection.

  • Para realizar un seguimiento de los problemas de memoria en el servidor Back-End SQL, supervise el siguiente contador:To track memory issues at SQL Back End Server, monitor the following counter:

    Esperanza de vida de página del administrador de búfer de SQL Server \SQL Server Buffer Manager\Page life expectancy

    Un valor bajo, por debajo de 3600 segundos (junto con latencia alta de escrituras/s y páginas de puntos/seg.) indica la presión de la memoria.A low value, below 3600 seconds (together with high latency writes/sec and checkpoint pages/sec) indicates memory pressure.

Contadores adicionales para verAdditional Counters to View

Hay varios contadores clave que son buenos indicadores del estado general del servidor front-end.There are several key counters that are good indicators of overall health from the front end server. Esta no es una lista exhaustiva y no está destinada a identificar la causa raíz.This is not a comprehensive list and is not meant to identify root cause. Estos contadores le permitirán realizar una comprobación rápida del estado del servidor.These counters will let you perform a quick check on your server health. Le recomendamos que compruebe estos contadores en cada uno de los servidores del grupo.We recommend verifying these counters on each of the servers in the pool. Es importante comprender cuáles son estos valores de contador cuando el servidor está en buen estado.It is important to understand what these counter values are when your server is healthy. Se necesita una línea base para comprender lo que ha cambiado cuando la experiencia del usuario se ha degradado.A baseline is required to understand what changed when the user experience is degraded.

El servidor front-end puede indicar problemas que pueden deberse a cuellos de botella en otra parte del sistema.The front-end server can indicate issues that may be caused by bottlenecks elsewhere in the system. Esto significa que es el mejor punto de partida al analizar el estado general del sistema.This means that it is the best place to start when looking at overall system health.

Los dos contadores adicionales que deben revisarse primero son los siguientes:Two additional counters to review first are as follows:

LC: ServU-00-DBStore \ ServU-002-latencia en cola (MS)LC:USrv-00-DBStore\Usrv-002-Queue Latency (msec)

LC: ServU-00-DBStore \ ServU-004-latencia de procedimiento almacenado (MS)LC:USrv-00-DBStore\Usrv-004-Sproc Latency (msec)

El contador de latencia de cola representa el tiempo que una solicitud de la cola dedica al back-end y la latencia del procedimiento almacenado representa el tiempo que tardó el back-end en procesar la solicitud.The queue latency counter represents the time that a request spent in the queue to the back end and the Sproc latency represents the time that it took for the back end to process the request. Si, por algún motivo, el disco, la memoria, la red y el procesador del back-end tienen problemas, el contador de latencia de cola será alto.If, for any reason, disk, memory, network, and processor on the back end are in trouble, the queue latency counter will be high.

También puede ser alto si hay una latencia de red alta entre el front-end y el back-end.It can also be high if there is high network latency between the front end and the back end. ¿Qué es una latencia de cola aceptable?So what is acceptable queue latency?

En 12 segundos, los servidores front-end comienzan a limitar las solicitudes a los servidores back-end.At 12 seconds, the Front End Servers start throttling requests to the Back End Servers. Esto significa que los servidores comienzan a devolver los errores Server Too busy – 503 a los clientes.This means the servers start returning Server too busy – 503 errors to the clients. Un servidor en buen estado debe tener menos de 100 milisegundos de latencias de cola de DBStore en estado estable, pero durante las horas en las que el servidor acaba de estar en línea y los usuarios están todos los inicios de sesión al mismo tiempo, dicho contador puede ser muy alto e incluso puede verse en varios segundos.A healthy server should have less than 100 msec DBStore queue latencies at steady state, but during times where the server has just come online and users are all logging in at the same time, that counter can be very high and you may even see it hit multiple seconds.

Puede tener una configuración de carga equilibrada, en la que tiene un grupo de servidores implementado con varios servidores front-end y un equilibrador de carga configurado para "número mínimo de conexiones".You may have a load-balanced configuration, where you have a pool deployed with multiple front-end servers and a load balancer that is configured for "least number of connections." En este caso, si se reinicia un servidor front-end, todos los usuarios que intenten la reconexión recibirán la señal al servidor reiniciado, porque ese servidor tendrá menos conexiones en comparación con los demás miembros del grupo.In this case, if one front-end server is restarted, then all users who attempt to reconnect will be pointed to the restarted server, because that server will have fewer connections compared to the other pool members. Durante este tiempo, el servidor front-end respectivo puede estar sobrecargado mientras que los demás miembros del grupo no lo están.During this time, the respective front-end server may be overloaded while the other pool members are not.

Le recomendamos que realice el mantenimiento fuera del horario de trabajo para reducir el impacto en el rendimiento, ya que los usuarios no estarán compitiendo en la conexión con el servidor al mismo tiempo.We recommend that you perform maintenance during off-hours to reduce the performance affect as users will not all be competing to connect to the server at the same time.

Si los dos contadores de rendimiento anteriores son altos, el cuello de botella más probable es el servidor back-end de SQL.If the previous two performance counters are high, the most likely bottleneck is the SQL Back End Server. Los siguientes componentes que se deben confirmar son los siguientes:The next components to confirm are as follows:

  • ¿Es demasiado alta la CPU de SQL Server?Is the SQL Server CPU too high? Por ejemplo, ¿es superior al 80 por ciento?For example, is it greater than 80 percent?

  • ¿La latencia de disco es alta?Is the disk latency high?

En un mundo ideal, tiene suficiente memoria RAM para tener las bases de datos RTC y RTCDYN en la memoria.In an ideal world, you have enough RAM to have both the RTC and RTCDYN databases in memory. A continuación, la única razón por la que el servidor tendría acceso al disco es escribir en los archivos de registro y vaciar a las bases de datos.Then, the only reason the server would be accessing the disk, is to write to the log files and flush to the databases. Las pruebas han demostrado que 12 GB de RAM son suficientes para las implementaciones de 100.000 usuarios.Tests have shown that 12 GB of RAM is sufficient for 100 thousand user deployments. Se supone que el tamaño total de las bases de datos RTC y RTCDYN es inferior a 12 GB.This assumes that the RTC and RTCDYN databases size totals less than 12 GB. Si las bases de datos son más grandes, puede que necesite más memoria.If your databases are larger than that, then you may need additional memory.

Puede determinar si SQL Server requiere RAM adicional mediante la revisión del contador de rendimiento esperanza de vida de la página del administrador de búfer de SQL Server.You can determine whether your SQL Server requires additional RAM by reviewing the SQL Server Buffer Manager page life expectancy performance counter. Un valor inferior a 3.600 indica presión de memoria.A value less than 3,600 indicates memory pressure. También debería ver pocas o ninguna lecturas en la unidad de la base de datos si tiene suficiente memoria porque SQL Server solo debe escribir en la base de datos.You should also see little to no reads on your database drive if you have sufficient memory because SQL Server should only be writing to the database.

Hay un mecanismo de limitación adicional en un servidor front-end de Lync Server 2013 que se inicia si el tiempo de procesamiento del servidor es alto.There is an additional throttling mechanism in a Lync Server 2013 Front End Server that starts if the server processing time is high. La limitación de latencia de DBStore solo está habilitada si la latencia para SQL Server es alta.The DBStore latency throttling is only enabled if the latency to the SQL Server is high. Un ejemplo en el que esta limitación está habilitada se encuentra en el caso de que el servidor front-end esté enlazado a la CPU.One example in which such throttling is enabled is if the front-end server is CPU-bound.

Si el tiempo medio de procesamiento (LC: SIP-07-Load Management \ SIP-000-promedio de tiempo de retención de mensajes entrantes) en el servidor supera los seis segundos, el servidor entrará en el modo de limitación y solo dará a los usuarios una transacción pendiente por conexión de cliente.If the average processing time (LC:SIP-07-Load Management\SIP-000-Average Holding Time For Incoming Messages) on the server exceeds six seconds, then the server goes into throttling mode and only gives users one outstanding transaction per client connection. Una vez que el tiempo de procesamiento cae en tres segundos, el servidor sale del modo de limitación de peticiones y proporciona a los usuarios hasta 20 transacciones pendientes por conexión de cliente.Once the processing time drops to three seconds, then the server drops out of throttling mode and gives users up to 20 outstanding transactions per client connection. Siempre que el número de transacciones en una conexión específica supera el umbral anterior, la conexión se marca como controlado por flujo.Whenever the number of transactions on a specific connection exceeds the threshold above, the connection is marked as flow controlled. El resultado es que el servidor no envía ningún recepción a él y se incrementa el contador de ** \ conexiones controladas por flujo SIP-01-Peers** .The result is the server does not post any receives on it, and the LC:SIP-01-Peers\Flow Controlled Connections counter is incremented. Si una conexión permanece en un Estado controlado por flujo durante más de un minuto, el servidor la cierra.If a connection stays in a flow-controlled state for more than one minute, then the server closes it. Lo hace de forma diferida.It does so lazily. Cuando tiene una oportunidad para comprobar la conexión, determina si se ha limitado durante demasiado tiempo y la cierra si tiene más de un minuto.When it has an opportunity to check the connection, it determines whether it was throttled for too long and closes it if it has more than one minute.

Estos son los dos mecanismos de limitación de peticiones y hay un contador de rendimiento que resume qué es lo que, en caso de existir, está realizando una limitación del servidor.These are the two throttling mechanisms and there is one performance counter that summarizes what, if any, throttling the server is performing.

LC: SIP-04-Responses \ SIP-053-Local 503 respuestas/segLC:SIP-04-Responses\SIP-053-Local 503 Responses/sec

  • El término "local" del contador anterior hace referencia a respuestas generadas localmente.The term "Local" in the previous counter refers to locally generated responses.

  • El código 503 corresponde al servidor no disponible, en el que no se deben ver los códigos 503 en un servidor en buen estado.The 503 code corresponds to server unavailable—where you should not see any 503 codes on a healthy server. Durante el período en el que se acaba de poner en línea un servidor, es posible que vea algunos códigos de 503.During the period after a server is just brought online, you may see some 503 codes. Cuando todos los usuarios vuelven a iniciar sesión y el servidor vuelve a un estado estable, no deberían existir códigos 503 adicionales.When all of the users sign back in and the server returns to a stable state, there should no additional 503 codes.

LC: SIP-04-Responses \ SIP-074-Local 504 respuestas/segLC:SIP-04-Responses\SIP-074-Local 504 Responses/sec

Este contador de rendimiento indica problemas de conectividad con otros servidores y puede indicar errores de conexión o de retrasos en la conexión.This performance counter indicates connectivity issues with other servers and it can indicate failures to connect or delays in connecting. Si ve 504 errores, se debe comprobar el siguiente contador de rendimiento.If you are seeing 504 errors then the following performance counter should be checked.

LC: SIP-01-Peers \ SIP-017-envíos pendientesLC:SIP-01-Peers\SIP-017-Sends Outstanding

Este contador indica el número de solicitudes y respuestas salientes en cola.This counter indicates the number of outgoing queued requests and responses. Si este contador es alto, lo más probable es que el problema no esté en el servidor local.If this counter is high then the issue is most likely not on the local server. Tenga en cuenta que este contador puede ser alto si hay problemas de latencia de red.Note that this counter can be high if there are network latency issues. También podría indicar problemas con el adaptador de red local, pero es más probable que se deba a un problema en un servidor remoto.It could also indicate issues with the local network adapter, but is more likely caused by an issue on a remote server. Es muy probable que este contador sea alto en un servidor Director cuando el grupo con el que está intentando comunicarse está sobrecargado.This counter would most likely be high on a Director server when the pool it is trying to communicate with is overloaded. La clave con este contador es mirar las instancias, no solo el total.The key with this counter is to look at the instances, not just the total.