Surveillance des performances de Lync Server 2013Monitoring Lync Server 2013 performance

 

Dernière modification de la rubrique : 2014-05-15Topic Last Modified: 2014-05-15

Les performances de Lync Server 2013 sont affectées par différents facteurs, tels que les profils utilisateur, l’architecture système, les logiciels, les composants matériels, les points d’intégration tiers tels que les passerelles et les équipements téléphoniques, la connectivité réseau et les performances, la configuration et les performances du service Windows Active Directory en plus des fonctionnalités du système d’exploitation Windows.Lync Server 2013 performance is affected by various factors such as user profiles, system architecture, software, hardware components, third-party integration points such as gateways and telephony equipment, network connectivity and performance, Windows Active Directory service configuration and performance in addition to the Windows operating system functionality.

Les performances des déploiements Lync Server 2013 sont au cœur des logiciels et du matériel de serveur sur lesquels ils sont implémentés.At the core of a Lync Server 2013 deployments’ performance is the server software and hardware it is implemented on. Par exemple, un serveur frontal doit disposer de ressources matérielles suffisantes pour prendre en charge la charge utilisateur attendue (à court terme).As an example, a front-end server must have sufficient hardware resources to cope with the expected (short-term) user load. Si un serveur frontal respectif est requis pour fournir des services aux utilisateurs de 10000, un serveur correctement configuré doit répondre aux exigences de charge attendues afin d’assurer la meilleure expérience possible de l’utilisateur final.If a respective front-end server is required to provide services to 10 thousand users, then an adequately configured server must meet the expected load requirements to ultimately help ensure the best possible end-user experience.

La surveillance des performances du serveur est donc extrêmement importante pour déterminer si l’infrastructure de serveur implémentée a des ressources matérielles appropriées pour les besoins de charge maximale quotidienne.Monitoring server performance is therefore extremely important to gauge whether the implemented server infrastructure have suitable hardware resources for the day-to-day peak-load requirements. La surveillance des performances du serveur permet d’identifier les goulets d’étranglement du système permettant aux administrateurs d’appliquer des mesures correctives avant que l’expérience de l’utilisateur final ne soit affectée.Monitoring server performance helps identify system bottlenecks allowing administrators to apply corrective action before the end-user experience is affected. Les données de performances doivent être utilisées pour la planification de la capacité à long terme.The performance data should be used for long-term capacity planning.

Bien que des informations détaillées sur tous les objets et compteurs de performance à observer soient liées à la surveillance de Lync Server 2013 avec System Center Operations Manager, certains compteurs de performance que vous devez suivre peuvent fournir aux administrateurs un aperçu rapide des performances du système :While detailed information on all performance objects and counters to be observed is linked to in Monitoring Lync Server 2013 with System Center Operations Manager, some performance counters that you should follow can provide administrators a quick view of the system performance:

  • Pour suivre l’intégrité globale du système du serveur frontal, un bon point de départ est de vérifier le processeur \ % temps processeur.To track overall system health of the front-end server, a good starting point is to check Processor\% Processor Time. La valeur doit toujours être inférieure à 80%.The value should always be below 80 percent.

  • Pour suivre les performances de l’instance du logiciel de base de données SQL Server principale utilisée par le pool frontal, surveillez les compteurs de performance suivants :To track the performance of the back end SQL Server database software instance used by the Front End pool, monitor the following performance counters:

    LC : USrv-00 – DBStore \ USrv – 002 – latence de la file d’attente (MS)LC:USrv – 00 – DBStore\Usrv – 002 – Queue Latency (msec)

    LC : USrv – 00 – DBStore \ USrv – 0 04 – latence de la sproc (MS)LC:USrv – 00 – DBStore\Usrv – 0 04– Sproc Latency (msec)

    Le serveur sain à l’état stable doit afficher les < valeurs de latence 100 ms.The healthy server at steady state should show <100 ms latency values. Le mécanisme de limitation s’engage lorsque la latence atteint 12 secondes, ce qui signifie que le serveur frontal commence à limiter les demandes vers le système principal.The throttling mechanism will engage when latency reaches 12 seconds, which means the front-end server starts throttling requests to the back end. Ainsi, les clients commencent à recevoir un message d’erreur du serveur 503.This causes clients to start to receive a 503 Server too busy error message.

  • Pour effectuer le suivi du temps de traitement sur le serveur frontal, surveillez le compteur suivant :To track the processing time at the front-end server, monitor the following counter:

    LC : SIP-07-charger la gestion \ SIP-000-Durée moyenne de participation pour les messages entrantsLC:SIP - 07 - Load Management\SIP - 000 - Average Holding Time For Incoming Messages

    Il s’agit d’un autre mécanisme de limitation sur les serveurs frontaux, cette fois à partir du moment où le temps de traitement sur le serveur frontal est élevé.This is another throttling mechanism on the front-end servers, this time starting when the processing time on the front end is high. Si le temps de traitement moyen est supérieur à six secondes, le serveur passe en mode de limitation et n’autorise qu’une seule transaction en attente par connexion client.If average processing time is more than six seconds, the server goes into throttling mode and only allows one outstanding transaction per client connection.

  • Pour effectuer le suivi des problèmes de mémoire sur le serveur principal SQL, surveillez le compteur suivant :To track memory issues at SQL Back End Server, monitor the following counter:

    Espérance de vie de la page du gestionnaire de tampons SQL Server \SQL Server Buffer Manager\Page life expectancy

    Une valeur faible, inférieure à 3600 secondes (avec une latence élevée des écritures/s et des pages de point de contrôle/s) indique la pression de la mémoire.A low value, below 3600 seconds (together with high latency writes/sec and checkpoint pages/sec) indicates memory pressure.

Compteurs supplémentaires à afficherAdditional Counters to View

Il existe plusieurs compteurs clés qui sont de bonnes indicateurs d’intégrité globale à partir du serveur frontal.There are several key counters that are good indicators of overall health from the front end server. Il ne s’agit pas d’une liste complète et n’est pas destinée à identifier la cause principale.This is not a comprehensive list and is not meant to identify root cause. Ces compteurs vous permettront d’effectuer une vérification rapide de l’intégrité de votre serveur.These counters will let you perform a quick check on your server health. Nous vous recommandons de vérifier ces compteurs sur chacun des serveurs du pool.We recommend verifying these counters on each of the servers in the pool. Il est important de comprendre ce que sont ces valeurs de compteur lorsque votre serveur est intègre.It is important to understand what these counter values are when your server is healthy. Une configuration de référence doit être utilisée pour comprendre ce qui a changé lorsque l’expérience utilisateur est dégradée.A baseline is required to understand what changed when the user experience is degraded.

Le serveur frontal peut indiquer des problèmes qui peuvent être causés par des goulots d’étranglement ailleurs dans le système.The front-end server can indicate issues that may be caused by bottlenecks elsewhere in the system. Cela signifie qu’il s’agit de l’endroit le plus approprié pour commencer à examiner l’état général du système.This means that it is the best place to start when looking at overall system health.

Deux compteurs supplémentaires à examiner en premier sont les suivants :Two additional counters to review first are as follows:

LC : USrv-00-DBStore \ USrv-002-latence de la file d’attente (MS)LC:USrv-00-DBStore\Usrv-002-Queue Latency (msec)

LC : USrv-00-DBStore \ USrv-004-latence de la sproc (MS)LC:USrv-00-DBStore\Usrv-004-Sproc Latency (msec)

Le compteur de latence de file d’attente représente le temps passé par une demande dans la file d’attente et la latence de la sproc représente le temps nécessaire pour que le serveur principal traite la demande.The queue latency counter represents the time that a request spent in the queue to the back end and the Sproc latency represents the time that it took for the back end to process the request. Si, pour une raison quelconque, le disque, la mémoire, le réseau et le processeur sur le serveur principal rencontrent des problèmes, le compteur de latence de la file d’attente est élevé.If, for any reason, disk, memory, network, and processor on the back end are in trouble, the queue latency counter will be high.

Elle peut également être élevée s’il y a une latence réseau élevée entre le serveur frontal et le serveur principal.It can also be high if there is high network latency between the front end and the back end. Qu’est-ce que la latence de file d’attente est acceptable ?So what is acceptable queue latency?

Au bout de 12 secondes, les serveurs frontaux commencent à limiter les demandes aux serveurs principaux.At 12 seconds, the Front End Servers start throttling requests to the Back End Servers. Cela signifie que les serveurs commencent à renvoyer les serveurs trop occupés-503 Erreurs vers les clients.This means the servers start returning Server too busy – 503 errors to the clients. Un serveur sain doit avoir moins de 100 ms DBStore de latences de file d’attente à l’état stable, mais pendant les heures où le serveur vient de se mettre en ligne et que les utilisateurs se connectent en même temps, ce compteur peut être très élevé et vous pouvez même voir s’afficher plusieurs secondes.A healthy server should have less than 100 msec DBStore queue latencies at steady state, but during times where the server has just come online and users are all logging in at the same time, that counter can be very high and you may even see it hit multiple seconds.

Vous disposez peut-être d’une configuration à charge équilibrée, où un pool est déployé avec plusieurs serveurs frontaux et un équilibreur de charge configuré pour le « nombre minimal de connexions ».You may have a load-balanced configuration, where you have a pool deployed with multiple front-end servers and a load balancer that is configured for "least number of connections." Dans ce cas, si un serveur frontal est redémarré, tous les utilisateurs qui tentent de se reconnecter sont pointés vers le serveur redémarré, car ce serveur aura moins de connexions par rapport aux autres membres du pool.In this case, if one front-end server is restarted, then all users who attempt to reconnect will be pointed to the restarted server, because that server will have fewer connections compared to the other pool members. Pendant ce temps, le serveur frontal respectif peut être surchargé tandis que les autres membres du pool ne le sont pas.During this time, the respective front-end server may be overloaded while the other pool members are not.

Nous vous recommandons d’effectuer la maintenance pendant les heures creuses afin de réduire l’impact sur les performances, car les utilisateurs ne seront pas concurrents de se connecter au serveur en même temps.We recommend that you perform maintenance during off-hours to reduce the performance affect as users will not all be competing to connect to the server at the same time.

Si les deux compteurs de performance précédents sont élevés, le goulot d’étranglement le plus probable est le serveur principal SQL.If the previous two performance counters are high, the most likely bottleneck is the SQL Back End Server. Les éléments suivants à confirmer sont les suivants :The next components to confirm are as follows:

  • L’UC SQL Server est-elle trop élevée ?Is the SQL Server CPU too high? Par exemple, est-il supérieur à 80% ?For example, is it greater than 80 percent?

  • La latence du disque est-elle élevée ?Is the disk latency high?

Dans un monde idéal, vous disposez de suffisamment de RAM pour que les bases de données RTC et RTCDYN soient en mémoire.In an ideal world, you have enough RAM to have both the RTC and RTCDYN databases in memory. Ensuite, la seule raison pour laquelle le serveur accède au disque est d’écrire dans les fichiers journaux et de purger les bases de données.Then, the only reason the server would be accessing the disk, is to write to the log files and flush to the databases. Les tests ont montré que 12 Go de RAM suffisait pour les déploiements d’utilisateurs de 100 000.Tests have shown that 12 GB of RAM is sufficient for 100 thousand user deployments. Cela suppose que les bases de données RTC et RTCDYN totalisent une taille inférieure à 12 Go.This assumes that the RTC and RTCDYN databases size totals less than 12 GB. Si vos bases de données sont plus volumineuses, vous aurez peut-être besoin de davantage de mémoire.If your databases are larger than that, then you may need additional memory.

Vous pouvez déterminer si votre serveur SQL Server requiert une RAM supplémentaire en consultant le compteur de performances durée de vie de la page du gestionnaire de tampons SQL Server.You can determine whether your SQL Server requires additional RAM by reviewing the SQL Server Buffer Manager page life expectancy performance counter. Une valeur inférieure à 3 600 indique une pression de la mémoire.A value less than 3,600 indicates memory pressure. Si vous disposez d’une quantité de mémoire suffisante, il est également recommandé de ne pas lire peu de lectures sur votre lecteur de base de données, car SQL Server doit uniquement écrire dans la base de données.You should also see little to no reads on your database drive if you have sufficient memory because SQL Server should only be writing to the database.

Il existe un mécanisme de limitation supplémentaire dans un serveur frontal Lync Server 2013 qui démarre si le temps de traitement du serveur est élevé.There is an additional throttling mechanism in a Lync Server 2013 Front End Server that starts if the server processing time is high. La limitation de la latence DBStore est uniquement activée si la latence de SQL Server est élevée.The DBStore latency throttling is only enabled if the latency to the SQL Server is high. Un exemple dans lequel cette limitation est activée est le fait que le serveur frontal est lié au processeur.One example in which such throttling is enabled is if the front-end server is CPU-bound.

Si la durée moyenne de traitement (LC : SIP-07-Load Management \ SIP-000-Durée moyenne de conservation pour les messages entrants) sur le serveur dépasse six secondes, le serveur passe en mode de limitation et fournit uniquement aux utilisateurs une transaction en attente par connexion client.If the average processing time (LC:SIP-07-Load Management\SIP-000-Average Holding Time For Incoming Messages) on the server exceeds six seconds, then the server goes into throttling mode and only gives users one outstanding transaction per client connection. Une fois le temps de traitement de trois secondes écoulé, le serveur sort du mode de limitation et donne aux utilisateurs jusqu’à 20 transactions en suspens par connexion client.Once the processing time drops to three seconds, then the server drops out of throttling mode and gives users up to 20 outstanding transactions per client connection. Chaque fois que le nombre de transactions sur une connexion spécifique dépasse le seuil indiqué ci-dessus, la connexion est marquée comme étant contrôlée par le flux.Whenever the number of transactions on a specific connection exceeds the threshold above, the connection is marked as flow controlled. Le résultat est le serveur n’envoie aucune réception, et le compteur LC : SIP-01-Peers de \ connexions contrôlées par flux est incrémenté.The result is the server does not post any receives on it, and the LC:SIP-01-Peers\Flow Controlled Connections counter is incremented. Si une connexion reste dans un État contrôlé par flux pendant plus d’une minute, le serveur la ferme.If a connection stays in a flow-controlled state for more than one minute, then the server closes it. Il effectue cette opération de manière tardive.It does so lazily. Lorsqu’il a la possibilité de vérifier la connexion, il détermine s’il a été limité pendant trop longtemps et le ferme s’il a plus d’une minute.When it has an opportunity to check the connection, it determines whether it was throttled for too long and closes it if it has more than one minute.

Il s’agit des deux mécanismes de limitation et il existe un compteur de performances qui résume ce qui, le cas échéant, la limitation du serveur.These are the two throttling mechanisms and there is one performance counter that summarizes what, if any, throttling the server is performing.

LC : SIP-04-réponses \ SIP-053-réponses 503 locales/sLC:SIP-04-Responses\SIP-053-Local 503 Responses/sec

  • Le terme « local » dans le compteur précédent fait référence à des réponses générées localement.The term "Local" in the previous counter refers to locally generated responses.

  • Le code 503 correspond au serveur non disponible, où vous ne devez pas voir de codes 503 sur un serveur sain.The 503 code corresponds to server unavailable—where you should not see any 503 codes on a healthy server. Pendant la période qui suit le moment où un serveur vient d’être mis en ligne, il se peut que vous rencontriez des codes 503.During the period after a server is just brought online, you may see some 503 codes. Lorsque tous les utilisateurs se reconnectent et que le serveur revient à un état stable, il ne doit pas y avoir de codes 503 supplémentaires.When all of the users sign back in and the server returns to a stable state, there should no additional 503 codes.

LC : SIP-04-réponses \ SIP-074-réponses 504 locales/sLC:SIP-04-Responses\SIP-074-Local 504 Responses/sec

Ce compteur de performances indique des problèmes de connectivité avec d’autres serveurs et peut indiquer des échecs de connexion ou de retards de connexion.This performance counter indicates connectivity issues with other servers and it can indicate failures to connect or delays in connecting. Si vous constatez 504 erreurs, le compteur de performances suivant doit être vérifié.If you are seeing 504 errors then the following performance counter should be checked.

LC : SIP-01-pairs \ SIP-017-envois en attenteLC:SIP-01-Peers\SIP-017-Sends Outstanding

Ce compteur indique le nombre de demandes et de réponses sortantes en file d’attente.This counter indicates the number of outgoing queued requests and responses. Si ce compteur est élevé, cela signifie que le problème ne se trouve probablement pas sur le serveur local.If this counter is high then the issue is most likely not on the local server. Notez que ce compteur peut être élevé s’il y a des problèmes de latence du réseau.Note that this counter can be high if there are network latency issues. Elle peut également indiquer des problèmes liés à la carte réseau locale, mais elle est plus probable en raison d’un problème sur un serveur distant.It could also indicate issues with the local network adapter, but is more likely caused by an issue on a remote server. Ce compteur est très probablement élevé sur un serveur directeur lorsque le pool qu’il tente de communiquer est surchargé.This counter would most likely be high on a Director server when the pool it is trying to communicate with is overloaded. La clé avec ce compteur est d’examiner les instances, pas seulement le total.The key with this counter is to look at the instances, not just the total.