Administración de capacidad y disponibilidad en Lync Server 2013

 

Última modificación del tema: 18-08-2014

El propósito de la gestión de capacidades y la gestión de disponibilidad es medir y controlar el rendimiento del sistema. Le recomendamos que implemente procedimientos de administración de disponibilidad y administración de capacidades para que pueda medir y controlar el rendimiento del sistema. Debe saber si el sistema está disponible y si puede gestionar las demandas actuales y proyectadas estableciendo líneas base y supervisando el sistema para buscar tendencias.

Administración de capacidad

La gestión de capacidad implica la planificación, el dimensionamiento y el control de la capacidad del servicio para ayudar a garantizar que se superen los niveles mínimos de rendimiento especificados en el SLA. Una buena administración de capacidad ayuda a garantizar que puede proporcionar servicios de TI a un costo razonable y aún así cumplir con los niveles de rendimiento definidos en sus SLAs con el cliente. Estos criterios pueden incluir lo siguiente:

  • Tiempo de respuesta del sistema Este es el tiempo medido que el sistema toma para realizar las acciones típicas. Algunos ejemplos son el tiempo necesario para que el rol de servidor de audio/vídeo procese el tráfico de audio o vídeo, el tiempo necesario para que un cliente cree y se una a una conferencia, o el tiempo necesario para que la presencia se actualice en todos los clientes de inspección.

  • Capacidad de almacenamiento Esta es la capacidad de un sistema de almacenamiento, ya sea una base de datos de contenido, un dispositivo de copia de seguridad o una unidad local. Algunos ejemplos son la cantidad máxima de espacio de almacenamiento que se proporcionará por sitio y el tiempo que deben almacenarse las copias de seguridad antes de sobrescribirlas.

Ajustar la capacidad suele ser el caso de asegurarse de que haya suficientes recursos físicos disponibles, como espacio en disco y ancho de banda de red. En la tabla siguiente se enumeran las resoluciones típicas de problemas relacionados con la capacidad.

Problema Posible resolución

Usuarios remotos con un rendimiento de audio o vídeo deficiente

Compruebe si el ancho de banda adecuado está disponible en los vínculos WAN y si QoS está habilitado y configurado correctamente. Compruebe los datos de QoE.

La respuesta general del entorno de Lync es lenta.

Ejecute pruebas para comprobar que los servidores front-end existentes pueden hacer frente a la carga. Introduzca un nuevo servidor front-end si es necesario. Compruebe los tiempos de respuesta de la base de datos SQL y corrija las causas de los retrasos (por ejemplo, mejore la E/S del disco).

La solución de problemas con mayor detalle se describe en la Guía de redes de Lync Server.

La capacidad se ve afectada por la configuración del sistema y depende de recursos físicos como el ancho de banda de red. Por ejemplo, si un entorno de Lync está configurado para realizar una copia de seguridad completa por la noche, es necesario tener cuidado para garantizar que el efecto en el rendimiento interactivo experimentado por los usuarios finales está minimizado.

La gestión de capacidades es el proceso de mantener la capacidad de un sistema dentro de niveles aceptables y aborda los siguientes problemas:

  • Reaccionar a cambios en los requisitos Los requisitos de capacidad deben ajustarse para tener en cuenta los cambios en el sistema o en la organización. Por ejemplo, si su entorno decide implementar Telefonía IP empresarial, el número y la ubicación de los servidores de mediación y las puertas de enlace de la red telefónica conmutada (RTC) serán muy importantes. Si va a realizar la conexión troncal del Protocolo de inicio de sesión (SIP) o SIP directo, el diseño general cambiará significativamente para proporcionar el mejor rendimiento Telefonía IP empresarial.

  • Predecir requisitos futuros Algunos requisitos de capacidad cambian predeciblemente con el tiempo. Al realizar un seguimiento de las tendencias, puede planear las actualizaciones con antelación. Por ejemplo, es necesario supervisar el ancho de banda disponible entre varios sitios de Lync para crear una línea base. Esta línea base le permitirá predecir cuándo tiene que agregar más ancho de banda a estos vínculos a medida que aumenta el número de usuarios en estos sitios remotos con el tiempo.

Administración de disponibilidad

La administración de disponibilidad es el proceso de asegurarse de que cualquier servicio de TI de forma coherente y rentable ofrezca el nivel de servicio coherente y confiable que requiere el cliente. La administración de disponibilidad se ocupa de minimizar la pérdida del servicio y de asegurarse de que se toman las medidas adecuadas si se pierde el servicio. En un entorno de Lync, es posible que le preocupe si el servicio de Telefonía IP empresarial está disponible, si los usuarios pueden unirse a conferencias programadas, etc. Un SLA define una frecuencia y una duración aceptables de interrupciones y permite ciertos períodos en los que el sistema no está disponible para el mantenimiento planeado.

Si tiene que proporcionar informes a su administración sobre la disponibilidad de los sistemas, o si tiene sanciones financieras u otras relacionadas con la falta de objetivos de disponibilidad, debe registrar los datos de disponibilidad. Incluso si usted no tiene tales requisitos formales, es una buena idea para al menos saber con qué frecuencia un sistema ha fallado en un período de tiempo determinado. Por ejemplo, la disponibilidad del sistema en los últimos 12 meses y el tiempo que tardó en recuperarse de cada error. Esta información le ayudará a medir y mejorar la eficacia de su equipo para responder a un error del sistema. También puede proporcionarle información útil si hay un conflicto.

Las medidas relacionadas con la disponibilidad son las siguientes:

  • Disponibilidad Normalmente, esto se expresa como la hora a la que se puede acceder a un sistema o servicio en comparación con el tiempo en el que está fuera de servicio. Normalmente se expresa como un porcentaje. (Es posible que vea referencias a "tres nueves" o "cinco nueves". Se refieren a una disponibilidad del 99,9 por ciento o 99,999 por ciento).

  • Fiabilidad Se trata de una medida del tiempo entre errores de un sistema y a veces se expresa como tiempo medio (o promedio) entre errores (MTBF).

  • Tiempo de reparación Este es el tiempo necesario para recuperar un servicio después de que se haya producido un error y a menudo se expresa como tiempo medio (media) de reparación (MTTR).

La disponibilidad, la confiabilidad y el tiempo de reparación están relacionados de la siguiente manera:

Disponibilidad = (MTBF – MTTR) / MTBF Por ejemplo, si un servidor falla dos veces durante un período de seis meses y no está disponible para un promedio de 20 minutos, el MTBF es de tres meses o 90 días y el MTTR es de 20 minutos. Por lo tanto, Disponibilidad = (90 días – 20 minutos) / 90 días = 99,985 por ciento.

La administración de disponibilidad es el proceso de garantizar que la disponibilidad se maximiza y se mantiene dentro de los parámetros definidos en los SLA. La administración de disponibilidad incluye los siguientes procesos:

  • Monitoreo Examinar cuándo y durante cuánto tiempo no están disponibles los servicios.

  • Informes Las cifras de disponibilidad deben proporcionarse periódicamente a los equipos de administración, usuarios y operaciones. Estos informes deben resaltar tendencias e identificar áreas que están yendo bien y áreas que requieren atención. El informe debe resumir el cumplimiento de los objetivos establecidos en los SLA.

  • Mejora Si la disponibilidad no cumple los objetivos definidos en los SLA o en los que la tendencia es hacia una disponibilidad reducida, el proceso de administración de disponibilidad debe planear los pasos correctivo. Esto debería incluir el trabajo con otros equipos responsables para resaltar los motivos de las interrupciones y planear acciones correctivas para evitar que se repitan las interrupciones.

Las medidas de capacidad y disponibilidad son tareas repetitivas que son ideales para herramientas automatizadas y scripts, como Microsoft System Center Operations Manager (anteriormente Microsoft Operations Manager), que se analiza más adelante en este documento.