Gerenciamento de capacidade e disponibilidade no Lync Server 2013Capacity and availability management in Lync Server 2013

 

Última modificação do tópico: 2014-08-18Topic Last Modified: 2014-08-18

O objetivo do gerenciamento de capacidade e gerenciamento de disponibilidade é medir e controlar o desempenho do sistema.The purpose of capacity management and availability management is to measure and control system performance. É recomendável implementar os procedimentos de gerenciamento de capacidade e gerenciamento de disponibilidade para que você possa medir e controlar o desempenho do sistema.We recommend that you implement capacity management and availability management procedures so that you can measure and control system performance. Você deve saber se o sistema está disponível e se pode lidar com as demandas atuais e projetadas configurando as linhas de base e monitorando o sistema para procurar tendências.You have to know whether the system is available and if it can handle the current and the projected demands by setting baselines and monitoring the system to look for trends.

Gerenciamento de capacidadeCapacity management

O gerenciamento de capacidade envolve planejamento, dimensionamento e controle da capacidade de serviço para ajudar a garantir que os níveis de desempenho mínimos especificados no SLA sejam excedidos.Capacity management involves planning, sizing, and controlling service capacity to help guarantee that the minimum performance levels specified in your SLA are exceeded. O bom gerenciamento de capacidade ajuda a garantir que você possa fornecer serviços de ti a um custo razoável e ainda atender aos níveis de desempenho definidos em seus SLAs com o cliente.Good capacity management helps ensure that you can provide IT services at a reasonable cost and still meet the levels of performance defined in your SLAs with the client. Esses critérios podem incluir o seguinte:These criteria can include the following:

  • Tempo de resposta do sistema     Esse é o tempo medido que o sistema leva para executar ações típicas.System Response Time   This is the measured time that the system takes to do typical actions. Os exemplos incluem o tempo necessário para que a função de servidor de áudio/vídeo processe o tráfego de áudio/vídeo, o tempo necessário para um cliente criar e ingressar em uma conferência ou o tempo gasto para que a presença seja atualizada em todos os clientes do observador.Examples include the time that is required for the audio/video server role to process audio/video traffic, the time that is required for a client to create and join a conference, or the time taken for presence to be updated in all watcher clients.

  • Capacidade     de armazenamento Esta é a capacidade de um sistema de armazenamento, seja um banco de dados de conteúdo, um dispositivo de backup ou uma unidade local.Storage Capacity   This is the capacity of a storage system, whether it is a content database, a backup device, or a local drive. Os exemplos incluem a quantidade máxima de espaço de armazenamento a ser fornecida por site e o momento em que os backups devem ser armazenados antes de serem substituídos.Examples include the maximum amount of storage space to be provided per site and the time that backups should be stored before they are overwritten.

O ajuste da capacidade geralmente é um caso de garantir que recursos físicos suficientes estejam disponíveis, como espaço em disco e largura de banda da rede.Adjusting capacity is frequently a case of making sure that enough physical resources are available, such as disk space and network bandwidth. A tabela a seguir lista as resoluções típicas para problemas relacionados à capacidade.The following table lists typical resolutions for capacity-related issues.

ProblemaIssue Solução possívelPossible resolution

Usuários remotos com desempenho ruim de áudio/vídeoRemote users having poor audio/video performance

Verifique se a largura de banda apropriada está disponível nos links WAN e se a QoS está habilitada e corretamente configurada.Check to see whether appropriate bandwidth is available on the WAN links and if QoS is enabled and appropriately configured. Verifique os dados de QoE.Check QoE data.

A resposta geral do ambiente do Lync é lenta.Overall response of the Lync environment is slow.

Execute testes para verificar se os servidores front-end existentes podem lidar com a carga.Run tests to check that the existing front-end servers can deal with the load. Introduza um novo servidor front-end, se necessário. Verifique os tempos de resposta do banco de dados SQL e corrija as causas dos atrasos (por exemplo, melhorar a e/s de disco).Introduce a new front-end server if it is needed.Check SQL database response times and fix the causes for the delays (for example, improve disk I/O).

A solução de problemas mais detalhada é abordada no guia de rede do Lync Server.Troubleshooting in greater detail is covered in the Lync Server Networking Guide.

A capacidade é afetada pela configuração do sistema e depende de recursos físicos, como a largura de banda da rede.Capacity is affected by system configuration and depends on physical resources such as network bandwidth. Por exemplo, se um ambiente do Lync é configurado para executar um backup completo à noite, deve-se tomar cuidado para ajudar a garantir que o efeito no desempenho interativo experiente por usuários finais seja minimizado.For example, if a Lync environment is configured to perform a full backup nightly, care must be taken to help guarantee that the effect on the interactive performance experienced by end-users is minimized.

O gerenciamento de capacidade é o processo de manter a capacidade de um sistema em níveis aceitáveis e aborda os seguintes problemas:Capacity management is the process of keeping the capacity of a system within acceptable levels and addresses the following issues:

  • Reagindo a alterações nos requisitos     Os requisitos de capacidade precisam ser ajustados para que as alterações sejam feitas no sistema ou na organização.Reacting to changes in requirements   Capacity requirements have to be adjusted to account for changes in the system or the organization. Por exemplo, se seu ambiente decidir implementar o Enterprise Voice, o número e o posicionamento de servidores de mediação e gateways PSTN (rede telefônica pública comutada) serão muito importantes.For example, if your environment decides to implement Enterprise Voice, the number and placement of Mediation Servers and public switched telephone network (PSTN) gateways will be very important. Se você estiver fazendo um tronco SIP (Session Initiation Protocol) ou SIP direto, o design geral será alterado significativamente para fornecer o melhor desempenho do Enterprise Voice.If you'll be doing Session Initiation Protocol (SIP) trunking or direct SIP, the overall design will be significantly changed to provide the best Enterprise Voice performance.

  • Prever requisitos futuros     Alguns requisitos de capacidade mudam de forma preditiva com o passar do tempo.Predicting future requirements   Some capacity requirements change predictably over time. Ao controlar as tendências, você pode planejar atualizações com antecedência.By tracking trends you can plan upgrades in advance. Por exemplo, a largura de banda disponível entre vários sites do Lync deve ser monitorada para criar uma linha de base.For example, available bandwidth between various Lync sites must be monitored to create a baseline. Essa linha de base permitirá a você prever quando você precisa adicionar mais largura de banda a esses links, já que a contagem de usuários nesses sites remotos aumenta com o tempo.This baseline will allow you to predict when you have to add more bandwidth to these links as user count in these remote sites increases with time.

Gerenciamento de disponibilidadeAvailability management

O gerenciamento de disponibilidade é o processo de garantir que todos os serviços de ti de forma consistente e econômico forneça o nível de serviço consistente e confiável exigido pelo cliente.Availability management is the process of making sure that any IT service consistently and cost effectively delivers the level of consistent, reliable service that is required by the customer. O gerenciamento de disponibilidade lida com a redução da perda de serviço e com a execução da ação apropriada se o serviço for perdido.Availability management deals with minimizing loss of service and with making sure that appropriate action is taken if service is lost. Em um ambiente do Lync, você pode estar preocupado se o serviço Enterprise Voice está disponível, se os usuários podem participar de conferências agendadas e assim por diante.In a Lync environment, you may be concerned about whether the Enterprise Voice service is available, whether users can join scheduled conferences, and so on. Um SLA define uma frequência e um comprimento aceitáveis e permite determinados períodos quando o sistema não está disponível para manutenção planejada.An SLA defines an acceptable frequency and length of outages and allows for certain periods when the system is unavailable for planned maintenance.

Se você precisar fornecer relatórios para seu gerenciamento sobre a disponibilidade de sistemas, ou se você tiver penalidades financeiras ou outras, você deve registrar os dados de disponibilidade.If you have to provide reports to your management about the availability of systems, or if you have financial or other penalties associated with missing availability targets, you must record availability data. Mesmo que você não tenha esses requisitos formais, é uma boa ideia, pelo menos, saber com que frequência um sistema falhou em um determinado período de tempo.Even if you do not have such formal requirements, it is a good idea to at least know how frequently a system has failed in a certain time period. Por exemplo, a disponibilidade do sistema nos últimos 12 meses e quanto tempo levou para se recuperar de cada falha.For example, system availability in the last 12 months and how long it took to recover from each failure. Essas informações ajudarão você a medir e aprimorar a eficácia da sua equipe em responder a uma falha do sistema.This information will help you measure and improve your team’s effectiveness in responding to a system failure. Ele também pode fornecer informações úteis se houver uma contestação.It can also give you useful information if there is a dispute.

As medidas relacionadas à disponibilidade são as seguintes:Measures related to availability are as follows:

  • Disponibilidade     Isso é normalmente expresso como o tempo que um sistema ou serviço pode ser acessado em comparação com o momento em que ele está desativado.Availability   This is typically expressed as the time that a system or service can be accessed compared to the time that it is down. Normalmente, é expresso como uma porcentagem.It is typically expressed as a percentage. (Você pode ver referências de "três noves" ou "cinco noves".(You may see references to “three nines” or “five nines”. Eles se referem à disponibilidade de 99,9% ou 99,999%.)These refer to 99.9 percent or 99.999 percent availability.)

  • Confiabilidade     Essa é uma medida do tempo entre as falhas de um sistema e, às vezes, é expressa como média (ou média) de tempo entre falhas (MTBF).Reliability   This is a measure of the time between failures of a system and is sometimes expressed as mean (or average) time between failures (MTBF).

  • Tempo para reparar     Esse é o tempo necessário para recuperar um serviço após uma falha, e geralmente é expresso como média (significando média) tempo para reparar (MTTR).Time to Repair   This is the time taken to recover a service after a failure has occurred and is often expressed as mean (meaning average) time to repair (MTTR).

Disponibilidade, confiabilidade e tempo para reparo estão relacionados da seguinte maneira:Availability, reliability, and time to repair are related as follows:

Disponibilidade = (MTBF – MTTR)/MTBF     Por exemplo, se um servidor falhar duas vezes em um período de seis meses e não estiver disponível para uma média de 20 minutos, o MTBF será de três meses ou 90 dias e o MTTR será de 20 minutos.Availability = (MTBF – MTTR) / MTBF   For example, if a server fails two times over a six-month period and is unavailable for an average of 20 minutes, the MTBF is three months or 90 days and the MTTR is 20 minutes. Portanto, disponibilidade = (90 dias – 20 minutos)/90 dias = 99,985%.Therefore, Availability = (90 days – 20 minutes) / 90 days = 99.985 percent.

O gerenciamento de disponibilidade é o processo de garantir que a disponibilidade seja maximizada e mantida nos parâmetros definidos em SLAs.Availability management is the process of making sure that availability is maximized and kept within the parameters that are defined in SLAs. O gerenciamento de disponibilidade inclui os seguintes processos:Availability management includes the following processes:

  • Monitoramento     Examinando quando e por quanto tempo os serviços não estão disponíveis.Monitoring    Examining when and for how long services are unavailable.

  • Relatórios     Os números de disponibilidade devem ser fornecidos regularmente para equipes de gerenciamento, usuários e operações.Reporting   Availability figures should be regularly provided to management, users, and operations teams. Esses relatórios devem realçar tendências e identificar áreas que são bem e áreas que exigem atenção.These reports should highlight trends and identify areas that are doing well and areas that require attention. O relatório deve resumir a conformidade com os destinos definidos nos SLAs.The report should summarize compliance with targets set in the SLAs.

  • Melhoria     Se a disponibilidade não atender aos destinos definidos nos SLAs ou em que a tendência estiver em relação à disponibilidade reduzida, o processo de gerenciamento de disponibilidade deverá planejar as etapas de correções.Improvement   If availability does not meet targets that are defined in the SLAs or where the trend is toward reduced availability, the availability management process should plan remedial steps. Isso deve incluir o trabalho com outras equipes responsáveis realçar os motivos de paralisações e planejar ações corretivas para evitar uma recorrência das interrupções.This should include working with other responsible teams to highlight reasons for outages and to plan remedial actions to prevent a recurrence of the outages.

As medições de capacidade e disponibilidade são tarefas repetitivas que são ideais para ferramentas automatizadas e scripts como o Microsoft System Center Operations Manager (anteriormente Microsoft Operations Manager), que é abordado posteriormente neste documento.Capacity and availability measurements are repetitive tasks that are ideally suited to automated tools and scripts such as Microsoft System Center Operations Manager (formerly Microsoft Operations Manager), which is discussed later in this document.