Capacidade de uma instância de gerenciamento de API do Azure

APLICA-SE A: Desenvolvedor | Básico | Standard | Premium

Capacidade é a métrica mais importante do Azure Monitor para tomar decisões fundamentadas sobre dimensionar ou atualizar uma instância de Gerenciamento de API para acomodar mais carga. Sua construção é complexa e impõe certo comportamento.

Este artigo explica o que é a capacidade e como ela se comporta. Ele mostra como acessar métricas de capacidade no portal do Azure e sugere quando considerar a possibilidade de dimensionar ou atualizar sua instância de gerenciamento de API.

Importante

Este artigo discute como você pode monitorar e dimensionar sua instância de gerenciamento de API do Azure com base na sua métrica de capacidade. No entanto, é igualmente importante entender o que acontece quando uma instância de gerenciamento de API individual realmente atingiu sua capacidade. O Gerenciamento de API do Azure não aplicará limitações ao nível de serviço para evitar uma sobrecarga física das instâncias. Quando uma instância atinge a capacidade física, ela se comporta de maneira semelhante a qualquer servidor Web sobrecarregado que não consegue processar as solicitações recebidas: a latência aumentará, as conexões serão removidas, ocorrerão erros de tempo limite e assim por diante. Isso significa que os clientes de API devem estar preparados para lidar com essa possibilidade, da mesma forma que fazem com qualquer outro serviço externo (por exemplo, aplicando políticas de repetição).

Pré-requisitos

Para seguir as etapas deste artigo, você precisa ter:

Disponibilidade

Importante

A agregação Máxima da métrica de capacidade só é compatível com a camada Premium do Gerenciamento de API.

Qual é a capacidade

Diagrama que explica a métrica de capacidade.

Capacidade é um indicador de carga em uma instância de gerenciamento de API. Reflete o uso de recursos (CPU, memória) e os tamanhos de fila da rede. O uso de CPU e memória revela o consumo de recursos por:

  • Serviços de plano de dados de gerenciamento de API, como processamento de solicitações, que podem incluir solicitações de encaminhamento ou a execução de uma política.
  • Serviços do plano de Gerenciamento de API, como as ações de gerenciamento aplicadas por meio do portal do Azure ou do Azure Resource Manager ou a carga proveniente do portal do desenvolvedor.
  • Processos selecionados do sistema operacional, incluindo processos que envolvem custo de handshakes TLS em novas conexões.
  • Atualizações de plataforma, como atualizações do sistema operacional nos recursos de computação subjacentes para a instância.
  • Número de APIs implantadas, independentemente da atividade, que pode consumir capacidade adicional.

A capacidade total de é uma média de seus próprios valores de cada unidade de uma instância de Gerenciamento de API.

Embora a métrica de capacidade seja projetada para a superfície de problemas com sua instância de gerenciamento de API, há casos em que os problemas não serão refletidos nas alterações na métrica de capacidade.

Comportamento da métrica de capacidade

Por causa de sua construção, a capacidade real pode ser afetada por muitas variáveis, por exemplo:

  • padrões de conexão (nova conexão em uma solicitação versus reutilização da conexão existente)
  • tamanho de uma solicitação e resposta
  • políticas configuradas em cada API ou número de pedidos de envio de clientes.

Quanto mais complexas forem as operações nas solicitações, maior será o consumo de capacidade . Por exemplo, políticas de transformação complexas consomem muito mais CPU do que um simples encaminhamento de solicitação. Respostas de serviço de back-end lentas aumentarão também.

Importante

Capacidade não é uma medida direta do número de solicitações processadas.

Picos de métrica de capacidade

A capacidade também pode ser intermitente ou maior que zero, mesmo que as solicitações não sejam processadas. Isso acontece por causa de ações específicas do sistema ou da plataforma e não deve ser levado em consideração ao decidir dimensionar uma instância.

Uma métrica de capacidade baixa não significa necessariamente que sua instância de gerenciamento de API não está enfrentando problemas.

Use o portal do Azure para examinar a capacidade

Métrica de capacidade

  1. Navegue até sua instância de API Management no portal do Azure.

  2. No menu esquerdo, em Monitoramento, selecione Métricas.

  3. Selecione a métrica Capacidade nas métricas disponíveis e deixe a agregação Média padrão.

    Dica

    Se você implantou a instância em vários locais, deve sempre examinar um detalhamento da métrica de capacidade por local, para evitar interpretações erradas.

  4. Para dividir a métrica por local, na seção na parte superior, selecione Aplicar divisão e selecione Local.

  5. Escolha um período de tempo desejado na barra superior da seção.

    Você pode definir um alerta de métrica para avisá-lo quando algo inesperado estiver acontecendo. Por exemplo, receba notificações quando a instância de Gerenciamento de API exceder a capacidade de pico esperada por mais de 20 minutos.

    Dica

    Você pode configurar alertas para informar quando o serviço está com pouca capacidade ou usar o dimensionamento automático do Azure Monitor para adicionar automaticamente uma unidade de Gerenciamento de API do Azure. A operação de dimensionamento pode levar cerca de 30 minutos, portanto, você deve planejar suas regras adequadamente.
    Apenas o escalonamento da localização principal é permitido.

Use capacidade para escalar decisões

Capacidade é a métrica para tomar decisões sobre dimensionar uma instância de gerenciamento de API para acomodar mais carga. Veja a seguir as considerações gerais:

  • Observe uma tendência de longo prazo e a média.
  • Ignore os picos repentinos que provavelmente não estão relacionados a um aumento de carga (confira a seção Comportamento da métrica de capacidade para obter explicações).
  • Como regra geral, atualize ou dimensione a instância quando o valor da capacidade exceder 60% a 70% por um longo período (por exemplo, 30 minutos). Valores diferentes podem funcionar melhor para seu serviço ou cenário.
  • Se a instância foi configurada com apenas 1 unidade, atualize ou dimensione a instância quando o valor da capacidade exceder 40% por um longo período. Essa recomendação baseia-se na necessidade de reservar capacidade para atualizações do SO convidado na plataforma de serviço subjacente.

Dica

Se você puder estimar o tráfego antecipadamente, teste a instância de Gerenciamento de API nas cargas de trabalho esperadas. Você pode aumentar a carga de solicitações no locatário gradativamente e monitorar o valor da métrica de capacidade correspondente à carga máxima. Siga as etapas da seção anterior para usar o portal do Azure para entender quanta capacidade é usada a qualquer momento.

Próximas etapas