Capacidad de una instancia de Azure API Management

La capacidad la métrica de Azure Monitor más importante para tomar decisiones informadas acerca de si se debe escalar una instancia de API Management para acomodar más carga. Su construcción es compleja e impone un comportamiento concreto.

En este artículo se explica lo que es la capacidad y su comportamiento. Muestra cómo acceder a la métrica de capacidad en Azure Portal y sugiere cuándo hay que considerar la posibilidad de escalar o actualizar una instancia de API Management.

Importante

En este artículo se describe cómo puede supervisar y escalar su instancia de Azure API Management en función de su métrica de capacidad. Sin embargo, es igualmente importante comprender lo que ocurre cuando una instancia individual de API Management ha alcanzado realmente su capacidad. Azure API Management no aplicará ninguna limitación de nivel de servicio para evitar una sobrecarga física de las instancias. Cuando una instancia alcanza su capacidad física, se comporta de forma similar a cualquier servidor web sobrecargado que no puede procesar las solicitudes entrantes: la latencia aumentará, se eliminarán las conexiones, se producirán errores de tiempo de espera, etc. Es decir, los clientes de API deben estar preparados para hacer frente a esta posibilidad de manera similar a como ocurre con cualquier otro servicio externo (por ejemplo, mediante la aplicación de directivas de reintento).

Requisitos previos

Para seguir los pasos de este artículo, debe tener:

Disponibilidad

Importante

Esta característica está disponible en los niveles Premium, Estándar, Básico y Desarrollador de API Management.

¿Qué es la capacidad?

Diagrama que explica la métrica de capacidad.

La capacidad es un indicador de la carga de una instancia de API Management. Refleja el uso de los recursos (CPU y memoria) y las longitudes de cola de la red. El uso de la CPU y la memoria revela el consumo de recursos por parte de:

  • Los servicios de plano de datos de API Management, como el procesamiento de solicitudes, lo que puede incluir el reenvío de solicitudes o la ejecución de una directiva.
  • Los servicios de plano de datos de API Management, como las acciones de administración aplicadas a través de Azure Portal o ARM, o la carga procedente del portal para desarrolladores.
  • Procesos seleccionados del sistema operativo, entre los que se incluyen los procesos que implican el costo de los protocolos de enlace TLS en las nuevas conexiones.

La capacidad total es un promedio de sus propios valores de cada unidad de una instancia de API Management.

Aunque la métrica de capacidad está diseñada para solucionar problemas con la instancia de API Management, hay casos en los que los problemas no se reflejarán en los cambios en la métrica de capacidad.

Comportamiento de la métrica de capacidad

Dada su construcción, en la vida real la capacidad puede verse afectada por muchas variables, como por ejemplo:

  • patrones de conexión (conexión nueva en una solicitud frente a reutilización de la conexión existente);
  • tamaño de una solicitud y respuesta;
  • directivas configuradas en cada API o número de clientes que envían solicitudes.

Cuanto más complejas sean las operaciones de las solicitudes, más alto será el consumo de la capacidad. Por ejemplo, las directivas de transformación compleja consumen mucha más CPU que el reenvío de una solicitud simple. Las respuestas lentas al servicio del back-end también la incrementarán.

Importante

La capacidad no es una medida directa del número de solicitudes que se procesan.

Picos de la métrica de capacidad

La capacidad también puede tener picos intermitentes o ser mayor que cero aunque no se procesen solicitudes. Esto sucede debido a acciones específicas del sistema o de la plataforma, y no debe tenerse en cuenta al decidir si se escala una instancia.

Una métrica de capacidad baja no implica necesariamente que la instancia de API Management no experimente ningún problema.

Uso de Azure Portal para examinar la capacidad

Métrica de capacidad

  1. Acceda a la instancia de APIM de Azure Portal.

  2. Seleccione Métricas.

  3. En la sección púrpura, seleccione la métrica Capacidad y deje la agregación Avg predeterminada.

    Sugerencia

    Para evitar interpretaciones incorrectas, siempre debe mirar el desglose de la métrica de capacidad por ubicación.

  4. En la sección verde, seleccione Ubicación para dividir la métrica por dimensión.

  5. Elija el período que desee en la barra superior de la sección.

    Puede establecer una alerta de métrica que le avise cuando ocurra algo inesperado. Por ejemplo, obtenga notificaciones cuando la instancia de APIM haya superado su capacidad máxima esperada durante más de 20 minutos.

    Sugerencia

    Puede configurar alertas para saber en qué momento se está quedando sin capacidad un servicio o utilizar la funcionalidad de escalado automático de Azure Monitor para agregar automáticamente una unidad de Azure API Management. La operación de escalado puede tardar unos 30 minutos, por lo que debe planear las reglas en consecuencia.
    Solo se permite el escalado de la ubicación maestra.

Uso de la capacidad para decidir acerca del escalado

La capacidad la métrica de para tomar decisiones acerca de si se debe escalar una instancia de API Management para acomodar más carga. Considere:

  • El examen del promedio y de la tendencia a largo plazo.
  • La omisión de picos repentinos que muy probablemente no estén relacionados con los aumentos en la carga (para obtener una explicación, consulte la sección "Comportamiento de la métrica de capacidad").
  • La actualización o el escalado de la instancia cuando el valor de la capacidad supera el 60 % o 70 % durante un período mayor (por ejemplo, 30 minutos). Para su servicio o escenario es posible que sean más apropiados otros valores.

Sugerencia

Si puede calcular el tráfico de antemano, pruebe su instancia de APIM en las cargas de trabajo que espera. Puede aumentar la carga de solicitudes en el inquilino gradualmente y supervisar qué valor de la métrica de capacidad corresponde a la carga máxima. Siga los pasos de la sección anterior para usar Azure Portal para saber la capacidad que se utiliza en un momento dado.

Pasos siguientes