Alertas de métricas con umbrales dinámicos en Azure Monitor

La alerta de métricas con detección de umbrales dinámicos aprovecha el aprendizaje automático avanzado para obtener información acerca del comportamiento histórico de las métricas e identificar patrones y anomalías que indican problemas posibles para los servicios. Proporciona soporte técnico tanto de una interfaz de usuario simple como de operaciones a escala, ya que permite a los usuarios configurar reglas de alerta a través de la API de Azure Resource Manager de forma totalmente automática.

Una vez que se cree una regla de alerta, solo se activará solo cuando la métrica supervisada no se comporte según lo previsto, en función de sus umbrales personalizados.

Agradecemos sus comentarios, así que puede enviarlos a azurealertsfeedback@microsoft.com.

  1. Alertas escalables: las reglas de alertas de umbral dinámico pueden crear umbrales a medida para cientos de series de métricas a la vez con la misma facilidad de definición que si se tratara de una regla de alertas para una sola métrica. Le proporcionan menos alertas para crear y administrar. Puede usar Azure Portal o la API de Azure Resource Manager para crearlas. El enfoque escalable es especialmente útil cuando se trabaja con dimensiones de métricas o cuando se aplican a varios recursos como, por ejemplo, a todos los recursos de la suscripción. Obtenga más información acerca de cómo configurar alertas de métricas con umbrales dinámicos mediante plantillas.

  2. Reconocimiento de patrones de métricas inteligentes: mediante la tecnología Machine Learning podemos detectar automáticamente patrones de métricas y adaptarlos a los cambios que se producen en las métricas con el tiempo, lo que a menudo puede incluir estacionalidad (cada hora, cada día o cada semana). La adaptación al comportamiento de las métricas con el paso del tiempo y la generación de alertas en función de las desviaciones de su patrón permite que no sea imprescindible conocer el umbral "correcto" de cada métrica. El algoritmo de Machine Learning que se usa en umbrales dinámicos está diseñado para evitar umbrales con ruido (poca precisión) o amplios (poco recuerdo) que no tengan un patrón esperado.

  3. Configuración intuitiva: los umbrales dinámicos permiten configurar alertas de métricas mediante conceptos de alto nivel, lo que mitiga la necesidad de poseer un amplio conocimiento acerca de la métrica.

¿Cómo se configuran reglas de alertas con umbrales dinámicos?

Las alertas con umbrales dinámicos pueden configurarse a través de alertas de métricas en Azure Monitor. Más información acerca de cómo configurar alertas de métricas.

¿Cómo se calculan los umbrales?

Los umbrales dinámicos aprenden continuamente los datos de las series de métricas e intentan modelarlos mediante un conjunto de algoritmos y métodos. Detecta en los datos patrones como la estacionalidad (cada hora, cada día o cada semana) y puede controlar métricas con ruido (como la memoria o la CPU del equipo), así como las métricas con poca dispersión (como la disponibilidad y la tasa de error).

Los umbrales se seleccionan de forma que una desviación de estos umbrales indica una anomalía en el comportamiento de la métrica.

Nota

Los umbrales dinámicos pueden detectar la estacionalidad para patrones de cada hora, día o semana. Es posible que no se detecten otros patrones como la estacionalidad cada dos horas o dos veces por semana. Para detectar la estacionalidad semanal, se necesitan al menos tres semanas de datos históricos.

¿Qué significa el valor "Sensibilidad" en los umbrales dinámicos?

La sensibilidad del umbral de alerta es un concepto de alto nivel que controla la cantidad de desviación del comportamiento de la métrica necesaria para desencadenar una alerta. Esta opción no requiere conocimiento acerca del umbral estático similar a una métrica. Las opciones disponibles son:

  • Alto: los umbrales serán estrictos y estarán próximos al patrón de la serie de métricas. Una regla de alertas se desencadenará ante la mínima desviación, lo que generará más alertas.
  • Mediano: umbrales menos estrechos y más equilibrados, menos alertas que con la sensibilidad alta (valor predeterminado).
  • Bajo: los umbrales serán laxos y habrá más distancia desde el patrón de la serie de métricas. Una regla de alertas se desencadenará solo ante desviaciones más grandes, lo que generará menos alertas.

¿Cuáles son las opciones de configuración de "Operador" en los umbrales dinámicos?

La regla de alertas de los umbrales dinámicos puede crear umbrales personalizados en función del comportamiento de las métricas en los límites superior e inferior de uso de la misma regla de alerta. Puede elegir que la alerta que se va a desencadenar en una de las tres condiciones siguientes:

  • Mayor que el umbral superior o menor que el umbral inferior (valor predeterminado)
  • Mayor que el umbral superior
  • Menor que el umbral inferior

¿Qué significa la configuración avanzada de los umbrales dinámicos?

Períodos de error: los umbrales dinámicos también permiten configurar el número de infracciones necesarias para que se desencadene la alerta, que es el número mínimo de desviaciones requeridas en un período concreto para que el sistema genere una alerta (el valor predeterminado es cuatro desviaciones en 20 minutos). El usuario puede configurar los períodos de error y elegir los motivos por los que va a recibir alertas. Para ello solo debe cambiar los períodos de error y el período de tiempo. Esta capacidad reduce el ruido de las alertas que generan los picos transitorios. Por ejemplo:

Para desencadenar una alerta cuando el problema es continuo durante 20 minutos, 4 veces consecutivas en un período dado de 5 minutos, utilice la siguiente configuración:

La configuración de los períodos de error en un problema que se da de forma continua durante 20 minutos, 4 veces consecutivas en una agrupación de períodos dada de 5 minutos

Para desencadenar una alerta cuando se ha producido una infracción de un umbral dinámico en 20 minutos de los últimos 30 con un período de 5 minutos, utilice la siguiente configuración:

La configuración de los períodos de error en un problema que se da durante 20 minutos, de los últimos 30, con una agrupación de períodos de 5 minutos

Omitir los datos anteriores a: los usuarios también tienen la opción de definir la fecha a partir de la que el sistema debe comenzar a calcular los umbrales. Un caso de uso típico puede producirse cuando un recurso se ejecutaba en modo de prueba y ahora se ha promocionado a servir una carga de trabajo de producción y, por lo tanto, no debe tenerse en cuenta el comportamiento de las métrica durante la fase de pruebas.

¿Cómo averiguar por qué se ha desencadenado una alerta de umbrales dinámicos?

Puede explorar las instancias de alerta desencadenadas en la vista de alertas, haciendo clic en el vínculo en el correo electrónico o mensaje de texto, o en el explorador para mostrar la vista de alertas en Azure Portal. Más información sobre la vista de alertas.

La vista de alertas muestra:

  • Todos los detalles de la métrica en el momento en que se desencadena la alerta de umbrales dinámicos.
  • Un gráfico del período en el que se desencadenó la alerta, que incluye los umbrales dinámicos usados en ese momento dado.
  • La capacidad de proporcionar comentarios sobre la experiencia de alertas de umbrales dinámicos y la vista de alertas, lo que podría mejorar futuras detecciones.

¿Se desencadenará una alerta con el lento cambio de comportamiento de una métrica?

Probablemente no. Los umbrales dinámicos son buenos para detectar desviaciones importantes, en lugar de problemas de evolución lenta.

¿Cuántos datos se usan para obtener una vista previa y, después, calcular los umbrales?

La primera vez que se crea una alerta, los umbrales que aparecen en el gráfico se calculan utilizando datos históricos, que deben ser suficientes para poder calcular patrones estacionales por hora o día (10 días). Una vez creada una regla de alertas, los umbrales dinámicos usarán todos los datos históricos necesarios que estén disponibles y aprenderán y se adaptarán continuamente según los datos nuevos para que los umbrales sean cada vez más precisos. Esto significa que, después de este cálculo, el gráfico también mostrará los patrones semanales.

¿Cuántos datos se necesitan para desencadenar una alerta?

Si tiene un nuevo recurso o faltan datos de las métricas, los umbrales dinámicos no desencadenarán alertas antes de que haya disponibles tres días o al menos 30 ejemplos de datos de métrica, para así poder garantizar que los umbrales son precisos. En el caso de los recursos existentes con datos de métrica suficientes, los umbrales dinámicos pueden desencadenar alertas inmediatamente.

Procedimientos recomendados para umbrales dinámicos

Los umbrales dinámicos se puede aplicar a la mayoría de las plataformas o métricas personalizadas de Azure Monitor y también se ha optimizado para las métricas comunes de aplicaciones y de infraestructura. Los elementos siguientes son procedimientos recomendados sobre cómo configurar alertas en algunas de estas métricas con umbrales dinámicos.

Umbrales dinámicos en las métricas de porcentaje de CPU de máquina virtual

  1. En Azure Portal, haga clic en Monitor. La vista Monitor consolida todas las opciones de configuración y todos los datos de supervisión en una vista.

  2. Haga clic en Alertas y, a continuación, en + Nueva regla de alertas.

    Sugerencia

    La mayoría de las hojas de recursos también tienen la opción Alertas en el menú de recursos de la sección Supervisión, de modo que también podría crear alertas desde allí.

  3. Haga clic en Seleccionar destino, en el panel de contexto que se carga, y seleccione un recurso de destino sobre el que quiera alertar. Use los menús desplegables Suscripción y Tipo de recurso "Máquinas virtuales" para buscar el recurso que quiere supervisar. También puede utilizar la barra de búsqueda para buscar su recurso.

  4. Una vez haya seleccionado un recurso de destino, haga clic en Agregar condición.

  5. Seleccione "Porcentaje de CPU" .

  6. De manera opcional, puede restringir la métrica ajustando Período y Agregación. No se recomienda usar el tipo de agregación "máxima" para este tipo de métrica ya que es menos representativo del comportamiento. Para el tipo de agregación "máxima", el umbral estático puede ser más adecuado.

  7. Verá un gráfico para la métrica de las últimas 6 horas. Defina los parámetros de la alerta:

    1. Tipo de condición: elija la opción "Dinámico".
    2. Sensibilidad: elija una sensibilidad media o baja para reducir el ruido de las alertas.
    3. Operador: elija "mayor que" excepto si el comportamiento representa el uso de la aplicación.
    4. Frecuencia: considere la posibilidad de reducirla según el impacto empresarial de la alerta.
    5. Períodos de error (Opción avanzada) la ventana temporal debe ser al menos de 15 minutos. Por ejemplo, si se establece el período en cinco minutos, los períodos de error deben ser tres como mínimo.
  8. El gráfico de métricas mostrará los umbrales calculados según los datos recientes.

  9. Haga clic en Done(Listo).

  10. Rellene los Detalles de alertas como Nombre de la regla de alertas, Descripción y Gravedad.

  11. Agregue un grupo de acciones a la alerta, ya sea seleccionando un grupo de acciones existente o creando uno nuevo.

  12. Haga clic en Listo para guardar la regla de alertas de métrica.

Nota

Las reglas de alertas de métricas creadas mediante el portal se crean en el mismo grupo de recursos que el recurso de destino.

Umbrales dinámicos en el tiempo de ejecución de solicitudes HTTP de Application Insights

  1. En Azure Portal, haga clic en Monitor. La vista Monitor consolida todas las opciones de configuración y todos los datos de supervisión en una vista.

  2. Haga clic en Alertas y, a continuación, en + Nueva regla de alertas.

    Sugerencia

    La mayoría de las hojas de recursos también tienen la opción Alertas en el menú de recursos de la sección Supervisión, de modo que también podría crear alertas desde allí.

  3. Haga clic en Seleccionar destino, en el panel de contexto que se carga, y seleccione un recurso de destino sobre el que quiera alertar. Use los menús desplegables Suscripción y Tipo de recurso "Application Insights" para buscar el recurso que quiere supervisar. También puede utilizar la barra de búsqueda para buscar su recurso.

  4. Una vez haya seleccionado un recurso de destino, haga clic en Agregar condición.

  5. Seleccione la opción "Tiempo de ejecución de solicitud HTTP" .

  6. De manera opcional, puede restringir la métrica ajustando Período y Agregación. No se recomienda usar el tipo de agregación "máxima" para este tipo de métrica ya que es menos representativo del comportamiento. Para el tipo de agregación "máxima", el umbral estático puede ser más adecuado.

  7. Verá un gráfico para la métrica de las últimas 6 horas. Defina los parámetros de la alerta:

    1. Tipo de condición: elija la opción "Dinámico".
    2. Operador: elija "mayor que" para reducir el número de alertas que se desencadenan con una mejora de la duración.
    3. Frecuencia: considere la posibilidad de reducirla según el impacto empresarial de la alerta.
  8. El gráfico de métricas mostrará los umbrales calculados según los datos recientes.

  9. Haga clic en Done(Listo).

  10. Rellene los Detalles de alertas como Nombre de la regla de alertas, Descripción y Gravedad.

  11. Agregue un grupo de acciones a la alerta, ya sea seleccionando un grupo de acciones existente o creando uno nuevo.

  12. Haga clic en Listo para guardar la regla de alertas de métrica.

Nota

Las reglas de alertas de métricas creadas mediante el portal se crean en el mismo grupo de recursos que el recurso de destino.

Interpretación de gráficos de umbrales dinámicos

A continuación aparece un gráfico que muestra una métrica, sus límites de umbrales dinámicos y algunas alertas que se desencadenan cuando el valor se sitúa fuera de los umbrales permitidos.

Más información acerca de cómo configurar alertas de métricas

Utilice la siguiente información para interpretar el gráfico anterior.

  • Línea azul: la métrica medida real a lo largo del tiempo.
  • Área azul sombreada: muestra el intervalo permitido para la métrica. Siempre que los valores de la métrica permanezcan dentro de este intervalo, no se producirá ninguna alerta.
  • Puntos azules: si hace clic en cualquier parte del gráfico y, a continuación, mantiene el mouse sobre la línea azul, verá un punto azul debajo del cursor que muestra un valor de métrica agregado individual.
  • Elemento emergente con un punto azul: muestra el valor de la métrica medida (el punto azul) y los valores superior e inferior del intervalo permitido.
  • Punto rojo con un círculo negro: muestra el primer valor de la métrica fuera del intervalo permitido. Este es el valor que activa una alerta de métrica y la pone en estado activo.
  • Puntos rojos: indican valores medidos adicionales fuera del intervalo permitido. No activarán alertas de métricas adicionales, pero la alerta permanecerá activa.
  • Área roja: muestra la hora en que el valor de la métrica estaba fuera del intervalo permitido. La alerta permanecerá en estado activo siempre que los valores medidos posteriores estén fuera del intervalo permitido, pero no se activarán nuevas alertas.
  • Final del área roja: cuando la línea azul vuelve dentro de los valores permitidos, el área roja se detiene y la línea del valor medido se vuelve azul. El estado de la alerta de la métrica desencadenada en el momento que indica el punto rojo con el contorno negro se establece en resuelto.