Comprender cómo funcionan las alertas de métricas en Azure MonitorUnderstand how metric alerts work in Azure Monitor

Las alertas de métricas en Azure Monitor funcionan en la parte superior de las métricas multidimensionales.Metric alerts in Azure Monitor work on top of multi-dimensional metrics. Estas métricas pueden ser métricas de plataforma, métricas personalizadas, registros populares de Azure Monitor convertidos en métricas y métricas de Application Insights.These metrics could be platform metrics, custom metrics, popular logs from Azure Monitor converted to metrics and Application Insights metrics. Las alertas de métricas se evalúan a intervalos regulares para comprobar si las condiciones de una o varias series temporales para las métricas son verdaderas y recibirá una notificación cuando se cumplan las evaluaciones.Metric alerts evaluate at regular intervals to check if conditions on one or more metric time-series are true and notify you when the evaluations are met. Como las alertas de métricas tienen un estado, solo envían notificaciones cuando cambia ese estado.Metric alerts are stateful, that is, they only send out notifications when the state changes.

Cómo funcionan las alertas de métricasHow do metric alerts work?

Para definir una regla de alerta de métrica, especifique el recurso de destino que se supervisará, el nombre, la condición de la métrica, el tipo de condición (estático o dinámico) y la condición (un operador y un umbral o sensibilidad) y un grupo de acción que se activará cuando a su vez se active la regla de alerta.You can define a metric alert rule by specifying a target resource to be monitored, metric name, condition type (static or dynamic), and the condition (an operator and a threshold/sensitivity) and an action group to be triggered when the alert rule fires. Los tipos de condición afectan a la manera en que se determinan los umbrales.Condition types affect the way thresholds are determined. Más información sobre las opciones de tipo y sensibilidad de la condición de umbrales dinámicos.Learn more about Dynamic Thresholds condition type and sensitivity options.

Regla de alerta con el tipo de condición estáticaAlert rule with static condition type

Supongamos que ha creado una regla de alerta de métrica de umbral estático simple de la siguiente manera:Let's say you have created a simple static threshold metric alert rule as follows:

  • Recurso de objetivo (el recurso de Azure que quiere supervisar): myVMTarget Resource (the Azure resource you want to monitor): myVM
  • Métrica: Porcentaje de CPUMetric: Percentage CPU
  • Tipo de condición: estáticaCondition Type: Static
  • Agregación de tiempo (estadística que se ejecuta sobre valores de métrica sin procesar.Time Aggregation (Statistic that is run over raw metric values. Las agregaciones de tiempo compatibles son Min, Max, Avg, Total y Count): AverageSupported time aggregations are Min, Max, Avg, Total, Count): Average
  • Período (la ventana temporal según la cual se comprueban los valores de la métrica): En los últimos 5 minutosPeriod (The look back window over which metric values are checked): Over the last 5 mins
  • Frecuencia (es decir, la frecuencia con la que la alerta de métricas comprueba si se cumplen las condiciones): 1 minFrequency (The frequency with which the metric alert checks if the conditions are met): 1 min
  • Operador: Mayor queOperator: Greater Than
  • Umbral: 70Threshold: 70

Desde el momento en que se crea la regla de alerta, el proceso de supervisión se ejecuta cada minuto y examina los valores métricos de los últimos 5 minutos; además, comprueba si el promedio de esos valores es superior a 70.From the time the alert rule is created, the monitor runs every 1 min and looks at metric values for the last 5 minutes and checks if the average of those values exceeds 70. Si se cumple la condición, es decir, si el porcentaje medio de la CPU supera el valor de 70 durante los últimos 5 minutos, la regla de alerta desencadena una notificación activada.If the condition is met that is, the average Percentage CPU for the last 5 minutes exceeds 70, the alert rule fires an activated notification. Si configuró un correo electrónico o una acción de webhook en el grupo de acciones asociado a la regla de alerta, recibirá una notificación activada en ambos recursos.If you have configured an email or a web hook action in the action group associated with the alert rule, you will receive an activated notification on both.

Si utiliza varias condiciones en una regla, la regla une las condiciones.When you are using multiple conditions in one rule, the rule "ands" the conditions together. Es decir, una alerta se desencadena cuando todas las condiciones de regla la alerta se evalúan como true y se resuelve cuando una de las condiciones deja de ser true.That is, an alert fires when all the conditions in the alert rule evaluate as true and resolve when one of the conditions is no longer true. Un ejemplo de este tipo de regla de alerta sería supervisar una máquina virtual de Azure y generar una alerta si el porcentaje de CPU supera el 90 % y la longitud de la cola es de más de 300 elementos.An example for this type of alert rule would be to monitor an Azure virtual machine and alert when both "Percentage CPU is higher than 90%" and "Queue length is over 300 items".

Regla de alerta con el tipo de condición dinámicaAlert rule with dynamic condition type

Supongamos que ha creado una regla de alerta de métrica simple de umbrales dinámicos de la siguiente manera:Let's say you have created a simple Dynamic Thresholds metric alert rule as follows:

  • Recurso de objetivo (el recurso de Azure que quiere supervisar): myVMTarget Resource (the Azure resource you want to monitor): myVM
  • Métrica: Porcentaje de CPUMetric: Percentage CPU
  • Tipo de condición: DinámicaCondition Type: Dynamic
  • Agregación de tiempo (estadística que se ejecuta sobre valores de métrica sin procesar.Time Aggregation (Statistic that is run over raw metric values. Las agregaciones de tiempo compatibles son Min, Max, Avg, Total y Count): AverageSupported time aggregations are Min, Max, Avg, Total, Count): Average
  • Período (la ventana temporal según la cual se comprueban los valores de la métrica): En los últimos 5 minutosPeriod (The look back window over which metric values are checked): Over the last 5 mins
  • Frecuencia (es decir, la frecuencia con la que la alerta de métricas comprueba si se cumplen las condiciones): 1 minFrequency (The frequency with which the metric alert checks if the conditions are met): 1 min
  • Operador: Mayor queOperator: Greater Than
  • Sensibilidad: MediaSensitivity: Medium
  • Períodos de retroceso: 4Look Back Periods: 4
  • Número de infracciones: 4Number of Violations: 4

Una vez creada la regla de alerta, el algoritmo de aprendizaje automático de los umbrales dinámicos adquirirá los datos históricos disponibles, calculará el umbral que mejor se adapte al patrón de comportamiento de las series de métricas y aprenderá continuamente en función de los nuevos datos para que el umbral sea más preciso.Once the alert rule is created, the Dynamic Thresholds machine learning algorithm will acquire historical data that is available, calculate threshold that best fits the metric series behavior pattern and will continuously learn based on new data to make the threshold more accurate.

Desde el momento en que se crea la regla de alerta, el monitor se ejecuta cada minuto y examina los valores de métrica de los últimos 20 minutos agrupados en períodos de cinco minutos y comprueba si el promedio de los valores del período en cada uno de los cuatro períodos supera el umbral esperado.From the time the alert rule is created, the monitor runs every 1 min and looks at metric values in the last 20 minutes grouped into 5 minutes periods and checks if the average of the period values in each of the 4 periods exceeds the expected threshold. Si se cumple la condición, es decir, el porcentaje promedio de CPU en los últimos 20 minutos (cuatro períodos de cinco minutos) desviado cuatro veces del comportamiento esperado, la regla de alerta desencadena una notificación activada.If the condition is met that is, the average Percentage CPU in the last 20 minutes (four 5 minutes periods) deviated from expected behavior four times, the alert rule fires an activated notification. Si configuró un correo electrónico o una acción de webhook en el grupo de acciones asociado a la regla de alerta, recibirá una notificación activada en ambos recursos.If you have configured an email or a web hook action in the action group associated with the alert rule, you will receive an activated notification on both.

Visualización y resolución de alertas desencadenadasView and resolution of fired alerts

Los ejemplos anteriores de activación de regla de alerta también se pueden ver en Azure Portal, en la hoja Todas las alertas .The above examples of alert rules firing can also be viewed in the Azure portal in the All Alerts blade.

Digamos que el uso en "myVM" continúa estando por encima del umbral en las comprobaciones posteriores; por lo tanto, la regla de alerta no volverá a activarse hasta que se resuelvan las condiciones.Say the usage on "myVM" continues being above the threshold in subsequent checks, the alert rule will not fire again until the conditions are resolved.

Después de algún tiempo, si el uso en "myVM" vuelve a ser normal y a estar por debajo del umbral.After some time, the usage on "myVM" comes back down to normal (goes below the threshold). Debido a ello, la regla de alerta supervisa la condición dos veces más para enviar una notificación resuelta.The alert rule monitors the condition for two more times, to send out a resolved notification. La regla de alerta envía un mensaje resuelto o desactivado cuando la condición de alerta no se cumple durante tres períodos consecutivos, para así reducir el ruido en caso de que haya una oscilación en las condiciones.The alert rule sends out a resolved/deactivated message when the alert condition is not met for three consecutive periods to reduce noise in case of flapping conditions.

Cuando la notificación resuelta se envíe a través del webhook o del correo electrónico, el estado de la instancia de alerta (llamada estado de supervisión) de Azure Portal también se establecerá como Resuelta.As the resolved notification is sent out via web hooks or email, the status of the alert instance (called monitor state) in Azure portal is also set to resolved.

Usar las dimensionesUsing dimensions

Las alertas de métricas en Azure Monitor también admiten la supervisión de las combinaciones de valores de varias dimensiones con una regla.Metric alerts in Azure Monitor also support monitoring multiple dimensions value combinations with one rule. Aquí le explicaremos por qué debería usar combinaciones de varias dimensiones con la ayuda de un ejemplo.Let's understand why you might use multiple dimension combinations with the help of an example.

Supongamos que tiene un plan de App Service para su sitio web.Say you have an App Service plan for your website. Quiere supervisar el uso de la CPU en varias instancias de la aplicación o el sitio web.You want to monitor CPU usage on multiple instances running your web site/app. Puede hacerlo mediante una regla de alerta de métrica, tal como se indica a continuación:You can do that using a metric alert rule as follows:

  • Recurso de destino: myAppServicePlanTarget resource: myAppServicePlan
  • Métrica: Porcentaje de CPUMetric: Percentage CPU
  • Tipo de condición: estáticaCondition Type: Static
  • DimensionsDimensions
    • Instance = InstanceName1, InstanceName2Instance = InstanceName1, InstanceName2
  • Agregación de tiempo: AverageTime Aggregation: Average
  • Período: En los últimos 5 minutosPeriod: Over the last 5 mins
  • Frecuencia: 1 minFrequency: 1 min
  • Operador: GreaterThanOperator: GreaterThan
  • Umbral: 70Threshold: 70

Igual que antes, esta regla supervisa si el uso medio de la CPU durante los últimos 5 minutos supera el 70 %.Like before, this rule monitors if the average CPU usage for the last 5 minutes exceeds 70%. Sin embargo, con la misma regla puede supervisar dos instancias de su sitio web.However, with the same rule you can monitor two instances running your website. Cada instancia será supervisada individualmente y, por consiguiente, recibirá notificaciones de forma individual.Each instance will get monitored individually and you will get notifications individually.

Supongamos que tiene una aplicación web con una demanda masiva y es necesario agregar más instancias.Say you have a web app that is seeing massive demand and you will need to add more instances. La regla anterior únicamente supervisa dos instancias.The above rule still monitors just two instances. Sin embargo, puede crear una regla de la siguiente manera:However, you can create a rule as follows:

  • Recurso de destino: myAppServicePlanTarget resource: myAppServicePlan
  • Métrica: Porcentaje de CPUMetric: Percentage CPU
  • Tipo de condición: estáticaCondition Type: Static
  • DimensionsDimensions
    • Instancia: *Instance = *
  • Agregación de tiempo: AverageTime Aggregation: Average
  • Período: En los últimos 5 minutosPeriod: Over the last 5 mins
  • Frecuencia: 1 minFrequency: 1 min
  • Operador: GreaterThanOperator: GreaterThan
  • Umbral: 70Threshold: 70

Esta regla supervisará automáticamente todos los valores de la instancia, es decir,This rule will automatically monitor all values for the instance i.e puede supervisar sus instancias a medida que aparecen sin necesidad de modificar su regla de alerta de métrica nuevamente.you can monitor your instances as they come up without needing to modify your metric alert rule again.

Al supervisar varias dimensiones, las reglas de alertas de umbrales dinámicos pueden crear umbrales personalizados para cientos de series de métricas a la vez.When monitoring multiple dimensions, Dynamic Thresholds alerts rule can create tailored thresholds for hundreds of metric series at a time. Los umbrales dinámicos dan como resultado menos reglas de alertas que administrar y un ahorro de tiempo significativo en la administración y creación de reglas de alertas.Dynamic Thresholds results in fewer alert rules to manage and significant time saving on management and creation of alerts rules.

Supongamos que tiene una aplicación web con muchas instancias y no sabe cuál es el umbral más adecuado.Say you have a web app with many instances and you don't know what the most suitable threshold is. Las reglas anteriores siempre utilizarán el umbral del 70 %.The above rules will always use threshold of 70%. Sin embargo, puede crear una regla de la siguiente manera:However, you can create a rule as follows:

  • Recurso de destino: myAppServicePlanTarget resource: myAppServicePlan
  • Métrica: Porcentaje de CPUMetric: Percentage CPU
  • Tipo de condición: DinámicaCondition Type: Dynamic
  • DimensionsDimensions
    • Instancia: *Instance = *
  • Agregación de tiempo: AverageTime Aggregation: Average
  • Período: En los últimos 5 minutosPeriod: Over the last 5 mins
  • Frecuencia: 1 minFrequency: 1 min
  • Operador: GreaterThanOperator: GreaterThan
  • Sensibilidad: MediaSensitivity: Medium
  • Períodos de retroceso: 1Look Back Periods: 1
  • Número de infracciones: 1Number of Violations: 1

Esta regla supervisa si el uso medio de la CPU durante los últimos cinco minutos supera el comportamiento esperado para cada instancia.This rule monitors if the average CPU usage for the last 5 minutes exceeds the expected behavior for each instance. La misma regla que puede supervisar las instancias a medida que aparecen sin necesidad de volver a modificar la regla de alerta de métrica.The same rule you can monitor instances as they come up without needing to modify your metric alert rule again. Cada instancia obtendrá un umbral que se ajuste al patrón de comportamiento de las series de métricas y cambiará continuamente en función de los nuevos datos para hacer que el umbral sea más preciso.Each instance will get a threshold that fits the metric series behavior pattern and will continuously change based on new data to make the threshold more accurate. Igual que antes, cada instancia se supervisará individualmente y, por consiguiente, recibirá notificaciones de forma individual.Like before, each instance will be monitored individually and you will get notifications individually.

El aumento de los períodos de retroceso y del número de infracciones también puede permitir que las alertas de filtrado solo alerten sobre la definición de una desviación significativa.Increasing look-back periods and number of violations can also allow filtering alerts to only alert on your definition of a significant deviation. Más información sobre las opciones avanzadas de umbrales dinámicos.Learn more about Dynamic Thresholds advanced options.

Nota

Se recomienda elegir una Granularidad de agregación (período) mayor que la Frecuencia de evaluación , con el fin de reducir la probabilidad de que falte la primera evaluación de las series temporales agregadas en los casos siguientes:We recommend choosing an Aggregation granularity (Period) that is larger than the Frequency of evaluation , to reduce the likelihood of missing the first evaluation of added time series in the following cases:

  • Regla de alertas de métricas que supervisa varias dimensiones: Cuando se agrega una nueva combinación de valores de dimensión.Metric alert rule that monitors multiple dimensions – When a new dimension value combination is added
  • Regla de alertas de métricas que supervisa varios recursos: Cuando se agrega un nuevo recurso al ámbito.Metric alert rule that monitors multiple resources – When a new resource is added to the scope
  • Regla de alertas de métricas que supervisa una métrica que no se emite de manera continua (métrica dispersa): Cuando la métrica se emite después de un período de más de 24 horas en el que no se emitió.Metric alert rule that monitors a metric that isn’t emitted continuously (sparse metric) – When the metric is emitted after a period longer than 24 hours in which it wasn’t emitted

Supervisión a escala mediante alertas de métricas en Azure MonitorMonitoring at scale using metric alerts in Azure Monitor

Hasta ahora, ha visto cómo se puede usar una única alerta de métrica para supervisar una o varias series temporales de métricas relacionadas con un único recurso de Azure.So far, you have seen how a single metric alert could be used to monitor one or many metric time-series related to a single Azure resource. Con frecuencia, es posible que desee aplicar la misma regla de alertas a muchos recursos.Many times, you might want the same alert rule applied to many resources. Azure Monitor también permite supervisar varios recursos (del mismo tipo) utilizando una sola regla de alertas de métricas con los recursos que se encuentran en la misma región de Azure.Azure Monitor also supports monitoring multiple resources (of the same type) with one metric alert rule, for resources that exist in the same Azure region.

Esta característica se admite actualmente en las métricas de plataforma (no métricas personalizadas) de los siguientes servicios en las siguientes nubes de Azure:This feature is currently supported for platform metrics (not custom metrics) for the following services in the following Azure clouds:

ServicioService Public Azure (Azure público)Public Azure GovernmentGovernment ChinaChina
Máquinas virtuales1Virtual machines1 Yes NoNo NoNo
Bases de datos de SQL ServerSQL server databases Yes Yes Yes
Grupos elásticos de SQL ServerSQL server elastic pools Yes Yes Yes
Grupos de capacidad de NetApp FilesNetApp files capacity pools Yes Yes Yes
Volúmenes de NetApp FilesNetApp files volumes Yes Yes Yes
Almacenes de clavesKey vaults Yes Yes Yes
Azure Cache for RedisAzure Cache for Redis Yes Yes Yes
Dispositivos Data Box EdgeData box edge devices Yes Yes Yes

1 No se admite con las métricas de red de máquinas virtuales (Entrada de red total, Salida de red total, Flujos de entrada, Flujos de salida, Velocidad máxima de creación de flujos entrantes, Velocidad máxima de creación de flujos salientes).1 Not supported for virtual machine network metrics (Network In Total, Network Out Total, Inbound Flows, Outbound Flows, Inbound Flows Maximum Creation Rate, Outbound Flows Maximum Creation Rate).

El ámbito de supervisión se puede especificar con una sola alerta de métrica de tres formas distintas.You can specify the scope of monitoring by a single metric alert rule in one of three ways. Por ejemplo, respecto a las máquinas virtuales, el ámbito se puede especificar como:For example, with virtual machines you can specify the scope as:

  • una lista de máquinas virtuales (de una región de Azure) en una suscripcióna list of virtual machines (in one Azure region) within a subscription
  • todas las máquinas virtuales (de una región de Azure) en uno o varios grupos de recursos de una suscripciónall virtual machines (in one Azure region) in one or more resource groups in a subscription
  • todas las máquinas virtuales (de una región de Azure) en una suscripciónall virtual machines (in one Azure region) in a subscription

Nota

El ámbito de una regla de alerta de métrica de varios recursos debe contener al menos un recurso del tipo de recurso seleccionado.The scope of a multi-resource metric alert rule must contain at least one resource of the selected resource type.

La creación de reglas de alertas de métrica que supervisen varios recursos es similar a crear cualquier otra alerta de métrica que supervise un único recurso.Creating metric alert rules that monitor multiple resources is like creating any other metric alert that monitors a single resource. La única diferencia es que debe seleccionar todos los recursos que desea supervisar.Only difference is that you would select all the resources you want to monitor. Estas reglas también se pueden crear mediante las plantillas de Azure Resource Manager.You can also create these rules through Azure Resource Manager templates. Recibirá notificaciones diferentes de cada máquina virtual.You will receive individual notifications for each monitored resource.

Nota

En una regla de alerta de métrica que supervisa varios recursos solo se permite una condición.In a metric alert rule that monitors multiple resources, only one condition is allowed.

Latencia típicaTypical latency

En cuanto a las alertas de métricas, normalmente recibirá una notificación en menos de 5 minutos si configura la frecuencia de la regla de alerta en "1 min". En caso de que haya cargas pesadas en los sistemas de notificaciones, es posible que vea una latencia más larga.For metric alerts, typically you will get notified in under 5 minutes if you set the alert rule frequency to be 1 min. In cases of heavy load for notification systems, you might see a longer latency.

Tipos de recursos admitidos en las alertas métricasSupported resource types for metric alerts

En este artículo puede encontrar la lista completa de tipos de recursos admitidos.You can find the full list of supported resource types in this article.

Pasos siguientesNext steps