Uso de Azure Monitor para enviar correos electrónicos sobre errores del Servicio de mantenimiento

Se aplica a: Windows Server 2022, Windows Server 2019, Windows Server 2016

Azure Monitor maximiza la disponibilidad y el rendimiento de las aplicaciones con una completa solución que permite recopilar, analizar y administrar datos telemétricos tanto en la nube como en entornos locales. Esta solución le ayudará a entender cómo funcionan las aplicaciones y le permitirá identificar de manera proactiva los problemas que les afectan y los recursos de los que dependen.

Esto resulta especialmente útil para el clúster hiperconvergido local. Con Azure Monitor integrado, podrá configurar el correo electrónico, el texto (SMS) y otras alertas para hacer ping cuando haya algún problema con el clúster (o cuando quiera marcar alguna otra actividad en función de los datos recopilados). A continuación, explicaremos brevemente cómo funciona Azure Monitor, cómo instalar Azure Monitor y cómo configurarlo para enviarle notificaciones.

Si usa System Center, consulte el módulo de administración de Espacios de almacenamiento Direct que supervisa los clústeres de Windows Server 2019 Windows Server 2016 Espacios de almacenamiento Direct.

Este módulo de administración incluye:

  • Supervisión del rendimiento y el estado del disco físico
  • Storage de estado y rendimiento de Node
  • Storage supervisión del rendimiento y el estado del grupo de servidores
  • Tipo de resistencia del volumen y estado de desduplicación

Descripción de Azure Monitor

Todos los datos recopilados por Azure Monitor pueden clasificarse en uno de los dos tipos fundamentales: métricas y registros.

  1. Las métricas son valores numéricos que describen algún aspecto de un sistema en un momento dado. Las métricas son ligeras y capaces de admitir escenarios de tiempo casi real. Verá los datos recopilados por Azure Monitor directamente en su página Información general de la Azure Portal.

image of metrics ingesting in metrics explorer

  1. Los registros contienen distintos tipos de datos organizados en grupos de registros, donde cada tipo tiene diferentes conjuntos de propiedades. Los datos de telemetría, como los eventos y los seguimientos, se almacenan como registros junto con los datos de rendimiento para poder analizarlos de forma combinada. Los datos de registro recopilados por Azure Monitor se pueden analizar con consultas que recuperan, consolidan y analizan rápidamente los datos recopilados. Puede crear y probar consultas mediante Log Analytics en Azure Portal y después analizar los datos directamente mediante estas herramientas o guardar las consultas para usarlas con las visualizaciones o las reglas de alertas.

image of logs ingesting in log analytics

A continuación se muestran más detalles sobre cómo configurar estas alertas.

Incorporación del clúster mediante Windows Admin Center

Con Windows Admin Center, puede incorporar el clúster a Azure Monitor.

Gif of onboarding cluster to Azure Monitor

Durante este flujo de incorporación, los pasos siguientes se están produciendo en primer lugar. Detallamos cómo configurarlos en detalle en caso de que desee configurar manualmente el clúster.

Configuración de Servicio de mantenimiento

Lo primero que debe hacer es configurar el clúster. Como sabe, el Servicio de mantenimiento mejora la supervisión diaria y la experiencia operativa de los clústeres que ejecutan Espacios de almacenamiento directo.

Como hemos visto anteriormente, Azure Monitor recopila registros de cada nodo que se está ejecutando en el clúster. Por lo tanto, tenemos que configurar el Servicio de mantenimiento para que escriba en un canal de eventos, que es:

Event Channel: Microsoft-Windows-Health/Operational
Event ID: 8465

Para configurar el Servicio de mantenimiento, ejecute:

get-storagesubsystem clus* | Set-StorageHealthSetting -Name "Platform.ETW.MasTypes" -Value "Microsoft.Health.EntityType.Subsystem,Microsoft.Health.EntityType.Server,Microsoft.Health.EntityType.PhysicalDisk,Microsoft.Health.EntityType.StoragePool,Microsoft.Health.EntityType.Volume,Microsoft.Health.EntityType.Cluster"

Al ejecutar el cmdlet anterior para establecer el estado Configuración, los eventos que queremos empezar a escribir en el canal de eventos Microsoft-Windows-Health/Operational.

Configuración de Log Analytics

Ahora que ha configurado el registro adecuado en el clúster, el siguiente paso es configurar correctamente Log Analytics.

Para proporcionar información general, Azure Log Analytics puede recopilar datos directamente de los equipos Windows físicos o virtuales del centro de datos u otro entorno en la nube en un único repositorio para un análisis y correlación detallados.

Para comprender la configuración compatible, revise los sistemas operativos Windows admitidos y la configuración del firewall de red.

Si no tiene una suscripción a Azure, cree una cuenta gratuita antes de empezar.

Inicio de sesión en Azure Portal

Inicie sesión en Azure Portal en https://portal.azure.com.

Crear un área de trabajo

Para obtener más detalles sobre los pasos que se indican a continuación, consulte la documentación de Azure Monitor.

  1. En Azure Portal, haga clic en Todos los servicios. En la lista de recursos, escriba Log Analytics. Cuando comience a escribir, la lista se filtrará en función de la entrada. Seleccione Log Analytics.

    Azure portal

  2. Haga clic en Crear y, a continuación, seleccione opciones para los elementos siguientes:

    • Escriba el nombre del nuevo área de trabajo de Log Analytics, como por ejemplo DefaultLAWorkspace.

    • Seleccione una suscripción a la que vincularlo en la lista desplegable si la opción predeterminada seleccionada no es adecuada.

    • Para Grupo de recursos, seleccione un grupo de recursos existente que contenga una o más máquinas virtuales de Azure.

      Create Log Analytics resource blade

  3. Después de proporcionar la información necesaria en el panel Área de trabajo de Log Analytics, haga clic en Aceptar.

Mientras se comprueba la información y se crea el espacio de trabajo, puede realizar un seguimiento de su progreso en Notificaciones en el menú.

Obtención de la clave y el identificador de área de trabajo

Antes de instalar Microsoft Monitoring Agent para Windows, necesita la clave y el identificador de área de trabajo para el área de trabajo de Log Analytics. El asistente de configuración necesita esta información para configurar el agente de la forma adecuada y asegurarse de que puede comunicarse correctamente con Log Analytics.

  1. En Azure Portal, haga clic en Todos los servicios, en la esquina superior izquierda. En la lista de recursos, escriba Log Analytics. Cuando comience a escribir, la lista se filtrará en función de la entrada. Seleccione Log Analytics.
  2. En la lista de áreas de trabajo de Log Analytics, seleccione DefaultLAWorkspace (creada antes).
  3. Seleccione Configuración avanzada.

    Log Analytics Advance Settings

  4. Seleccione Orígenes conectados y Servidores Windows.
  5. Encontrará los valores a la derecha de Id. del área de trabajo y Clave principal. Guarde ambos temporalmente y cópielos y péguelos en el editor que prefiera por ahora.

Instalación del agente en Windows

En los siguientes pasos se instala y configura Microsoft Monitoring Agent. Asegúrese de instalar este agente en cada servidor del clúster e indique que desea que el agente se ejecute en Windows inicio.

  1. En la página Servidores Windows, seleccione la versión de Descargar el agente de Windows que descargar según la arquitectura del procesador del sistema operativo Windows.
  2. Ejecute el programa de instalación para instalar al agente en el equipo.
  3. En la página principal, haga clic en Siguiente.
  4. En la página Términos de licencia, lea la licencia y haga clic en Acepto.
  5. En la página e Carpeta de destino, cambie o mantenga la carpeta de instalación predeterminada y haga clic en Siguiente.
  6. En la página Opciones de instalación del agente, elija la opción para conectar el agente a Azure Log Analytics y luego haga clic en Siguiente.
  7. En la página Azure Log Analytics, realice lo siguiente:
    1. Pegue el Id. del área de trabajo y la clave del área de trabajo (clave principal) que copió anteriormente. a. Si el equipo necesita comunicarse a través de un servidor proxy con el servicio de Log Analytics, haga clic en Avanzado y proporcione la dirección URL y el número de puerto del servidor proxy. Si el servidor proxy requiere autenticación, escriba el nombre de usuario y la contraseña para autenticar con el servidor proxy y, luego, haga clic en Siguiente.
  8. Haga clic en Siguiente cuando haya terminado de proporcionar las opciones de configuración necesarias.

    paste Workspace ID and Primary Key

  9. En la página Preparado para instalar, revise las opciones seleccionadas y haga clic en Instalar.
  10. En la página La configuración finalizó correctamente, haga clic en Finalizar.

Una vez completado el proceso, el Agente de administración de Microsoft aparece en el Panel de control. Puede revisar la configuración y comprobar que el agente esté conectado a Log Analytics. Al conectarse, en la pestaña Azure Log Analytics, el agente muestra un mensaje que indica: Microsoft Monitoring Agent se ha conectado correctamente al servicio Microsoft Log Analytics.

MMA connection status to Log Analytics

Para comprender la configuración compatible, revise los sistemas operativos Windows admitidos y la configuración del firewall de red.

Configuración de alertas mediante Windows Admin Center

En Windows Admin Center, puede configurar alertas predeterminadas que se aplicarán a todos los servidores del área de trabajo de Log Analytics.

A short video that shows a user configuring default alerts that will apply to all servers in your Log Analytics workspace.

Estas son las alertas y sus condiciones predeterminadas que puede modificar:

Nombre de la alerta Condición predeterminada
Uso de CPU Más de 85 % durante 10 minutos
Uso de la capacidad del disco Más de 85 % durante 10 minutos
Uso de memoria Memoria disponible inferior a 100 MB durante 10 minutos
Latido Menos de 2 latidos durante 5 minutos
Error crítico del sistema Cualquier alerta crítica en el registro de eventos del sistema del clúster
Alerta del Servicio de mantenimiento Cualquier error del servicio de mantenimiento del clúster

Una vez que configure las alertas en Windows Admin Center, puede ver las alertas en el área de trabajo de Log Analytics en Azure.

A short video that shows the user accessing the alerts in the log analytics workspace in Azure.

Durante este flujo de incorporación, los pasos siguientes se están produciendo en primer lugar. Detallamos cómo configurarlos en detalle en caso de que desee configurar manualmente el clúster.

Recopilación de datos de eventos y rendimiento

Log Analytics puede recopilar eventos de los registros de eventos de Windows, así como de los contadores de rendimiento que especifique para los informes y análisis a largo plazo, y actuar cuando se detecte una condición determinada. Siga estos pasos para configurar la colección de eventos desde el Registro de eventos de Windows, así como desde varios contadores de rendimiento comunes, para empezar.

  1. En Azure Portal, haga clic en Más servicios, en la esquina inferior izquierda. En la lista de recursos, escriba Log Analytics. Cuando comience a escribir, la lista se filtrará en función de la entrada. Seleccione Log Analytics.
  2. Seleccione Configuración avanzada.

    Log Analytics Advance Settings

  3. Seleccione Datos y, a continuación, Registros de eventos de Windows.
  4. Aquí, para agregar el canal de eventos del Servicio de mantenimiento, escriba el nombre que aparece a continuación y haga clic en el signo más + .
    Event Channel: Microsoft-Windows-Health/Operational
    
  5. En la tabla, compruebe los niveles de gravedad Error y Advertencia.
  6. Haga clic en Guardar en la parte superior de la página para guardar la configuración.
  7. Seleccione Windows Performance Counters (Contadores de rendimiento de Windows) para habilitar la recopilación de contadores de rendimiento en un equipo Windows.
  8. La primera vez que se configuran los contadores de rendimiento Windows para un área de trabajo de Log Analytics nueva, se ofrece la opción de crear rápidamente varios contadores comunes. Se muestran todos con una casilla junto a cada uno.
    Default Windows performance counters selected
    Haga clic en Agregar los contadores de rendimiento seleccionados. Se agregan con el valor preestablecido de un intervalo de ejemplo de recopilación de diez segundos.
  9. Haga clic en Guardar en la parte superior de la página para guardar la configuración.

Creación de alertas basadas en datos de registro

Si ha llegado hasta este paso, el clúster debería enviar los registros y contadores de rendimiento a Log Analytics. El siguiente paso es crear reglas de alertas que ejecutan automáticamente búsquedas de registros a intervalos regulares. Si los resultados de la búsqueda de registros coinciden con determinados criterios, se desencadena una alerta que le envía una notificación de correo electrónico o de texto. Vamos a explorar esto a continuación.

Creación de una consulta

En primer lugar, abra el portal de búsqueda de registros.

  1. En Azure Portal, haga clic en Todos los servicios. En la lista de recursos, escriba Monitor. Cuando comience a escribir, la lista se filtrará en función de la entrada. Seleccione Monitor.
  2. En el menú de navegación de Monitor, seleccione Log Analytics y, a continuación, seleccione un área de trabajo.

La forma más rápida de recuperar algunos datos con los que trabajar es con una consulta simple que devuelve todos los registros en una tabla. Escriba las consultas siguientes en el cuadro de búsqueda y haga clic en el botón de búsqueda.

Event

Se devuelven los datos en la vista de lista predeterminada y puede ver el número total de registros que se han devuelto.

Simple query

En el lado izquierdo de la pantalla está el panel de filtros que le permite agregar filtros a la consulta sin necesidad de modificarla directamente. Se muestran varias propiedades de registro para ese tipo de registro y puede seleccionar uno o más valores de propiedad para restringir los resultados de búsqueda.

Active la casilla situada junto a Error en EVENTLEVELNAME o escriba lo siguiente para limitar los resultados a los eventos de error.

Event | where (EventLevelName == "Error")

Filter

Una vez que haya realizado las consultas adecuadas para los eventos que le interesan, guárdelas para el paso siguiente.

Creación de alertas

Ahora, vamos a examinar un ejemplo de creación de una alerta.

  1. En Azure Portal, haga clic en Todos los servicios. En la lista de recursos, escriba Log Analytics. Cuando comience a escribir, la lista se filtrará en función de la entrada. Seleccione Log Analytics.

  2. En el panel izquierdo, seleccione Alertas y, a continuación, haga clic en Nueva regla de alertas en la parte superior de la página para crear una nueva alerta.

    Create new alert rule

  3. Como primer paso, en la sección Crear alerta, seleccione el área de trabajo de Log Analytics como el recurso, ya que se trata de una señal de alerta basada en el registro. Filtre los resultados seleccionando la Suscripción específica en la lista desplegable si tiene más de una, la cual contiene el área de trabajo de Log Analytics creada anteriormente. Filtre el Tipo de recurso seleccionando Log Analytics en la lista desplegable. Por último, seleccione el recursoDefaultLAWorkspace y haga clic en Listo.

    Create alert step 1 task

  4. En la sección Criterios de alerta, haga clic en Agregar criterios para seleccionar la consulta guardada y, a continuación, especifique la lógica que sigue la regla de alertas.

  5. Configure la alerta con la siguiente información: a. En la lista desplegable Basado en, seleccione Unidades métricas. Una medida de métricas creará una alerta por cada objeto de la consulta con un valor que supere el umbral especificado. b. Para Condición, seleccione Mayor que y especifique un umbral. c. A continuación, defina cuándo desencadenar la alerta. Por ejemplo, puede seleccionar Infracciones consecutivas y, en la lista desplegable, seleccionar Mayor que y escribir un valor de 3. d. En la sección Evaluation based on (Evaluación basada en), modifique el valor de Período a 30 minutos y el de Frecuencia a 5. La regla se ejecutará cada cinco minutos y devolverá los registros que se crearon dentro de los últimos 30 minutos desde la hora actual. El hecho de establecer el período de tiempo en una ventana más amplia justifica la posibilidad de latencia en los datos y garantiza que la consulta devuelve datos para evitar un falso negativo en aquellos casos en los que la alerta nunca se activa.

  6. Haga clic en Listo para finalizar la regla de alertas.

    Configure alert signal

  7. Ahora, en el segundo paso, proporcione un nombre para la alerta en el campo Nombre de la regla de alertas, como Alerta para todos los eventos de error. Especifique una Descripción con los detalles específicos de la alerta y seleccione Crítico (Gravedad 0) para el valor Gravedad de las opciones proporcionadas.

  8. Para activar inmediatamente la regla de alertas en la creación, acepte el valor predeterminado de Habilitar regla tras la creación.

  9. En el paso tercero y último, especifique un Grupo de acciones, lo que garantiza que se realizan las mismas acciones cada vez que se desencadena una alerta y se puede utilizar para cada regla que se define. Configure un nuevo grupo de acciones con la información siguiente: a. Seleccione Nuevo grupo de acciones y aparecerá el panel Agregar grupo de acciones. b. En Nombre del grupo deacciones , especifique un nombre como Operaciones de TI- Notificar y un nombre corto como itops-n. c. Compruebe que los valores predeterminados de Suscripción y Grupo de recursos son correctos. Si no es así, seleccione los valores correctos en la lista desplegable. d. En la sección Acciones, especifique un nombre para la acción, como Enviar correo electrónico y en Tipo de acción, seleccione Correo electrónico/SMS/Push/Voz en la lista desplegable. El panel de propiedades Correo electrónico/SMS/Push/Voz se abrirá a la derecha para proporcionar información adicional. e. En el panel Correo electrónico/SMS/Push/Voz, seleccione y configure sus preferencias. Por ejemplo, habilite Correo electrónico y proporcione una dirección SMTP de correo electrónico válida a la que entregar el mensaje. F. Haga clic en Aceptar para guardar los cambios.

    Create new action group

  10. Seleccione Aceptar para crear el grupo de acciones.

  11. Haga clic en Crear regla de alertas para finalizar la regla de alertas. Se iniciará la ejecución de inmediato.

    Complete creating new alert rule

Alerta de ejemplo

Como referencia, este es el aspecto de una alerta de ejemplo en Azure.

Gif of alert in Azure

A continuación se muestra un ejemplo del correo electrónico que enviará Azure Monitor:

Alert email example

Referencias adicionales