Share via


Consideraciones de supervisión para cargas de trabajo de Azure VMware Solution

En este artículo se describe el área de diseño de supervisión de una carga de trabajo de Azure VMware Solution. Esta área se centra en los procedimientos recomendados de observabilidad. La guía está pensada para un equipo de operaciones. Microsoft, VMware y terceros proporcionan diversas herramientas que puede usar para supervisar la infraestructura y la aplicación. En este artículo se enumeran esas opciones.

Cada opción ofrece soluciones de supervisión con distintos grados de costos de licencia, opciones de integración, ámbito de supervisión y soporte técnico. Revise cuidadosamente los términos y condiciones aplicables antes de usar las herramientas.

Recopilación de datos de infraestructura

Impacto: Excelencia operativa

La supervisión de la carga de trabajo implica recopilar datos de Azure VMware Solution infraestructura y varios componentes de la solución de VMware. Azure VMware Solution se integra con el centro de datos definido por software (SDDC) de VMware, que ejecuta varios componentes nativos de la solución de VMware, como VMware Aria. Puede usar este conjunto de herramientas, incluidas las operaciones de VMware Aria, para administrar diversos aspectos de la infraestructura.  

Otra herramienta a su disposición es el estado de mantenimiento de VMware vSphere para Azure VMware Solution. Esta herramienta ayuda a garantizar que la detección y corrección proactivas de problemas se realicen continuamente en el entorno de Azure VMware Solution. En concreto, esta herramienta busca configuraciones incorrectas en la infraestructura de VMware vSphere y detecta cuellos de botella de rendimiento. También proporciona información sobre el uso de recursos y el rendimiento general del estado ambiental.

VMware Aria Operations for Networks le ayuda a lograr una visibilidad completa de la red, simplificar los procesos de solución de problemas y optimizar el rendimiento de la red.

Recomendaciones
  • Configure el estado de mantenimiento de VMware vSphere para obtener una vista general del estado de mantenimiento de la nube privada Azure VMware Solution.
  • Use herramientas de terceros como VMware Aria Suite para mejorar la visibilidad y el análisis de Azure VMware Solution infraestructura de red de nube privada.
  • Use herramientas de supervisión nativas de Azure, como:
    • Azure Monitor.
    • Operaciones de VMware Aria para la supervisión operativa.
    • Azure Policy y su panel asociado para la supervisión de cumplimiento.
    • Microsoft Defender for Cloud y Microsoft Sentinel para la supervisión de la seguridad.

Administración de registros y archivos

Impacto: Excelencia operativa

Para obtener datos de mantenimiento de los componentes de VMware Solution, necesita acceso a los registros que recopila el servicio syslog de VMware. Algunos ejemplos de componentes de solución son VMware ESXi, VMware vSAN, VMware NSX-T Data Center y VMware vCenter Server. Los registros de estos componentes están disponibles a través de Azure VMware Solution infraestructura. Un agente o extensión de Log Analytics envía registros de invitado en el nivel de máquina virtual (VM) a Log Analytics. En Azure VMware Solution, puede enviar los registros de Azure VMware Solution a un blob de almacenamiento nativo de Azure. Para enviar registros a un blob de almacenamiento, puede configurar reenviadores desde un servidor syslog centralizado o puede configurar el blob como destino en Azure Monitor. También es posible usar una herramienta nativa de Azure, como Azure Logic Apps o Azure Functions para reenviar registros. Puede usar estas herramientas para crear agentes de escucha para los registros entrantes de Azure VMware Solution y para enviar los registros a un blob de almacenamiento.

Los registros de archivado son una estrategia para reducir los costos de almacenamiento. Los blobs de Azure Storage y Log Analytics pueden transferir registros para el archivado a largo plazo. El uso de un blob de almacenamiento es la opción menos costosa. Pero Log Analytics tiene integraciones avanzadas para alertas, visualización, consulta y obtención de información basada en aprendizaje automático. Tenga en cuenta el presupuesto, los casos de uso funcionales y los casos de uso a largo plazo al elegir una solución.

Recomendaciones
  • Recopile registros del servicio syslog de VMware para obtener datos de mantenimiento de componentes de VMware Solution, como VMware ESXi, VMware vSAN, VMware NSX-T Data Center y VMware vCenter Server.
  • Configure herramientas como VMware Aria Operations for Logging para recopilar varios registros para las funcionalidades de consulta, análisis e informes.
  • Configure las duraciones de retención para enviar registros al almacenamiento a largo plazo para reducir el tiempo de consulta y ahorrar en los costos de almacenamiento.

Supervisión del sistema operativo invitado

Impacto: Excelencia operativa

Dentro del sistema operativo invitado, las métricas están disponibles para el uso del disco, el rendimiento de las aplicaciones, el uso de recursos del sistema y la actividad del usuario. Considere la posibilidad de usar Azure Arc para Azure VMware Solution (versión preliminar) para administrar recursos de infraestructura de VMware en Azure. Para más información, consulte Implementación de Azure Arc para Azure VMware Solution.

Recomendaciones
  • Habilite la administración de invitados e instale extensiones de Azure después de que Azure Arc ha habilitado la nube privada para servidores o Azure Arc para Azure VMware Solution (versión preliminar).
  • Instale agentes adicionales para recopilar datos para habilitar la administración y supervisión de invitados en Azure VMware Solution máquinas virtuales invitadas.  

Implementación de la supervisión de seguridad

Impacto: Seguridad, excelencia operativa

La supervisión de la seguridad es fundamental para detectar y responder a actividades anómalas. Las cargas de trabajo que se ejecutan en una nube privada Azure VMware Solution necesitan una supervisión de seguridad completa que abarque redes, recursos de Azure y la propia nube privada Azure VMware Solution. Puede centralizar los eventos de seguridad mediante la implementación de un área de trabajo de Microsoft Sentinel. Con esta integración, el equipo de operaciones puede ver, analizar y detectar incidentes de seguridad en el contexto de un panorama de amenazas organizativo más amplio.

Recomendaciones
  • Habilite Defender for Cloud en la suscripción de Azure que use para implementar la nube privada de Azure VMware Solution. Asegúrese de que, en el plan de Defender for Cloud, la configuración protección de cargas de trabajo en la nube (CWP) tiene un valor de ON para servidores.
  • Audite las acciones que realizan los usuarios con privilegios en la nube privada Azure VMware Solution. Para obtener más información, consulte Auditar el historial de actividad de las asignaciones de grupos en privileged identity management.
  • Integre Microsoft Sentinel con Defender for Cloud. Habilite su recopilador de datos para eventos de seguridad y conéctelo con Defender for Cloud.
  • Use soluciones de supervisión de seguridad de asociados validados en Azure VMware Solution.

Supervisión y análisis de redes

Impacto: Seguridad, excelencia operativa

El proceso de supervisión de red inspecciona todo el tráfico que entra y sale de la Azure VMware Solution nube privada. En Azure VMware Solution, la seguridad de red funciona en las capas de red y host.

Recomendaciones
  • Capture y supervise los registros de firewall de red que se implementan en la nube privada Azure VMware Solution. Supervise también los registros que se implementan en Azure cuando la aplicación se extiende a dispositivos nativos de Azure, como Azure Firewall o Azure Application Gateway. Para más información, consulte Integración del firewall en Azure VMware Solution.
  • Use Azure Firewall Libro o herramientas similares para supervisar métricas y registros comunes relacionados con los dispositivos de firewall.
  • Correlacione los registros de varios vectores de seguridad, como los vectores de identidad, redes e infraestructura.

Configuración y optimización de alertas

Impacto: excelencia operativa, optimización de costos

Al ejecutar cargas de trabajo en la nube privada Azure VMware Solution, debe supervisar eficazmente el rendimiento de la carga de trabajo. Por ejemplo, debe capturar registros, métricas y solicitudes de seguimiento para las capas de aplicación e infraestructura.

Las alertas pueden ayudarle a responder a los cambios en la línea base de rendimiento. También puede usar alertas para proporcionar información sobre los cambios de configuración o mantenimiento necesarios. Por ejemplo, puede recibir notificaciones cuando una clave expira, se pierde una conexión o existe el riesgo de superar la capacidad de un recurso.

Para que las alertas sean eficaces, configúrelas para notificar a los equipos responsable cuando se cumplan ciertas condiciones. Considere también la posibilidad de consolidar alertas para reducir el número de notificaciones individuales que se envían:

  • En lugar de emitir una alerta para cada máquina que tenga poco espacio, considere la posibilidad de consolidar alertas por hosts, grupos de recursos o clústeres.
  • Use este enfoque también con problemas de host, CPU y picos de almacenamiento.
  • Alertas base en ventanas de tiempo. Por ejemplo, si un host emite alertas durante un breve tiempo, puede suprimir las alertas según un umbral de tiempo definido. Por ejemplo, puede enviar una alerta solo después de que hayan transcurrido cinco minutos.
Recomendaciones
  • Analice y establezca líneas base basadas en datos de rendimiento.
  • Defina criterios de alerta pertinentes, como umbrales, niveles de gravedad o condiciones específicas.
  • Use el subsistema de eventos y alarmas de VMware vSphere para supervisar VMware vSphere y configurar desencadenadores.
  • Configure las alertas de Azure en Azure VMware Solution para responder a eventos en tiempo real.
  • Asegúrese de que las alertas están configuradas para que el espacio de demora del almacén de datos de VMware vSAN se mantenga en los niveles que exige el acuerdo de nivel de servicio (SLA).
  • Configure las alertas de resource health para obtener el estado de mantenimiento en tiempo real de la nube privada Azure VMware Solution.
  • Use herramientas de supervisión del rendimiento de aplicaciones (APM) para obtener información de rendimiento en el nivel de código de la aplicación.
  • Use una combinación de técnicas de supervisión, como transacciones sintéticas, supervisión de latidos y supervisión de puntos de conexión.
  • Priorice las alertas en función de su impacto en las operaciones o en la importancia de los sistemas afectados. Ajuste de alertas para desencadenar solo eventos significativos.
  • Para reducir el ruido y administrar eficazmente las alertas, use métodos para reducir el número de notificaciones individuales que se emiten.
  • Para minimizar la fatiga de alertas, emplee un mecanismo para notificar a las partes interesadas clave solo sobre eventos significativos.
  • Use canales de notificación como SMS, correo electrónico, notificaciones push y plataformas de colaboración como Microsoft Teams para asegurarse de que las alertas se entregan de forma eficaz.

Administrar costos

Impacto: Optimización de costos, Excelencia operativa

La supervisión de costos hace referencia a la capacidad de realizar un seguimiento de los costos asociados a la nube privada de Azure VMware Solution.

Recomendaciones
  • Use el subsistema de eventos y alarmas de VMware vSphere para supervisar VMware vSphere y configurar desencadenadores.
  • Configure alertas de Azure basadas en consultas de Log Analytics para Azure VMware Solution. Estas alertas ayudan al equipo de operaciones a responder a eventos esperados e inesperados en tiempo real.

Uso de herramientas de solución de problemas y depuración

Impacto: Optimización de costos, Excelencia operativa

Para depurar y solucionar problemas eficazmente de la aplicación, necesita registros, métricas e información asociada. Esta información incluye actividades de eventos para que pueda identificar, analizar y establecer conexiones entre eventos.

Recomendaciones
  • Configure el sistema para reenviar registros desde el servicio syslog de Azure VMware Solution a Log Analytics. Reenvíe todos los registros, métricas e información de diagnóstico pertinentes.
  • Configure un agente de servidor habilitado por Azure Arc en máquinas virtuales invitadas que se ejecutan dentro de la nube privada de Azure VMware Solution.

Uso de paneles

Impacto: Excelencia operativa

Los paneles de aplicaciones le ayudan a visualizar y supervisar el rendimiento, el estado y otras métricas de una aplicación:

  • Los informes de supervisión en los paneles le ayudan a realizar rápidamente el análisis de la causa principal y la solución de problemas. Los equipos de operaciones pueden usar estos paneles para ver todos los recursos clave que componen Azure VMware Solution en un solo panel.
  • Las métricas del panel proporcionan información sobre cómo afectan el comportamiento de las aplicaciones el código y la infraestructura.
  • Los objetos visuales ayudan a los equipos de soporte técnico al cliente a comprender el impacto de los cambios, el rendimiento y los problemas de disponibilidad en una aplicación.
  • Los indicadores de rendimiento benefician al liderazgo ejecutivo y a las partes interesadas empresariales. Estas herramientas informan a las decisiones que alinean el rendimiento de una aplicación con los objetivos empresariales. Por ejemplo, un ejecutivo puede supervisar el compromiso con los clientes revisando métricas como la disponibilidad del servicio, los tiempos de resolución de incidentes y los tiempos de respuesta promedio. Estas métricas ayudan a garantizar que la organización ofrezca servicios según su Acuerdo de Nivel de Servicio.

Además de ofrecer información, los paneles también pueden promover la transparencia y fomentar la colaboración, por ejemplo, al conceder a las partes interesadas adecuadas acceso a los paneles de la aplicación. Este acto cultiva una comprensión compartida del rendimiento de una aplicación. Esta práctica también permite a una organización tomar decisiones informadas. Como resultado, las partes interesadas pueden centrarse en la búsqueda de iniciativas cruciales que impulsan el negocio hacia delante.

Recomendaciones
  • Compile un panel de aplicación con Application Insights o Grafana. Conecte el panel a los orígenes de datos pertinentes que almacenan métricas del entorno de Azure VMware Solution.
  • Cree un libro de Azure como repositorio central para ejecutar normalmente consultas, métricas e informes interactivos.
  • Asegúrese de que el origen de datos se alinea con los requisitos de seguridad y cumplimiento.
  • Defina los controles de acceso y los permisos, como la autenticación de usuario y el control de acceso basado en roles. Asegúrese de que cada parte interesada tenga el acceso adecuado en función de su rol.
  • Realice revisiones de acceso periódicas para comprobar que el acceso de los usuarios está actualizado y alineado con los roles y responsabilidades actuales.

Pasos siguientes

Ahora que ha examinado los procedimientos recomendados de observabilidad en Azure VMware Solution, explore mecanismos, herramientas y perímetros que puede usar para proteger aún más las cargas de trabajo en el SDDC.

Use la herramienta de evaluación para evaluar las opciones de diseño.