Share via


Administración de clústeres de plataformas de aplicaciones modernas

Cloud Adoption Framework proporciona una metodología básica para definir procesos de administración de operaciones para la nube en un sentido independiente. Su guía ayuda a establecer una línea base de administración de operaciones y otras capas especializadas de operaciones. Esta guía también se aplica a las organizaciones que tienen una combinación de infraestructura como servicio (IaaS), plataforma como servicio (PaaS) y cargas de trabajo en contenedores. En este artículo se describe lo que necesita integrar en las operaciones existentes para preparar la administración de contenedores. También se resaltan las ventajas de la integración de Azure Kubernetes Service (AKS) en la estrategia de administración de contenedores.

Alineación empresarial para las necesidades de administración de operaciones

Los contenedores eliminan las dependencias de varias capas de infraestructura, lo que conduce a mejorar las funcionalidades de administración de operaciones. Para llevar a cabo estas mejoras operativas, es posible que tenga que revisar la estrategia general de administración en la nube, empezando por la alineación empresarial.

Para establecer los procedimientos adecuados de administración de operaciones, debe comprender cómo se utilizarán los contenedores en los planes de adopción de la nube y qué ventajas desea aprovechar de este cambio a cargas de trabajo en contenedores.

  • ¿Va a administrar varias soluciones tecnológicas, como contenedores, IaaS y PaaS, en la plataforma en la nube?
  • ¿Los equipos centralizados van a dar soporte técnico a las operaciones y la administración de la plataforma o el contenedor de AKS? ¿Esta responsabilidad se desplaza a los equipos de las cargas de trabajo individuales?
  • ¿Los equipos centralizados van a dar soporte técnico a las operaciones y la administración de las cargas de trabajo que se ejecutan en cada contenedor o pod? ¿Esta responsabilidad se desplaza a los equipos de las cargas de trabajo individuales?
  • ¿Usa contenedores para cargas de trabajo críticas?
  • ¿Solo usa contenedores para cargas de trabajo auxiliares o menos críticas para reducir costos?
  • ¿Qué importancia tienen el rendimiento y la confiabilidad de las cargas de trabajo individuales?
  • ¿Las aplicaciones de los contenedores son aplicaciones sin estado? ¿Necesita conservar el estado para proteger y recuperar las cargas de trabajo de los contenedores?

Estas preguntas básicas darán forma a la mejor manera de integrar los contenedores y AKS en la estrategia de administración de operaciones.

Base de referencia de operaciones

La implementación de una línea base de operaciones proporciona acceso centralizado a las herramientas necesarias para operar y administrar todos los recursos del entorno en la nube. Si no tiene una línea base de operaciones para los recursos que no están en contenedores, puede implementar la línea base de operaciones definida en la metodología de administración.

La línea base de operaciones debe incluir herramientas y configuraciones para proporcionar visibilidad, supervisión, cumplimiento operativo, optimización, protección y recuperación.

Línea base de administración de operaciones

La línea base de operaciones descrita en los artículos anteriores no proporciona soporte técnico para los contenedores o la plataforma de AKS. Sin embargo, proporcionará una base de herramientas que se puede extender para admitir contenedores, como Azure Monitor, Azure Backup y otras herramientas.

Si la mayor parte de su cartera en la nube se hospeda en contenedores, considere la posibilidad de incluir las operaciones especializadas de la plataforma en la sección siguiente en la línea base de operaciones.

Operaciones de la plataforma

A menos que esta implementación sea la primera o la única implementación de la organización en la nube, debe tener una línea base de operaciones. En esta sección se identifican algunas herramientas que puede que desee incluir para ayudar a administrar la implementación de contenedores o de AKS.

Inventario y visibilidad

Los supervisión de contenedores y clústeres de AKS usa las herramientas, los paneles y las alertas que se incluyen en la línea base de operaciones. Sin embargo, es posible que tenga que realizar más configuraciones para recuperar los datos de los contenedores desde las herramientas de supervisión de operaciones, como Azure Monitor para contenedores. Consulte Introducción a Azure Monitor para contenedores para recopilar los datos necesarios para agregar las operaciones de la plataforma de contenedores y AKS a la línea base de operaciones.

Una vez que haya configurado Azure Monitor para recopilar los datos de los contenedores, puede supervisar las siguientes áreas como parte de los procesos de administración centralizados:

  • Identificar los clústeres que se ejecutan en varias regiones, idealmente vinculados a una entrada del árbol de servicios e identificar los hechos principales de esos clústeres
    • Identificar el grupo de nodos del clúster, las redes y las topologías de almacenamiento de dichos clústeres
    • Identificar la versión de AKS y la estratificación de versiones de imágenes de nodo.
  • Identificar el uso de recursos del nodo del clúster (proceso, memoria y almacenamiento)
  • Identificar los contenedores que se ejecutan en los nodos y su contribución al uso del nodo
  • Conocer el comportamiento del clúster tanto con cargas medias como con las más pesadas. Este conocimiento puede ayudarle a identificar los requisitos de capacidad y determinar la carga máxima que el clúster puede admitir.
  • Configurar alertas para recibir notificaciones de manera proactiva o registrar el hecho de que el uso de la CPU y la memoria en nodos o contenedores supere los umbrales, o cuando se produzca un cambio del estado de mantenimiento en el clúster en la infraestructura o el acumulado de estado de los nodos.
  • Usar consultas para crear un conjunto común de alertas, paneles y un análisis detallado

Estos datos también ayudarán a los equipos de operaciones de la carga de trabajo al proporcionar información detallada sobre las cargas de trabajo que se ejecutan en la plataforma en contenedores:

  • Revisar el uso de recursos de las cargas de trabajo que se ejecutan en el host que no estén relacionadas con los procesos estándar que admite el pod.
  • Realice la integración con Prometheus para ver las métricas de la aplicación.
  • Supervise las cargas de trabajo de contenedor implementadas en AKS Engine de manera local y AKS Engine en Azure Stack.
  • Supervise las cargas de trabajo de contenedor implementadas en Red Hat OpenShift en Azure.
  • Supervise las cargas de trabajo de contenedor implementadas en Kubernetes habilitado para Azure Arc (versión preliminar).

Cumplimiento de operaciones

La revisión, la optimización y el ajuste de tamaño se producen en varios niveles diferentes en un entorno en contenedores. Los operadores pueden estar en una serie de equipos distintos, según el enfoque de operaciones deseado. Para mantener el cumplimiento de las operaciones, un operador supervisará el uso, cambiará el tamaño de los recursos para equilibrar el rendimiento y el costo y aplicará revisiones a los sistemas subyacentes para minimizar el riesgo y el desfase de la configuración. Las organizaciones de TI centrales tienden a ofrecer estas tareas como parte de la línea base de operaciones para las soluciones de IaaS y PaaS.

En un entorno en clúster de Azure, estas tareas se realizan en varios niveles: clúster de AKS, imagen del nodo y sistema operativo del nodo. Todas estas tareas de operaciones se vuelven más dependientes de una relación de comprensión y funcionamiento de las cargas de trabajo que se ejecutan en los clústeres o en grupos de nodos individuales. Las instrucciones siguientes le ayudarán a evaluar qué desea hacer y si desea hacerlo para operar en entornos en contenedores.

  • Si el dimensionamiento y la aplicación de revisiones del clúster de AKS, la imagen del nodo o el sistema operativo del nodo se entregan como parte de la canalización de implementación de la aplicación o dependen de la configuración o la arquitectura de la aplicación, es mejor desplazar el cumplimiento operativo al equipo de la carga de trabajo para un control granular. Dado que las cargas de trabajo suelen tener dependencias de las características de orquestación, este es el patrón más común, ya que un cambio inesperado de la versión de AKS o un cambio de la imagen del nodo podría ser catastrófico para la carga de trabajo o sus herramientas en tiempo de ejecución.
  • En el caso de los menos comunes clústeres centralizados, que admiten una cartera de cargas de trabajo y una variedad de aplicaciones, el equipo de operaciones centralizado puede seguir siendo responsable de las tareas de cumplimiento operativo; las siguientes guías le ayudarán a ofrecer esas tareas en los clústeres. La ejecución de estas tareas de forma periódica lleva a operaciones específicas de la plataforma. Existe un riesgo importante en un enfoque de operaciones central y se deben poner en funcionamiento pruebas cuidadosas de las actualizaciones en entornos de preproducción, claras y que cumplan el mantenimiento programado y planes de contingencia para las cargas de trabajo no compatibles. Una actualización incorrecta puede ser un único punto de error y, de igual forma, una carga de trabajo que no se pueda actualizar puede hacer que un clúster deje de ser compatible. Planee y administre los clústeres de varios inquilinos con la diligencia debida.

Para ambos tipos de clúster, siga las instrucciones sobre actualizaciones, imágenes de nodo y actualizaciones del sistema operativo del nodo que se indican a continuación:

Protección y recuperación

Los nodos de AKS son efímeros por naturaleza y, por lo tanto, no se realiza una copia de seguridad de tal forma que se puedan restaurar individualmente. La recuperación a partir de un incidente puede implicar volver a implementar las cargas de trabajo en un nuevo grupo de nodos o en un clúster nuevo completo, según el ámbito del incidente.

  • Opte por agregar un SLA de tiempo de actividad al clúster.
  • En el caso de los SLA más altos, es posible que también desee tener en cuenta los procedimientos recomendados de BCDR de varias regiones para proporcionar protección adicional.
  • Dado que los clústeres no deben contener el estado, la restauración externa del estado se controla mediante la guía de la línea base de operaciones existente. Si los clústeres tienen estado, asegúrese de seguir los procedimientos recomendados del operador para el almacenamiento y de tener una estrategia para la copia de seguridad y restauración de estos datos para una carga de trabajo determinada. El uso de herramientas como Velero es un ejemplo de operaciones específicas de la plataforma que amplían la línea base de operaciones.
    • Si la cartera de aplicaciones aplica el estado de forma incoherente, el equipo de operaciones central no debe intentar mantener ambas soluciones. En su lugar, normalice la cadena de herramientas de estado deseado para todos los contenedores, pero desplace la responsabilidad de las soluciones de recuperación alternativas a los equipos de operaciones de la carga de trabajo. Este enfoque otorga libertad de diseño a los desarrolladores, reduce los costos centrales y proporciona un incentivo de reducción de costos para que los equipos de las cargas de trabajo cumplan el estándar.

Operaciones con cargas de trabajo

La anterior sección de operaciones de la plataforma muestra una conversación común al administrar clústeres de AKS. ¿Los clústeres de Kubernetes son una plataforma tecnológica que se va a administrar de forma centralizada? ¿O son una herramienta de la carga de trabajo que debe ser administrada por los equipos que poseen cada una de las cargas de trabajo? Esa pregunta es diferente para las distintas organizaciones. La constante que se ha observado en la mayoría de las organizaciones es que los contenedores y AKS están diseñados para proporcionar a los equipos de la carga de trabajo mayor flexibilidad en el modo en que desean operar cada carga de trabajo y proporcionan características específicas para que las cargas de trabajo las usen en su arquitectura en beneficio de los propietarios y clientes de la aplicación.

Las operaciones de la carga de trabajo se pueden basar en las operaciones específicas de la plataforma y la línea base de operaciones existentes. También puede operar de forma segura un clúster de AKS mediante operaciones de carga de trabajo completamente descentralizadas. En cualquier caso, cuando necesite ir más allá de las operaciones para centrarse en los resultados específicos de una carga de trabajo específica, puede consultar Marco de buena arquitectura de Microsoft Azure y Revisión de buena arquitectura de Microsoft Azure para obtener una gran especificidad de los tipos de procesos operativos y las herramientas que se deben usar para la carga de trabajo.

Paso siguiente: La siguiente iteración de la migración

Una vez finalizada la migración a una plataforma de aplicaciones modernas, el equipo de adopción de la nube puede comenzar la siguiente migración específica del escenario. Como alternativa, si se van a migrar otras plataformas, puede usar de nuevo esta serie de artículos como guía para la siguiente migración o implementación de plataformas de aplicaciones modernas.