Compartir vía


Lista de comprobación sobre la preparación de producción

¿La aplicación y el clúster están preparados para asumir el tráfico de producción? La ejecución y las pruebas de la aplicación y del clúster no significan necesariamente que todo esté listo para pasar a producción. Revise la siguiente lista de comprobación para que la aplicación y el clúster se ejecuten sin problemas. Se recomienda encarecidamente comprobar todos estos elementos. Obviamente, puede optar por usar soluciones alternativas para un elemento de línea específico (por ejemplo, sus propios marcos de diagnóstico).

Requisitos previos de producción

  1. Procedimientos recomendados de Azure Service Fabric: diseño de aplicaciones, seguridad, redes, planeamiento de la capacidad y escalado, infraestructura como código y supervisión y diagnóstico.
  2. Configure FabricTransport si usa el modelo de programación Reliable Actors y precisa de una comunicación segura entre servicios.
  3. Para los clústeres con más de 20 núcleos o 10 nodos, cree un tipo de nodo principal dedicado para los servicios del sistema. Agregue restricciones de colocación para reservar el tipo de nodo principal para los servicios del sistema.
  4. Use una SKU D2v2 o una versión superior para el tipo de nodo principal. Se recomienda seleccionar una SKU con 50 GB de capacidad de disco duro como mínimo.
  5. Los clústeres de producción deben ser seguros. Para obtener un ejemplo de cómo configurar un clúster seguro, consulte esta plantilla del clúster. Use nombres comunes para los certificados y evite el uso de certificados autofirmados.
  6. Agregue restricciones de recursos en contenedores y servicios, de modo que no consuman más del 75 % de los recursos del nodo.
  7. Conozca y establezca el nivel de durabilidad. Se recomienda el nivel de durabilidad Silver o superior para los tipos de nodos que ejecutan cargas de trabajo con estado, y es necesaria para producción.
  8. Comprenda y seleccione el nivel de confiabilidad del tipo de nodo. Se recomienda una confiabilidad Silver o superior, y es necesaria para producción.
  9. Cargue las cargas de trabajo y pruebe de escalarlas para identificar los requisitos de capacidad para el clúster.
  10. Mediante las alertas, se supervisan los servicios y las aplicaciones y se generan y almacenan registros de aplicaciones. Por ejemplo, consulte Adición del registro a la aplicación de Service Fabric y Supervisión de contenedores con los registros de Azure Monitor.
  11. El clúster se supervisa con alertas (por ejemplo, con registros de Azure Monitor).
  12. La infraestructura del conjunto de escalado de máquinas virtuales subyacente se supervisa mediante alertas (por ejemplo, con registros de Azure Monitor).
  13. El clúster siempre tiene certificados principales y secundarios (para que no experimente bloqueos).
  14. Mantenga clústeres independientes para el desarrollo, el ensayo y la producción.
  15. Las actualizaciones de la aplicación y las actualizaciones del clúster primero se prueban en clústeres de desarrollo y ensayo.
  16. Desactive las actualizaciones automáticas en los clústeres de producción y actívelas para los clústeres de desarrollo y ensayo (reviértalo según sea necesario).
  17. Establezca un objetivo de punto de recuperación (RPO) para el servicio y configure un proceso de recuperación ante desastres y pruébelo.
  18. Planee el escalado del clúster manualmente o mediante programación.
  19. Planee la revisión de los nodos de clúster.
  20. Establezca una canalización de CI/CD para que los cambios más recientes se prueben continuamente. Por ejemplo, con Azure DevOps o Jenkins
  21. Pruebe los clústeres de desarrollo y ensayo con carga con el servicio de análisis de errores e inducza caos controlado.
  22. Planee el escalado de las aplicaciones.

Si usa el modelo de programación de Reliable Services o Reliable Actors de Service Fabric, deben comprobarse los elementos siguientes:

  1. Actualice las aplicaciones durante el desarrollo local para comprobar que el código de servicio respeta el token de cancelación en el método RunAsync y cierra los agentes de escucha de comunicación personalizada.
  2. Evite errores comunes al utilizar Reliable Collections.
  3. Supervise los contadores de rendimiento de memoria de CLR de .NET al ejecutar pruebas de carga y busque tasas altas de crecimiento descontrolado en el montón o de recolección de elementos no utilizados.
  4. Mantenga la copia de seguridad sin conexión de Reliable Services y Reliable Actors y pruebe el proceso de restauración.
  5. Idealmente, el número de instancias de máquina virtual de NodeType principal debe ser igual al mínimo para el nivel de confiabilidad de clústeres; las condiciones cuando es adecuado exceder el mínimo del nivel incluyen las siguientes: temporalmente cuando se escala de manera vertical la SKU del conjunto de escalado de máquinas virtuales de NodeTypes principal.

Procedimientos recomendados opcionales

Aunque las listas anteriores son requisitos previos para pasar a la producción, también deben considerarse los siguientes elementos:

  1. Conectar el modelo de estado de Service Fabric para ampliar los informes y la evaluación de estado integrada.
  2. Implementar un guardián personalizado que supervise la carga de la aplicación y de los informes para el equilibrio de recursos.

Pasos siguientes