Check-list de révision de conception pour l’excellence opérationnelle

Cette liste de contrôle présente un ensemble de recommandations pour vous aider à créer une culture d’excellence opérationnelle. Commencez par une approche DevOps pour intégrer des spécialisations de plusieurs disciplines. Cette approche crée une pratique de conception et de développement rigoureuse. Cette approche aboutit à des déploiements reproductibles, fiables et sécurisés d’infrastructure et de code.

Hiérarchiser l’intervention humaine dans les domaines qui en bénéficient et intégrer l’automatisation dans d’autres domaines. L’observabilité sert l’excellence opérationnelle en surveillant les événements d’intégrité et en validant la conception et l’implémentation de la charge de travail actuelle pour informer le développement futur du produit.

Si vous n’envisagez pas de compromis et de recommandations pour l’excellence opérationnelle, votre charge de travail peut être en danger. Examinez attentivement les points abordés dans la liste de contrôle suivante pour inspirer confiance dans la réussite de votre conception.

Liste de contrôle

  Code Recommandation
OE :01 Déterminez les spécialisations des membres de l’équipe de charge de travail et intégrez-les à un ensemble robuste de pratiques pour concevoir, développer, déployer et exploiter votre charge de travail selon les spécifications. Les membres de l’équipe doivent avoir de la clarté dans la prise de décision et les responsabilités, valoriser l’amélioration et l’optimisation continues, et adopter une culture irréprochable qui intègre l’apprentissage continu.
OE :02 Formalisez la façon dont vous exécutez les tâches opérationnelles de routine, en fonction des besoins et d’urgence à l’aide de la documentation, des listes de contrôle ou de l’automatisation. S’efforcer de garantir la cohérence et la prévisibilité des processus et des livrables d’équipe en adoptant des pratiques et des approches de pointe, telles qu’une approche de décalage vers la gauche .
OE :03 Formaliser les processus d’idéation et de planification des logiciels. Tirez parti des normes établies de l’industrie et de l’organisation. Utilisez un backlog commun et hiérarchisé et des spécifications suffisamment détaillées. En fonction des résultats, améliorez continuellement votre processus de planification.
OE :04
OE :04
OE :04
Optimisez les processus de développement logiciel et d’assurance qualité en suivant des pratiques éprouvées dans le secteur en matière de développement et de test. Pour la désignation de rôle sans ambiguïté, standardisez les pratiques entre les composants tels que les outils, le contrôle de code source, les modèles de conception d’application, la documentation et les guides de style.
OE :05 Préparez les ressources et leurs configurations à l’aide d’une approche IaC (Infrastructure as code) standardisée. Comme d’autres codes, concevez IaC avec des styles cohérents, une modularisation appropriée et une assurance qualité. Préférez une approche déclarative lorsque cela est possible.
OE :06 Créez une chaîne d’approvisionnement de charge de travail qui pilote les modifications proposées via des pipelines prévisibles et automatisés. Les pipelines testent et font la promotion de ces modifications entre les environnements. Optimisez une chaîne d’approvisionnement pour rendre votre charge de travail fiable, sécurisée, économique et performante.
OE :07
OE :07
Concevez et implémentez un système de surveillance pour valider les choix de conception et éclairer les décisions futures en matière de conception et d’entreprise. Ce système capture et expose les données de télémétrie opérationnelles, les métriques et les journaux qui émettent à partir de l’infrastructure et du code de la charge de travail.
OE :08 Développer une pratique efficace des opérations d’urgence. Assurez-vous que votre charge de travail émet des signaux d’intégrité significatifs sur l’infrastructure et le code. Collectez les données obtenues et utilisez-les pour générer des alertes actionnables qui mettent en œuvre des réponses d’urgence via des tableaux de bord et des requêtes. Définissez clairement les responsabilités humaines, telles que les rotations sur appel, la gestion des incidents, l’accès aux ressources d’urgence et l’exécution de post-mortem.
OE :09 Automatiser toutes les tâches qui ne bénéficient pas des insights et de l’adaptabilité de l’intervention humaine, sont hautement procédurales et ont une durée de vie qui génère un retour sur investissement d’automatisation. Dans la mesure du possible, choisissez des logiciels prêts à l’emploi pour l’automatisation plutôt que des implémentations personnalisées. Traitez toute l’automatisation comme les composants de charge de travail et appliquez les piliers Well-Architected Framework à sa conception et à son implémentation.
OE :10 Concevez et implémentez l’automatisation à l’avance pour les opérations telles que les problèmes de cycle de vie, le démarrage et l’application de garde-fous de gouvernance et de conformité. N’essayez pas de moderniser l’automatisation ultérieurement. Choisissez les fonctionnalités d’automatisation fournies par votre plateforme.
OE :11 Définissez clairement les pratiques de déploiement sécurisées de votre charge de travail. Mettez l’accent sur les idéaux des méthodes de mise en production de petite taille, incrémentielles et contrôlées par la qualité. Utilisez des modèles de déploiement modernes et des techniques d’exposition progressive pour contrôler les risques. Tenir compte des déploiements de routine et des déploiements d’urgence ou de correctif logiciel.
OE :12 Implémentez une stratégie d’atténuation des échecs de déploiement qui résout les problèmes inattendus à mi-déploiement avec une récupération rapide. Combinez plusieurs approches, telles que la restauration, la désactivation des fonctionnalités ou l’utilisation des fonctionnalités natives de votre modèle de déploiement.

Étapes suivantes

Nous vous recommandons de passer en revue les compromis de l’excellence opérationnelle pour explorer d’autres concepts.