Introduction

Effectué

Parfois, même si vous avez tout bien planifié, les choses tournent mal. Une organisation qui possède et gère des ressources informatiques doit planifier le pire et supposer que ce scénario finira par arriver. La planification d’un sinistre et la reprise d’activité après sinistre constituent l’une des facettes essentielles de la gestion informatique.

Les plateformes cloud modernes fournissent un large éventail d’outils visant à aider les organisations à se préparer à des circonstances défavorables dans le but d’atténuer leurs effets le moment venu. Des services de sauvegarde basés sur le cloud, par exemple, peuvent créer des réplicas des données stockées localement pour permettre de restaurer ces données si elles sont supprimées, endommagées ou détruites. Des ressources IaaS telles que des machines virtuelles et des charges de travail SQL peuvent être également sauvegardées. Certains services PaaS disposent de sauvegardes automatiques. Azure SQL Database, par exemple, crée des sauvegardes complètes une fois par semaine, des sauvegardes différentielles toutes les 12 heures et des sauvegardes des journaux de transactions à quelques minutes d’intervalle. Ces sauvegardes sont stockées dans un stockage géoredondant qui est répliqué dans un centre de données associé. Les bases de données perdues ou endommagées sont facilement restaurées à partir de sauvegardes effectuées au moment de votre choix dans le passé.

La perte de données n’est pas le seul « sinistre » que les professionnels de l’informatique doivent prendre en compte dans leur planification. Un plan complet de reprise d’activité après sinistre garantit également la continuité de l’activité, par exemple, en redirigeant (« par basculement ») les demandes vers un emplacement secondaire lorsqu’une application cesse de répondre ou si une région entière d’un cloud public subit une panne. Là encore, le cloud peut aider en proposant la reprise d’activité en tant que service (DRaaS). Aujourd’hui, l’objectif de l’architecture des systèmes est d’éviter toute dépendance envers tout élément susceptible de devenir un point de défaillance unique. Il s’agit du principe fondamental de résilience : autoriser et même planifier un degré raisonnable de défaillance au sein du système, tout en maintenant des niveaux de service acceptables pour une organisation et ses clients.

Dans ce module, nous allons commencer par voir une explication complète des bogues, des erreurs et des échecs. Nous présenterons ensuite les techniques de réplication permettant de sauvegarder les applications, les services et les données afin de réduire au maximum les risques de perte pour l’entreprise et nous examinerons les services de sauvegarde proposés par les principaux fournisseurs de cloud. À partir de là, nous nous intéresserons à la reprise d’activité après sinistre, à la DRaaS et aux mécanismes permettant d’assurer la continuité de l’activité. Enfin, nous verrons en quoi les principes de résilience appliqués au cloud computing modifient les approches adoptées par les organisations en matière de préparation, en remplaçant les mesures réactives par d’autres proactives.

Objectifs d’apprentissage

  • Comprendre la signification de la « tolérance de panne »
  • Lister les techniques réactives employées pour parvenir à la tolérance de panne sur les plateformes cloud
  • Lister les techniques réactives permettant de profiter de la tolérance de panne sur les plateformes cloud
  • Comprendre les services de sauvegarde proposés par les principaux fournisseurs de cloud
  • Comprendre le rôle joué par les services de sauvegarde quand il s’agit de répondre à un sinistre et de procéder à une reprise d’activité
  • Expliquer la différence entre les services de sauvegarde et les services de reprise d’activité
  • Lister les objectifs de niveau de service qui animent la planification de la reprise d’activité
  • Lister les services de reprise d’activité proposés par les principaux fournisseurs de services cloud
  • Expliquer ce qu’est la résilience et comment elle est mesurée
  • Expliquer en quoi la résilience contribue à la continuité de l’activité

Prérequis

  • Comprendre ce qu’est le cloud computing, y compris les modèles de service cloud et les fournisseurs de cloud courants
  • Connaître les différents types de cloud (public, privé, hybride)
  • Reconnaître les modèles de services cloud comme IaaS, PaaS et SaaS et les différencier
  • Comprendre le fonctionnement du provisionnement des ressources cloud
  • Savoir comment fonctionnent les centres de données et comment les données sont stockées dans le cloud
  • Comprendre les principes de base de la sécurité dans le cloud