Samenvatting

Voltooid

Planning en herstel na noodgevallen is een essentieel onderdeel van IT-activiteiten, of de systemen van een organisatie zich nu on-premises, in de cloud of een combinatie van beide bevinden. Openbare cloudplatforms bieden services voor het maken van back-ups van essentiële gegevens, het herstellen ervan als deze verloren zijn gegaan en het uitvoeren van een failover naar secundaire systemen wanneer de primaire systemen uitvallen en doorgaans de gevolgen van storingen beperken (en herstellen). Hierna volgen enkele van de belangrijkste concepten die in deze module worden behandeld:

  • Voor zover mogelijk moeten IT-systemen fouttolerant zijn. Een fouttolerant (FT) systeem is een systeem dat bij het optreden van fouten naar verwachting, of conform SLA-verwachtingen (Service Level Agreement) werkt.

  • Een manier om fouttolerantie te bereiken, is door het gebruik van reactieve methoden zoals taakreplicatie en herstelpunten.

  • Proactieve methoden, zoals resourcereplicatie en taakverdeling, kunnen ook bijdragen aan fouttolerantie.

  • Grote cloudplatforms bieden back-upservices die een veiligheidsnet tegen gegevensverlies bieden. Azure Backup is een voorbeeld van een cloud-gebaseerde back-upservice; AWS Backup is een ander voorbeeld.

  • Herstel na noodgevallen streeft naar bedrijfscontinuïteit door verkeer om te leiden naar secundaire systemen wanneer dat nodig is. Cloudserviceproviders zoals Amazon en Microsoft bieden Disaster-Recovery-as-a-Service (DRaaS) in de vorm van services zoals AWS CloudEndure en Azure Site Recovery.

  • Gangbare serviceniveaudoelstellingen die noodherstelplannen aansturen, zijn onder andere Recovery Point Objective (RPO), Recovery Time Objective (RTO) en retentieperiode.

  • Continuïteit is de geslaagde toepassing van aanbevolen procedures om een positief resultaat te krijgen bij een noodgeval. Een belangrijke factor in continuïteit is tolerantie.

  • Tolerantie kan worden gekwantificeerd met metrische gegevens zoals fouttolerantie, onderbrekingstolerantie en overlevingsvermogen. Het ResiliNets-model biedt een manier om tolerantie te codificeren.

  • De internationale standaard voor strategie voor bedrijfscontinuïteit is ISO 22301. Azure maakt gebruik van het Azure Resiliency Framework om ISO 22301-compatibiliteit te garanderen.

Een informatiesysteem is alleen tolerant wanneer de beheerders ervan naar een ideaal streven: dat informatiesystemen zich ontwikkelen als levende dingen, door middel van consistente verbetering en bewaking door zaken die daadwerkelijk echt zijn, geen robots. Geautomatiseerde processen dienen een positief doel, maar ze vormen geen vervanging voor actieve inspanningen.