Información general sobre la resiliencia y la continuidad

¿Cómo garantiza Microsoft la continuidad empresarial si se produce un desastre u otra amenaza para la disponibilidad del servicio?

El equipo Enterprise administración de continuidad empresarial (EBCM) de Microsoft supervisa la administración de continuidad empresarial y las actividades de recuperación ante desastres en servicios Microsoft y ofertas en la nube. Los representantes de las unidades de negocio de Microsoft se coordinan con el equipo ebcm para desarrollar planes de continuidad empresarial y validar el cumplimiento de los requisitos de continuidad empresarial.

El ciclo de vida de administración de continuidad empresarial (BCM) es el núcleo de nuestra metodología BCM. Este proceso de tres fases está diseñado para ser adaptable para que pueda implementarse mediante una amplia variedad de modelos de negocio en Microsoft. Comienza con una fase de evaluación para identificar los procesos y objetivos críticos que deben incluirse en el programa de continuidad empresarial. La fase de evaluación también requiere un análisis de impacto empresarial (BIA). La fase de planeación se centra en desarrollar e implementar estrategias de recuperación y resistencia y documentarlas en planes oficiales de continuidad empresarial. Por último, la validación de capacidad prueba los planes de continuidad empresarial y sus implementaciones para comprobar la eficacia e identificar posibles mejoras.

Las estrategias de continuidad empresarial de los servicios en línea de Microsoft usan redundancia de hardware, red y centros de datos. La replicación de datos entre centros de datos proporciona alta disponibilidad y confiabilidad durante un incidente catastrófico. También aumenta la resistencia a incidentes mundanos, como errores aislados de hardware o daños en los datos.

¿Cómo prueba Microsoft la continuidad empresarial y los planes de recuperación ante desastres?

La directiva Enterprise Administración de continuidad empresarial (EBCM) de Microsoft estipula que todos los planes de continuidad empresarial y recuperación ante desastres de Microsoft deben probarse, actualizarse y revisarse anualmente. Los servicios en línea de Microsoft prueban sus planes de continuidad empresarial al menos anualmente según las directivas de EBCM. Después de crear y revisar los informes de acción para validar, pruebe los resultados e informe a las actualizaciones del plan en respuesta a los problemas detectados durante las pruebas.

Para validar las estrategias de resistencia y recuperación frente a una amplia gama de posibles incidentes, el programa EBCM define varias categorías de escenarios de prueba que afectan a las personas, las ubicaciones y la tecnología. El nivel de validación requerido para cada servicio se basa en la importancia del servicio, y los servicios más críticos reciben una validación más rigurosa. Cada equipo de servicio en línea de Microsoft prueba su plan de continuidad empresarial de acuerdo con las directrices de EBCM para medir la eficacia del plan y la preparación del equipo de servicio para ejecutar el plan.

Según las directrices de EBCM, las revisiones anuales de los planes de continuidad empresarial y la validación de capacidades deben tener lugar dentro de los 12 meses siguientes a la última revisión. La validación de capacidad debe incluir la revisión de la documentación de soporte técnico, como BIA, para garantizar que sigue siendo precisa. Microsoft pone a disposición de nuestros clientes los resultados de validación de funcionalidades para algunos servicios en línea de Microsoft a través de informes trimestrales.

¿Cómo garantizan los servicios en línea de Microsoft que la capacidad del sistema satisface la demanda?

La planeación de capacidad ayuda a los equipos de servicio a asignar los recursos necesarios para admitir la disponibilidad del servicio en línea de Microsoft. El planeamiento normal de la capacidad es necesario como parte del programa EBCM de Microsoft. Los equipos de servicio revisan los datos de capacidad durante las revisiones trimestrales y durante situaciones de emergencia que merecen más revisión de capacidad.

Cada equipo de servicio mantiene los datos sin procesar para la planeación de capacidad e incluye métricas como el procesamiento del sistema, la memoria y la capacidad de hardware. Las revisiones programadas usan un modelo de la capacidad actual del sistema y lo prueban según las necesidades proyectadas en situaciones de emergencia. Si el modelo indica deficiencias en la capacidad, los cambios propuestos en la capacidad del sistema se envían a la dirección del equipo de servicio para su revisión. Los ingenieros del equipo de servicio incorporan los cambios aprobados en un nuevo modelo antes de la implementación.

¿Cómo mantienen los servicios en línea de Microsoft la disponibilidad del servicio durante los errores rutinarios del sistema?

Los servicios en línea de Microsoft logran la resistencia del servicio a través de la arquitectura redundante, la replicación de datos y la comprobación automatizada de integridad. La arquitectura redundante implica la implementación de varias instancias de un servicio en hardware separados geográfica y físicamente, lo que proporciona mayor tolerancia a errores para los servicios en línea de Microsoft. La replicación de datos garantiza que siempre haya varias copias de datos de clientes en diferentes zonas de error, lo que permite que los datos críticos del cliente se recuperen si el cliente está dañado, perdido o incluso eliminado accidentalmente. La comprobación de integridad automatizada aumenta la disponibilidad de los datos restaurando automáticamente los datos afectados por muchos tipos de daños físicos o lógicos.

Los servicios en línea de Microsoft se auditan periódicamente para cumplir con las normativas y certificaciones externas. Consulte la siguiente tabla para la validación de controles relacionados con la resistencia y la continuidad.

Azure y Dynamics 365

Auditorías externas Section Fecha de informe más reciente
ISO 27001/27002

Declaración de aplicabilidad
Certificación
A.17.1: Continuidad de la seguridad de la información
A.17.2: Redundancias
2 de diciembre de 2020
ISO 22301

Certificación
Todos los controles 13 de mayo de 2020
SOC 1
SOC 2
SOC 3
BC-1: Planes de continuidad empresarial
BC-3: Procedimientos de continuidad empresarial y recuperación ante desastres
BC-4: pruebas bcdr
BC-7: Planes de continuidad del negocio del centro de datos
BC-8: Pruebas de continuidad empresarial del centro de datos
BC-9: Evaluación de resistencia de centros de datos
DS-5: Copia de seguridad de componentes de servicio clave
DS-6: redundancia de componentes críticos
DS-7: Replicación automática de datos de clientes
DS-8: Programación de copia de seguridad
DS-9: Procedimientos de restauración de copia de seguridad
DS-11: Copias de seguridad fuera del sitio
DS-14: Restauración automática de servicios al cliente
31 de marzo de 2021

Office 365

Auditorías externas Section Fecha de informe más reciente
FedRAMP CP-2: Plan de contingencia
CP-3: Curso de contingencia
CP-4: Pruebas del plan de contingencia
CP-6: sitio de almacenamiento alternativo
CP-7: Sitio de procesamiento alternativo
CP-9: Copia de seguridad del sistema de información
CP-10: Recuperación y reconstitución del sistema de información
24 de septiembre de 2020
ISO 27001/27002

Declaración de aplicabilidad
Certificación
A.17.1: Continuidad de la seguridad de la información
A.17.2: Redundancias
20 de abril de 2021
ISO 22301
Certificación
Todos los controles 18 de marzo de 2019
SOC 1
SOC 2
CA-49: Directivas de copia de seguridad
CA-50: Continuidad empresarial
CA-51: replicación de datos
24 de diciembre de 2020
SOC 3 CUEC-09: restauración de correo electrónico exo 24 de diciembre de 2020

Recursos