Высокий уровень доступности и аварийное восстановление SAP HANA в Azure (крупные экземпляры)SAP HANA Large Instances high availability and disaster recovery on Azure

Важно!

Эта документация не заменяет документацию по администрированию SAP HANA или примечания SAP.This documentation is no replacement of the SAP HANA administration documentation or SAP Notes. Предполагается, что читатель хорошо понимает принципы администрирования и эксплуатации SAP HANA, особенно принципы резервного копирования, восстановления, обеспечения высокой доступности и аварийного восстановления.It's expected that the reader has a solid understanding of and expertise in SAP HANA administration and operations, especially with the topics of backup, restore, high availability, and disaster recovery.

Очень важно выполнять шаги и процессы в собственной среде и собственных версиях и выпусках HANA.It's important that you exercise steps and processes taken in your environment and with your HANA versions and releases. Некоторые сведения, приведенные в этой документации, упрощены для более понятного общего представления и не предназначены для использования в качестве подробных действий для эксплуатационных справочников.Some processes described in this documentation are simplified for a better general understanding and are not meant to be used as detailed steps for eventual operation handbooks. Чтобы создать эксплуатационные справочники конкретной конфигурации, необходимо протестировать, выполнить и задокументировать процессы, связанные с ней.If you want to create operation handbooks for your configurations, you need to test and exercise your processes and document the processes related to your specific configurations.

Для работы критически важных серверов SAP HANA в Azure (крупные экземпляры) важно обеспечить высокий уровень доступности и реализовать стратегию аварийного восстановления.High availability and disaster recovery (DR) are crucial aspects of running your mission-critical SAP HANA on the Azure (Large Instances) server. Важно сотрудничать с SAP, системным интегратором или корпорацией Майкрософт, чтобы правильно создать архитектуру и реализовать подходящую стратегию обеспечения высокой доступности и аварийного восстановления.It's important to work with SAP, your system integrator, or Microsoft to properly architect and implement the right high-availability and disaster recovery strategies. Важно также учитывать целевую точку восстановления (RPO) и целевое время восстановления, характерные в среде.It's also important to consider the recovery point objective (RPO) and the recovery time objective, which are specific to your environment.

Корпорация Майкрософт поддерживает некоторые методы обеспечения высокого уровня доступности SAP HANA с помощью крупных экземпляров HANA.Microsoft supports some SAP HANA high-availability capabilities with HANA Large Instances. К этим возможностям относятся следующие:These capabilities include:

  • Репликация хранилища: Возможность системы хранения данных реплицировать все данные в другой стек крупных экземпляров HANA в другом регионе Azure.Storage replication: The storage system's ability to replicate all data to another HANA Large Instance stamp in another Azure region. SAP HANA работает независимо от этого метода.SAP HANA operates independently of this method. Эта функция представляет собой механизм аварийного восстановления по умолчанию для HANA (крупные экземпляры).This functionality is the default disaster recovery mechanism offered for HANA Large Instances.
  • Репликация системы HANA: Репликация всех данных в SAP HANA в отдельную систему SAP HANA.HANA system replication: The replication of all data in SAP HANA to a separate SAP HANA system. Целевое время восстановления уменьшается благодаря репликации данных с регулярными интервалами.The recovery time objective is minimized through data replication at regular intervals. SAP HANA поддерживает асинхронные, выполняющиеся в памяти синхронные и синхронные режимы.SAP HANA supports asynchronous, synchronous in-memory, and synchronous modes. Мы советуем использовать синхронный режим только для систем SAP HANA, расположенных в том же центре обработки данных или на расстоянии менее 100 км от него.Synchronous mode is used only for SAP HANA systems that are within the same datacenter or less than 100 km apart. В текущей архитектуре стеков крупных экземпляров HANA с помощью репликации системы HANA можно обеспечить высокую доступность в одном регионе.With the current design of HANA Large Instance stamps, HANA system replication can be used for high availability within one region only. Чтобы использовать репликацию системы HANA, нужен сторонний компонент обратного прокси-сервера или маршрутизации для конфигураций аварийного восстановления в другой регион Azure.HANA system replication requires a third-party reverse proxy or routing component for disaster recovery configurations into another Azure region.
  • Размещение автоматической отработки отказа: Решение локального восстановления после сбоя для SAP HANA, который является альтернативой для репликации системы HANA.Host auto-failover: A local fault-recovery solution for SAP HANA that's an alternative to HANA system replication. Если главный узел становится недоступным, вам нужно настроить один или несколько резервных узлов SAP HANA в режиме развертывания, и SAP HANA автоматически выполнит отработку отказа на резервный узел.If the master node becomes unavailable, you configure one or more standby SAP HANA nodes in scale-out mode, and SAP HANA automatically fails over to a standby node.

SAP HANA в Azure (крупные экземпляры) предлагается в двух регионах Azure, охватывающих четыре геополитических региона (США, Австралию, Европу и Японию).SAP HANA on Azure (Large Instances) is offered in two Azure regions in four geopolitical areas (US, Australia, Europe, and Japan). Два региона в пределах геополитической области, в которых размещены стеки крупных экземпляров HANA, подключены к отдельным выделенным сетевым каналам.Two regions within a geopolitical area that host HANA Large Instance stamps are connected to separate dedicated network circuits. Эти каналы используются в процессе репликации моментальных снимков хранилища и обеспечивают методы аварийного восстановления.These are used for replicating storage snapshots to provide disaster recovery methods. По умолчанию репликация не выполняется. Этот процесс настраивается в клиентах, которые заказали функциональные возможности аварийного восстановления.The replication is not established by default but is set up for customers who order disaster recovery functionality. Репликация хранилища зависит от использования моментальных снимков хранилища для крупных экземпляров HANA.Storage replication is dependent on the usage of storage snapshots for HANA Large Instances. Невозможно выбрать регион Azure в качестве региона аварийного восстановления, если он находится в другой геополитической области.It's not possible to choose an Azure region as a DR region that is in a different geopolitical area.

В таблице ниже приведены методы обеспечения высокого уровня доступности и аварийного восстановления и их сочетания, поддерживаемые на текущий момент.The following table shows the currently supported high availability and disaster recovery methods and combinations:

Сценарий, поддерживаемый крупными экземплярами HANAScenario supported in HANA Large Instances Вариант обеспечения высокого уровня доступностиHigh availability option Вариант аварийного восстановленияDisaster recovery option КомментарииComments
Один узелSingle node Недоступен.Not available. Конфигурация выделенного аварийного восстановления,Dedicated DR setup.
конфигурация многоцелевого аварийного восстановления.Multipurpose DR setup.
Автоматической отработки отказа узла: Горизонтальное масштабирование (с или без ожидания)Host auto-failover: Scale-out (with or without standby)
включая 1 + 1including 1+1
Возможно, если резервный узел становится активным.Possible with the standby taking the active role.
Переключением ролей управляет HANA.HANA controls the role switch.
Конфигурация выделенного аварийного восстановления,Dedicated DR setup.
конфигурация многоцелевого аварийного восстановления.Multipurpose DR setup.
Синхронизация аварийного восстановления с помощью репликации хранилища.DR synchronization by using storage replication.
Наборы томов HANA подключены ко всем узлам.HANA volume sets are attached to all the nodes.
Сайт аварийного восстановления должен иметь такое же число узлов.DR site must have the same number of nodes.
Репликация системы HANAHANA system replication Возможно в конфигурации с первичными или вторичными репликами.Possible with primary or secondary setup.
В случае отработки отказа вторичная реплика выполняет роль первичной.Secondary moves to primary role in a failover case.
Отработку отказа контролируют служба репликации системы HANA и ОС.HANA system replication and OS control failover.
Конфигурация выделенного аварийного восстановления,Dedicated DR setup.
конфигурация многоцелевого аварийного восстановления.Multipurpose DR setup.
Синхронизация аварийного восстановления с помощью репликации хранилища.DR synchronization by using storage replication.
Аварийное восстановление с помощью репликации системы HANA пока еще невозможно без использования сторонних компонентов.DR by using HANA system replication is not yet possible without third-party components.
Отдельный набор томов дисков подключен к каждому узлу.Separate set of disk volumes are attached to each node.
Только тома дисков вторичной реплики на рабочем сайте реплицируются в расположение аварийного восстановления.Only disk volumes of secondary replica in the production site get replicated to the DR location.
На сайте аварийного восстановления необходим один набор томов.One set of volumes is required at the DR site.

Под конфигурацией выделенного аварийного восстановления подразумевается конфигурация, в которой единица крупного экземпляра HANA на сайте аварийного восстановления не используется для выполнения другой рабочей нагрузки или непроизводственной системы.A dedicated DR setup is where the HANA Large Instance unit in the DR site is not used for running any other workload or non-production system. Единица является пассивной и развертывается только при выполнении аварийной отработки отказа.The unit is passive and is deployed only if a disaster failover is executed. Тем не менее этот вариант не является предпочтительным для многих клиентов.Though, this setup is not a preferred choice for many customers.

См. руководство по поддерживаемым сценариям HLI для получения сведений об Ethernet и изучения макета хранилища для вашей архитектуры.Refer HLI supported scenarios to learn storage layout and ethernet details for your architecture.

Примечание

Развертывания MCOD SAP HANA (несколько экземпляров HANA на одну единицу) в рамках сценариев с перекрытием можно использовать с методами обеспечения высокой доступности и аварийного восстановления, указанными в таблице.SAP HANA MCOD deployments (multiple HANA Instances on one unit) as overlaying scenarios work with the HA and DR methods listed in the table. Исключением является использование службы репликации системы HANA с отказоустойчивым кластером с автоматическим переходом на другой ресурс на базе Pacemaker.An exception is the use of HANA System Replication with an automatic failover cluster based on Pacemaker. В этом случае поддерживается только один экземпляр HANA на единицу.Such a case only supports one HANA instance per unit. При развертываниях SAP HANA MDC с несколькими клиентами подходят только методы обеспечения высокой доступности и аварийного восстановления без использования хранилища.For SAP HANA MDC deployments, only non-storage-based HA and DR methods work if more than one tenant is deployed. При развертывании одного клиента подходят все перечисленные методы.With one tenant deployed, all methods listed are valid.

Под конфигурацией многоцелевого аварийного восстановления подразумевается конфигурация на сайте аварийного восстановления, в которой единица крупного экземпляра HANA выполняет непроизводственную рабочую нагрузку.A multipurpose DR setup is where the HANA Large Instance unit on the DR site runs a non-production workload. В случае аварии необходимо завершить работу этой непроизводственной системы, подключить реплицированные в хранилище (дополнительные) наборы томов и запустить рабочий экземпляр HANA.In case of disaster, shut down the non-production system, mount the storage-replicated (additional) volume sets, and then start the production HANA instance. Большинство клиентов, использующих функции аварийного восстановления на основе крупных экземпляров HANA, применяет эту конфигурацию.Most customers who use the HANA Large Instance disaster recovery functionality use this configuration.

Дополнительные сведения о высоком уровне доступности SAP HANA см. в следующих источниках о SAP:You can find more information on SAP HANA high availability in the following SAP articles:

Рекомендации по сети для аварийного восстановления с помощью крупных экземпляров HANANetwork considerations for disaster recovery with HANA Large Instances

Чтобы воспользоваться преимуществами аварийного восстановления крупных экземпляров HANA, потребуется спроектировать сетевое подключение к двум регионам Azure.To take advantage of the disaster recovery functionality of HANA Large Instances, you need to design network connectivity to the two Azure regions. Нужно создать канал Azure ExpressRoute с подключением между локальной средой и основным регионом Azure и еще один канал с подключением между локальной средой и регионом аварийного восстановления.You need an Azure ExpressRoute circuit connection from on-premises in your main Azure region, and another circuit connection from on-premises to your disaster recovery region. Это позволит обеспечить работоспособность в случае возникновения проблемы с регионом Azure, в том числе с расположением маршрутизатора Microsoft Enterprise Edge Router (MSEE).This measure covers a situation in which there's a problem in an Azure region, including a Microsoft Enterprise Edge Router (MSEE) location.

В качестве дополнительной меры можно подключить все виртуальные сети Azure, подключенные к SAP HANA в Azure (крупные экземпляры) в одном из регионов, к каналу ExpressRoute, который соединяет крупные экземпляры HANA в другом регионе.As a second measure, you can connect all Azure virtual networks that connect to SAP HANA on Azure (Large Instances) in one region to an ExpressRoute circuit that connects HANA Large Instances in the other region. Благодаря такому перекрестному подключению службы, работающие в виртуальной сети Azure в регионе 1, могут подключаться к единицам крупных экземпляров HANA в регионе 2 и наоборот.With this cross connect, services running on an Azure virtual network in Region 1 can connect to HANA Large Instance units in Region 2, and the other way around. Это позволит устранить проблемы при выходе из обслуживания одного из расположений MSEE, используемых для установки подключения между локальным расположением и Azure.This measure addresses a case in which only one of the MSEE locations that connects to your on-premises location with Azure goes offline.

На рисунке ниже показаны варианты отказоустойчивой конфигурации аварийного восстановления:The following graphic illustrates a resilient configuration for disaster recovery cases:

Оптимальная конфигурация для аварийного восстановления

Прочие требования к использованию репликации крупных экземпляров HANA при аварийном восстановленииOther requirements with HANA Large Instances storage replication for disaster recovery

Ниже приведены дополнительные требования к конфигурации аварийного восстановления с помощью крупных экземпляров HANA.In addition to the preceding requirements for a disaster recovery setup with HANA Large Instances, you must:

  • Закажите номера SKU для SAP HANA в Azure (крупные экземпляры) того же размера, что и рабочие номера SKU, и разверните их в регионе аварийного восстановления.Order SAP HANA on Azure (Large Instances) SKUs of the same size as your production SKUs and deploy them in the disaster recovery region. На данный момент в клиентских развертываниях эти экземпляры используются для запуска непроизводственных экземпляров HANA.In the current customer deployments, these instances are used to run non-production HANA instances. Эти конфигурации называются конфигурациями многоцелевого аварийного восстановления.These configurations are referred to as multipurpose DR setups.

  • Закажите дополнительный объем хранилища на сайте аварийного восстановления для каждого номера SKU решения "SAP HANA в Azure (крупные экземпляры)", который вы хотите восстановить на сайте аварийного восстановления.Order additional storage on the DR site for each of your SAP HANA on Azure (Large Instances) SKUs that you want to recover in the disaster recovery site. Приобретение дополнительного объема позволит выделить тома хранилища.Buying additional storage lets you allocate the storage volumes. Вы сможете выделить тома, используемые при репликации хранилища из рабочего региона Azure в регион Azure аварийного восстановления.You can allocate the volumes that are the target of the storage replication from your production Azure region into the disaster recovery Azure region.

  • В случае, если вы настроили HSR на основном сайте и настраиваете репликацию на основе хранилища на сайте аварийного восстановления, необходимо приобрести дополнительную емкость хранилища на сайте аварийного восстановления, чтобы данные основных и дополнительных узлов реплицировались на этот сайт.In the case, where you have HSR setup on primary, and you setup storage based replication to the DR site, you must purchase additional storage at the DR site so both primary and secondary nodes data gets replicated to the DR site.

    Дальнейшие действияNext steps

  • См. Резервное копирование и восстановление.Refer Backup and restore.