Восстановление в регионе с помощью зон доступности и геоагентного восстановления между регионами (Сетка событий Azure)

В этой статье описывается, как Сетка событий Azure поддерживает автоматическое восстановление в регионе определений ресурсов и данных сетки событий при сбое в регионе с зонами доступности. В нем также описывается, как Служба "Сетка событий" поддерживает автоматическое восстановление определений ресурсов сетки событий (без данных) в другой регион, когда сбой возникает в регионе с парным регионом.

Восстановление в регионе с помощью зон доступности

Зоны доступности Azure — это физически разделенные расположения в пределах одного региона Azure, которые устойчивы к локальным сбоям. Они подключены высокопроизводительной сетью с задержкой кругового пути менее 2 миллисекунда. Каждая зона доступности состоит из одного или нескольких центров обработки данных, оснащенных независимой мощностью, охлаждением и сетевой инфраструктурой. Если затрагивается одна зона, региональные службы, емкость и высокий уровень доступности поддерживаются оставшимися двумя зонами. Дополнительные сведения о зонах доступности см. в разделе "Регионы и зоны доступности". В этой статье также можно просмотреть список регионов с зонами доступности.

Определения ресурсов Сетки событий для разделов, системных тем, доменов и подписок на события и данных событий автоматически реплика между тремя зонами доступности (при наличии) в регионе. Если в одной из зон доступности произошел сбой, ресурсы сетки событий автоматически отработка отказа в другую зону доступности без вмешательства человека. В настоящее время вы не можете контролировать эту функцию (включить или отключить). Когда существующий регион начинает поддерживать зоны доступности, существующие ресурсы сетки событий будут автоматически отработки отказа, чтобы воспользоваться этой функцией. Вмешательство пользователя не требуется.

Диаграмма демонстрирует зоны доступности для защиты от локальных сбоев, региональных или глобальных катастроф благодаря использованию другого региона.

Геоизбыточное аварийное восстановление между регионами

Когда регион Azure испытывает длительный сбой, вам может потребоваться варианты отработки отказа в альтернативный регион для обеспечения непрерывности бизнес-процессов. Многие регионы Azure имеют геопары, а некоторые — нет. Список регионов, в которых есть парные регионы, см. в разделе "Пары между регионами Azure" реплика связывания для всех регионов.

Для регионов с геопарой сетка событий предоставляет возможность отработки отказа трафика публикации в парном регионе для пользовательских тем, системных тем и доменов. Сетка событий автоматически синхронизирует определения ресурсов, системные разделы, домены и подписки на события в парный регион. Однако данные событий не реплика в парный регион. В обычном состоянии события хранятся в выбранном регионе для этого ресурса. Когда происходит сбой в регионе, и корпорация Майкрософт инициирует отработку отказа, новые события начинают поступать в геопарный регион и отправляются оттуда без вмешательства. События, опубликованные и принятые в исходном регионе, отправляются туда после устранения сбоя.

Корпорация Майкрософт инициирует отработку отказа в редких случаях. Это делается, чтобы выполнить отработку отказа ресурсов Сетки событий из затронутого региона в соответствующий географически связанный регион. Корпорация Майкрософт оставляет за собой право определить, когда этот параметр будет использоваться. Отработка отказа трафика пользователя с помощью этого механизма не требует согласия этого пользователя.

Эту функцию можно включить или отключить, обновив конфигурацию для раздела или домена. Выберите параметр cross-Geo (по умолчанию), чтобы включить отработку отказа, инициированную корпорацией Майкрософт, и региональные параметры, чтобы отключить ее. Подробные инструкции по настройке этого параметра см. в разделе "Настройка расположения данных". Если вы выберете региональный регион, данные любого рода не реплика в другой регион корпорацией Майкрософт, и вы можете определить собственный план аварийного восстановления. Дополнительные сведения см. в разделе Создание собственного плана аварийного восстановления для разделов и доменов Сетки событий Azure.

Снимок экрана: страница

Ниже приведены некоторые причины, по которым вы хотите отключить функцию отработки отказа, инициированную корпорацией Майкрософт:

  • Отработка отказа, инициированная корпорацией Майкрософт, выполняется на основе лучших усилий.
  • Некоторые геопары не соответствуют требованиям к месту расположения данных вашей организации.

В таких случаях рекомендуется создать собственный план аварийного восстановления для Сетка событий Azure тем и доменов. Хотя этот параметр требует немного больше усилий, он позволяет ускорить отработку отказа, и вы управляете выбором дополнительных регионов. Если вы хотите реализовать аварийное восстановление на стороне клиента для Сетка событий Azure разделах, см. статью "Создание собственного аварийного восстановления на стороне клиента" для Сетка событий Azure разделов.

RTO и RPO

Аварийное восстановление оценивается по двум метрикам:

  • Цель точки восстановления (RPO): минуты или часы данных, которые могут быть потеряны.
  • Цель времени восстановления (RTO): минуты или часы, которые служба может быть отключена.

Автоматическая отработка отказа Сетки событий имеет различные RPOs и ОСРВ для метаданных (темы, домены, подписки на события) и данные (события). Если вам нужна другая спецификация из следующих, вы по-прежнему можете реализовать собственную отработку отказа на стороне клиента с помощью API работоспособности раздела.

Целевая точка восстановления (RPO)

  • RPO для метаданных: 0 минут. Для применимых ресурсов при создании или обновлении или удалении ресурса определение ресурса синхронно реплика с геопарой. При отработке отказа метаданные никогда не теряются.

  • RPO данных: при отработки отказа новые данные обрабатываются из парного региона. Как только сбой устраняется для затронутого региона, оттуда отправляются необработанные события. Если для восстановления региона требуется больше времени, чем значение времени в реальном времени , заданное для событий, данные могут быть удалены. Чтобы устранить эту потерю данных, рекомендуется настроить назначение недоставленных писем для подписки на события. Если затронутая область потеряна и неустранима, произойдет некоторая потеря данных. В лучшем случае подписчик следит за скоростью публикации и теряется всего несколько секунд данных. Худшим сценарием будет ситуация, когда подписчик не активно обрабатывает события и с максимальным временем жизни в течение 24 часов, потеря данных может составлять до 24 часов.

Целевое время восстановления (RTO)

  • RTO метаданных: принятие решений по отработке отказа основано на таких факторах, как доступная емкость в парном регионе, и может длиться в диапазоне от 60 минут или более. После запуска отработки отказа в течение 5 минут сетка событий начинает принимать вызовы создания и обновления и удаления для разделов и подписок.

  • RTO данных: аналогично приведенной выше информации.

Внимание

  • В случае аварийного восстановления на стороне сервера, если в парном регионе нет дополнительной емкости для передачи дополнительного трафика, сетка событий не может инициировать отработку отказа. Восстановление выполняется на основе лучших усилий.
  • Плата за использование этой функции не взимается.
  • Геоизбыточное аварийное восстановление не поддерживается для пространств имен партнеров и разделов партнеров.

Следующие шаги

См. статью "Создание собственного аварийного восстановления на стороне клиента" для Сетка событий Azure разделов.