Architektura odzyskiwania po awarii z platformy Azure do platformy Azure

W tym artykule opisano architekturę, składniki i procesy używane podczas wdrażania odzyskiwania po awarii dla maszyn wirtualnych platformy Azure przy użyciu usługi Azure Site Recovery . Dzięki konfiguracji odzyskiwania po awarii maszyny wirtualne platformy Azure są stale replikowane do innego regionu docelowego. Jeśli wystąpi awaria, możesz przejąć maszyny wirtualne w tryb failover do regionu pomocniczego i uzyskać do nich dostęp z tego miejsca. Gdy wszystko działa normalnie, możesz wrócić po awarii i kontynuować pracę w lokalizacji podstawowej.

Składniki architektury

Składniki związane z odzyskiwaniem po awarii dla maszyn wirtualnych platformy Azure zostały podsumowane w poniższej tabeli.

Składnik Wymagania
Maszyny wirtualne w regionie źródłowym Co najmniej jedna maszyna wirtualna platformy Azure w obsługiwanym regionie źródłowym.

Maszyny wirtualne mogą uruchamiać dowolny obsługiwany system operacyjny.
Źródłowy magazyn maszyn wirtualnych Maszyny wirtualne platformy Azure mogą być zarządzane lub mają dyski niezarządzane na kontach magazynu.

Dowiedz się więcej o obsługiwanym magazynie platformy Azure.
Źródłowe sieci maszyn wirtualnych Maszyny wirtualne mogą znajdować się w co najmniej jednej podsieci w sieci wirtualnej w regionie źródłowym. Dowiedz się więcej o wymaganiach dotyczących sieci.
Konto magazynu pamięci podręcznej Potrzebujesz konta magazynu pamięci podręcznej w sieci źródłowej. Podczas replikacji zmiany maszyn wirtualnych są przechowywane w pamięci podręcznej przed wysłaniem do magazynu docelowego. Konta magazynu pamięci podręcznej muszą mieć wartość Standardowa.

Użycie pamięci podręcznej zapewnia minimalny wpływ na aplikacje produkcyjne uruchomione na maszynie wirtualnej.

Dowiedz się więcej o wymaganiach dotyczących magazynu pamięci podręcznej.
Zasoby docelowe Zasoby docelowe są używane podczas replikacji i w przypadku przejścia w tryb failover. Usługa Site Recovery może domyślnie skonfigurować zasób docelowy lub można je utworzyć/dostosować.

W regionie docelowym sprawdź, czy możesz utworzyć maszyny wirtualne i czy twoja subskrypcja ma wystarczającą ilość zasobów do obsługi rozmiarów maszyn wirtualnych potrzebnych w regionie docelowym.

Diagram showing source and target replication.

Zasoby docelowe

Po włączeniu replikacji dla maszyny wirtualnej usługa Site Recovery umożliwia automatyczne tworzenie zasobów docelowych.

Zasób docelowy Ustawienie domyślne
Subskrypcja docelowa Tak samo jak subskrypcja źródłowa.
Docelowa grupa zasobów Grupa zasobów, do której należą maszyny wirtualne po przejściu w tryb failover.

Może znajdować się w dowolnym regionie świadczenia usługi Azure z wyjątkiem regionu źródłowego.

Usługa Site Recovery tworzy nową grupę zasobów w regionie docelowym z sufiksem "asr".
Docelowa sieć wirtualna Sieć wirtualna, w której znajdują się replikowane maszyny wirtualne po przejściu w tryb failover. Mapowanie sieci jest tworzone między źródłowymi i docelowymi sieciami wirtualnymi i odwrotnie.

Usługa Site Recovery tworzy nową sieć wirtualną i podsieć z sufiksem "asr".
Docelowe konto magazynu Jeśli maszyna wirtualna nie używa dysku zarządzanego, jest to konto magazynu, do którego są replikowane dane.

Usługa Site Recovery tworzy nowe konto magazynu w regionie docelowym w celu dublowania źródłowego konta magazynu.
Dyski zarządzane repliki Jeśli maszyna wirtualna używa dysku zarządzanego, jest to dyski zarządzane, do których są replikowane dane.

Usługa Site Recovery tworzy dyski zarządzane repliki w regionie magazynu w celu dublowania źródła.
Docelowe zestawy dostępności Zestaw dostępności, w którym replikowane maszyny wirtualne znajdują się po przejściu w tryb failover.

Usługa Site Recovery tworzy zestaw dostępności w regionie docelowym z sufiksem "asr" dla maszyn wirtualnych znajdujących się w zestawie dostępności w lokalizacji źródłowej. Jeśli zestaw dostępności istnieje, zostanie użyty i nie zostanie utworzony nowy zestaw dostępności.
Docelowe strefy dostępności Jeśli region docelowy obsługuje strefy dostępności, usługa Site Recovery przypisuje ten sam numer strefy co używany w regionie źródłowym.

Zarządzanie zasobami docelowymi

Zasoby docelowe można zarządzać w następujący sposób:

  • Ustawienia docelowe można modyfikować podczas włączania replikacji. Należy pamiętać, że domyślna jednostka SKU dla maszyny wirtualnej regionu docelowego jest taka sama jak jednostka SKU źródłowej maszyny wirtualnej (lub następna najlepsza dostępna jednostka SKU w porównaniu ze źródłową jednostkę SKU maszyny wirtualnej). Lista rozwijana zawiera tylko odpowiednie jednostki SKU tej samej rodziny co źródłowa maszyna wirtualna (Gen 1 lub Gen 2).
  • Ustawienia docelowe można modyfikować po zakończeniu replikacji. Podobnie jak w przypadku innych zasobów, takich jak docelowa grupa zasobów, nazwa docelowa i inne, jednostka SKU maszyny wirtualnej regionu docelowego może być również aktualizowana po zakończeniu replikacji. Zasób, którego nie można zaktualizować, to typ dostępności (pojedyncze wystąpienie, zestaw lub strefa). Aby zmienić to ustawienie, należy wyłączyć replikację, zmodyfikować ustawienie, a następnie ponownie włączyć.

Zasady replikacji

Po włączeniu replikacji maszyny wirtualnej platformy Azure usługa Site Recovery tworzy nowe zasady replikacji z ustawieniami domyślnymi podsumowanymi w tabeli domyślnie.

Ustawienie zasad Szczegóły Wartość domyślna
Przechowywanie punktów odzyskiwania Określa, jak długo usługa Site Recovery przechowuje punkty odzyskiwania. Jeden dzień
Częstotliwość migawek spójnych na poziomie aplikacji Jak często usługa Site Recovery tworzy migawkę spójną na poziomie aplikacji. Zero godzin (wyłączone)

Zarządzanie zasadami replikacji

Ustawienia domyślnych zasad replikacji można zarządzać i modyfikować w następujący sposób:

  • Ustawienia można modyfikować podczas włączania replikacji.
  • Zasady replikacji można utworzyć w dowolnym momencie, a następnie zastosować je po włączeniu replikacji.

Uwaga

Wysoki okres przechowywania punktu odzyskiwania może mieć wpływ na koszt magazynu, ponieważ może być konieczne zapisanie większej liczby punktów odzyskiwania.

Spójność wielu maszyn wirtualnych

Jeśli chcesz, aby maszyny wirtualne były replikowane razem i współużytkowały punkty odzyskiwania spójne na poziomie awarii i aplikacji w trybie failover, możesz zebrać je razem w grupie replikacji. Spójność wielu maszyn wirtualnych ma wpływ na wydajność obciążeń i powinna być używana tylko dla maszyn wirtualnych z uruchomionymi obciążeniami, które wymagają spójności na wszystkich maszynach.

Migawki i punkty odzyskiwania

Punkty odzyskiwania są tworzone na podstawie migawek dysków maszyn wirtualnych wykonanych w określonym punkcie w czasie. Podczas przełączania maszyny wirtualnej w tryb failover należy użyć punktu odzyskiwania, aby przywrócić maszynę wirtualną w lokalizacji docelowej.

W przypadku przełączania w tryb failover zwykle chcemy upewnić się, że maszyna wirtualna zaczyna się od braku uszkodzenia lub utraty danych, a dane maszyny wirtualnej są spójne dla systemu operacyjnego oraz aplikacji uruchamianych na maszynie wirtualnej. Zależy to od typu wykonanych migawek.

Usługa Site Recovery tworzy migawki w następujący sposób:

  1. Usługa Site Recovery domyślnie tworzy migawki spójne na poziomie awarii danych i migawki spójne z aplikacjami, jeśli określisz dla nich częstotliwość.
  2. Punkty odzyskiwania są tworzone na podstawie migawek i przechowywane zgodnie z ustawieniami przechowywania w zasadach replikacji.

Spójność

W poniższej tabeli opisano różne typy spójności.

Spójne na poziomie awarii

Opis Szczegóły Zalecenie
Migawka spójna na poziomie awarii przechwytuje dane, które znajdowały się na dysku podczas wykonywania migawki. Nie zawiera żadnych elementów w pamięci.

Zawiera odpowiednik danych na dysku, które byłyby obecne, jeśli maszyna wirtualna uległa awarii lub przewód zasilania został ściągnięty z serwera w momencie utworzenia migawki.

Spójność na poziomie awarii nie gwarantuje spójności danych dla systemu operacyjnego ani aplikacji na maszynie wirtualnej.
Usługa Site Recovery domyślnie tworzy punkty odzyskiwania spójne na poziomie awarii co pięć minut. Tego ustawienia nie można zmodyfikować.

Obecnie większość aplikacji może odzyskać się dobrze po punktach spójnych na poziomie awarii.

Punkty odzyskiwania spójne na poziomie awarii są wystarczające do replikacji systemów operacyjnych i aplikacji, takich jak serwery DHCP i serwery wydruku.

Spójne na poziomie aplikacji

Opis Szczegóły Zalecenie
Punkty odzyskiwania spójne na poziomie aplikacji są tworzone na podstawie migawek spójnych na poziomie aplikacji.

Migawka spójna na poziomie aplikacji zawiera wszystkie informacje w migawce spójnej na poziomie awarii oraz wszystkie dane w pamięci i w toku transakcji.
Migawki spójne na poziomie aplikacji używają usługi kopiowania woluminów w tle (VSS):

1) Usługa Azure Site Recovery używa metody kopii zapasowej tylko do kopiowania (VSS_BT_COPY), która nie zmienia czasu tworzenia kopii zapasowej dziennika transakcji programu Microsoft SQL i numeru

sekwencji 2) Po zainicjowaniu migawki usługa VSS wykonuje operację kopiowania na zapis (COW) na woluminie.

3) Przed wykonaniem operacji COW usługa VSS informuje każdą aplikację na maszynie, że musi opróżnić dane rezydenta pamięci na dysk.

4) Usługa VSS umożliwia następnie aplikacji do tworzenia kopii zapasowej/odzyskiwania po awarii (w tym przypadku usługi Site Recovery) odczytywanie danych migawki i kontynuowanie.
Migawki spójne na poziomie aplikacji są wykonywane zgodnie z ową częstotliwością. Ta częstotliwość powinna być zawsze mniejsza niż ustawiona na potrzeby przechowywania punktów odzyskiwania. Jeśli na przykład zachowasz punkty odzyskiwania przy użyciu domyślnego ustawienia 24 godzin, należy ustawić częstotliwość na mniej niż 24 godziny.

Są one bardziej złożone i trwa dłużej niż migawki spójne na poziomie awarii.

Mają one wpływ na wydajność aplikacji uruchomionych na maszynie wirtualnej włączonej do replikacji.

Proces replikacji

Po włączeniu replikacji dla maszyny wirtualnej platformy Azure wykonywane są następujące czynności:

  1. Rozszerzenie usługa mobilności usługi Site Recovery jest automatycznie instalowane na maszynie wirtualnej.
  2. Rozszerzenie rejestruje maszynę wirtualną w usłudze Site Recovery.
  3. Ciągła replikacja rozpoczyna się dla maszyny wirtualnej. Zapisy dysków są natychmiast przenoszone do konta magazynu pamięci podręcznej w lokalizacji źródłowej.
  4. Usługa Site Recovery przetwarza dane w pamięci podręcznej i wysyła je do docelowego konta magazynu lub do repliki dysków zarządzanych.
  5. Po przetworzeniu danych punkty odzyskiwania spójne na poziomie awarii są generowane co pięć minut. Punkty odzyskiwania spójne na poziomie aplikacji są generowane zgodnie z ustawieniem określonym w zasadach replikacji.

Diagram showing the replication process, step 2.

Proces replikacji

Wymagania dotyczące łączności

Replikowane maszyny wirtualne platformy Azure wymagają łączności wychodzącej. Usługa Site Recovery nigdy nie potrzebuje łączności przychodzącej z maszyną wirtualną.

Łączność wychodząca (adresy URL)

Jeśli dostęp wychodzący dla maszyn wirtualnych jest kontrolowany przy użyciu adresów URL, zezwól na te adresy URL.

Nazwa/nazwisko Handlowych Instytucje rządowe Opis
Storage *.blob.core.windows.net *.blob.core.usgovcloudapi.net Umożliwia zapisanie danych z maszyny wirtualnej na koncie magazynu pamięci podręcznej znajdującym się w regionie źródłowym.
Microsoft Entra ID login.microsoftonline.com login.microsoftonline.us Umożliwia autoryzację i uwierzytelnianie przy użyciu adresów URL usługi Site Recovery.
Replikacja *.hypervrecoverymanager.windowsazure.com *.hypervrecoverymanager.windowsazure.us Umożliwia komunikację między maszyną wirtualną a usługą Site Recovery.
Service Bus *.servicebus.windows.net *.servicebus.usgovcloudapi.net Umożliwia maszynie wirtualnej zapisywanie danych monitorowania i danych diagnostycznych usługi Site Recovery.
Key Vault *.vault.azure.net *.vault.usgovcloudapi.net Umożliwia dostęp do włączania replikacji dla maszyn wirtualnych z włączoną usługą ADE za pośrednictwem portalu
Azure Automation *.automation.ext.azure.com *.azure-automation.us Umożliwia włączenie automatycznego zwiększania poziomu agenta mobilności dla replikowanego elementu za pośrednictwem portalu

Połączenia ruchu wychodzącego dla zakresów adresów IP

Aby kontrolować łączność wychodzącą dla maszyn wirtualnych przy użyciu adresów IP, zezwól na te adresy. Należy pamiętać, że szczegółowe informacje o wymaganiach dotyczących łączności sieciowej można znaleźć w oficjalny dokument sieci.

Reguły regionów źródłowych

Reguły Szczegóły Tag usługi
Zezwalaj na ruch wychodzący HTTPS: port 443 Zezwalaj na zakresy odpowiadające kontom magazynu w regionie źródłowym Magazynu.<nazwa regionu>
Zezwalaj na ruch wychodzący HTTPS: port 443 Zezwalaj na zakresy odpowiadające identyfikatorowi Entra firmy Microsoft AzureActiveDirectory
Zezwalaj na ruch wychodzący HTTPS: port 443 Zezwalaj na zakresy odpowiadające centrum zdarzeń w regionie docelowym. EventHub.<nazwa regionu>
Zezwalaj na ruch wychodzący HTTPS: port 443 Zezwalaj na zakresy odpowiadające usłudze Azure Site Recovery AzureSiteRecovery
Zezwalaj na ruch wychodzący HTTPS: port 443 Zezwalaj na zakresy odpowiadające usłudze Azure Key Vault (jest to wymagane tylko do włączania replikacji maszyn wirtualnych z włączoną usługą ADE za pośrednictwem portalu) AzureKeyVault
Zezwalaj na ruch wychodzący HTTPS: port 443 Zezwalaj na zakresy odpowiadające kontrolerowi usługi Azure Automation (jest to wymagane tylko w celu włączenia automatycznego uaktualniania agenta mobilności dla replikowanego elementu za pośrednictwem portalu) GuestAndHybridManagement

Reguły regionów docelowych

Reguły Szczegóły Tag usługi
Zezwalaj na ruch wychodzący HTTPS: port 443 Zezwalaj na zakresy odpowiadające kontom magazynu w regionie docelowym Magazynu.<nazwa regionu>
Zezwalaj na ruch wychodzący HTTPS: port 443 Zezwalaj na zakresy odpowiadające identyfikatorowi Entra firmy Microsoft AzureActiveDirectory
Zezwalaj na ruch wychodzący HTTPS: port 443 Zezwalaj na zakresy odpowiadające centrum zdarzeń w regionie źródłowym. EventHub.<nazwa regionu>
Zezwalaj na ruch wychodzący HTTPS: port 443 Zezwalaj na zakresy odpowiadające usłudze Azure Site Recovery AzureSiteRecovery
Zezwalaj na ruch wychodzący HTTPS: port 443 Zezwalaj na zakresy odpowiadające usłudze Azure Key Vault (jest to wymagane tylko do włączania replikacji maszyn wirtualnych z włączoną usługą ADE za pośrednictwem portalu) AzureKeyVault
Zezwalaj na ruch wychodzący HTTPS: port 443 Zezwalaj na zakresy odpowiadające kontrolerowi usługi Azure Automation (jest to wymagane tylko w celu włączenia automatycznego uaktualniania agenta mobilności dla replikowanego elementu za pośrednictwem portalu) GuestAndHybridManagement

Kontrola dostępu za pomocą reguł sieciowej grupy zabezpieczeń

W przypadku kontrolowania łączności maszyny wirtualnej przez filtrowanie ruchu sieciowego do i z sieci/podsieci platformy Azure przy użyciu reguł sieciowej grupy zabezpieczeń należy zwrócić uwagę na następujące wymagania:

  • Reguły sieciowej grupy zabezpieczeń dla źródłowego regionu platformy Azure powinny zezwalać na dostęp wychodzący dla ruchu replikacji.
  • Zalecamy tworzenie reguł w środowisku testowym przed ich umieszczeniem w środowisku produkcyjnym.
  • Używaj tagów usługi zamiast zezwalania na poszczególne adresy IP.
    • Tagi usługi reprezentują grupę prefiksów adresów IP zebranych razem w celu zminimalizowania złożoności podczas tworzenia reguł zabezpieczeń.
    • Firma Microsoft automatycznie aktualizuje tagi usług w czasie.

Dowiedz się więcej o łączności wychodzącej dla usługi Site Recovery i kontrolowaniu łączności za pomocą sieciowych grup zabezpieczeń.

Połączenie ivity na potrzeby spójności wielu maszyn wirtualnych

Jeśli włączono spójność między wieloma maszynami wirtualnymi, maszyny z grupy replikacji komunikują się między sobą przez port 20004.

  • Upewnij się, że urządzenie zapory nie blokuje komunikacji wewnętrznej między maszynami wirtualnymi przez port 20004.
  • Jeśli do grupy replikacji chcesz dodać maszyny wirtualne z systemem Linux, musisz ręcznie otworzyć port 20004 dla ruchu wychodzącego zgodnie ze wskazówkami dla konkretnej wersji systemu Linux.

Proces trybu failover

Po zainicjowaniu trybu failover maszyny wirtualne są tworzone w docelowej grupie zasobów, docelowej sieci wirtualnej, docelowej podsieci i w docelowym zestawie dostępności. Podczas pracy w trybie failover można użyć dowolnego punktu odzyskiwania.

Diagram showing the failover process with source and target environments.

Następne kroki