Przygotowywanie scenariusza odzyskiwania po awarii

Ukończone

W tym scenariuszu masz system produkcyjny działający na dużych wystąpieniach platformy HANA w regionie produkcyjnym platformy Azure. W przypadku kroków, które należy wykonać, załóżmy, że identyfikator SID tego systemu HANA to "PRD" i że masz system nieprodukcyjny uruchomiony w dużych wystąpieniach platformy HANA w regionie odzyskiwania po awarii na platformie Azure. W przypadku tego ostatniego załóżmy, że jego identyfikator SID to "TST".

Jeśli wystąpienie serwera nie zostało jeszcze uporządkowane z dodatkowym zestawem woluminów magazynu, platforma SAP HANA w usłudze Azure Service Management dołącza dodatkowy zestaw woluminów jako miejsce docelowe repliki produkcyjnej do jednostki dużego wystąpienia HANA, na której jest uruchomione wystąpienie TST HANA. W tym celu należy podać identyfikator SID wystąpienia produkcyjnego HANA. Po potwierdzeniu załącznika tych woluminów przez platformę SAP HANA w usłudze Azure Service Management należy zainstalować te woluminy w jednostce dużego wystąpienia platformy HANA.

Następnym krokiem jest zainstalowanie drugiego wystąpienia PLATFORMy SAP HANA w regionie usługi Azure ODZYSKIWANIA po awarii, w którym uruchamiasz wystąpienie TST HANA. Nowo zainstalowane wystąpienie sap HANA musi mieć ten sam identyfikator SID. Utworzoni użytkownicy muszą mieć ten sam identyfikator UID i identyfikator grupy, który ma wystąpienie produkcyjne. Jeśli instalacja zakończyła się pomyślnie, należy wykonać następujące kroki:

  • Zaimplementuj opisany wcześniej proces przygotowywania migawek magazynu HLI.
  • Użyj pliku HANABackupCustomerDetails.txt z nowym wystąpieniem platformy HANA i sprawdź, czy łączność z magazynem działa prawidłowo.
  • Zatrzymaj nowo zainstalowane wystąpienie platformy SAP HANA w lekcji Duże wystąpienie platformy HANA w regionie odzyskiwania po awarii na platformie Azure.
  • Odinstaluj te woluminy PRD i skontaktuj się z platformą SAP HANA w usłudze Azure Service Management. Woluminy nie mogą pozostać zainstalowane w jednostce, ponieważ nie mogą być dostępne podczas działania jako miejsce docelowe replikacji magazynu.

Zespół operacyjny ustanawia relację replikacji między woluminami ŻĄDANIA ściągnięcia w regionie produkcyjnym platformy Azure i woluminami PRD w regionie świadczenia usługi Azure ODZYSKIWANIA po awarii.

Ważne

Wolumin /hana/log nie jest replikowany, ponieważ nie jest konieczne przywrócenie replikowanej bazy danych SAP HANA do stanu spójnego w lokacji odzyskiwania po awarii.

Następnie skonfiguruj lub dostosuj harmonogram tworzenia kopii zapasowych migawek magazynu, aby przejść do celu punktu odzyskiwania i celu punktu odzyskiwania w przypadku awarii. Aby zminimalizować cel punktu odzyskiwania, ustaw następujące interwały replikacji w usłudze HANA Large Instance:

  • W przypadku woluminów objętych połączoną migawką (typ migawki HANA) ustaw wartość replikacji co 15 minut na równoważne cele woluminu magazynu w lokacji odzyskiwania po awarii.
  • W przypadku woluminu kopii zapasowej dziennika transakcji (dzienniki typu migawki) ustaw wartość replikacji co 3 minuty na równoważne cele woluminu magazynu w lokacji odzyskiwania po awarii.
  • Wykonaj migawkę magazynu typu HANA co 30 minut do 1 godziny.
  • Wykonywanie kopii zapasowych dziennika transakcji sap HANA co 5 minut.
  • Wykonaj migawkę magazynu typu dzienników co 5–15 minut. W tym przedziale czasu osiągasz cel punktu odzyskiwania wynoszący około 15–25 minut.

Aby osiągnąć jeszcze lepszy cel punktu odzyskiwania po awarii w przypadku odzyskiwania po awarii, możesz skopiować kopie zapasowe dziennika transakcji HANA z platformy SAP HANA na platformie Azure (duże wystąpienia) do innego regionu świadczenia usługi Azure. Aby osiągnąć tę dalszą redukcję celu punktu odzyskiwania, wykonaj następujące kroki:

  1. Utwórz kopię zapasową dziennika transakcji platformy HANA tak często, jak to możliwe, do /hana/logbackups.
  2. Użyj narzędzia rsync, aby skopiować kopie zapasowe dziennika transakcji do maszyn wirtualnych platformy Azure hostowanych w udziale NFS. Maszyny wirtualne znajdują się w sieciach wirtualnych platformy Azure w regionie produkcyjnym platformy Azure i regionach odzyskiwania po awarii. Należy połączyć obie sieci wirtualne platformy Azure z obwodem łączącym produkcyjne duże wystąpienia HANA z platformą Azure.
  3. Zachowaj kopie zapasowe dziennika transakcji w regionie na maszynie wirtualnej dołączonej do wyeksportowanego magazynu systemu plików NFS.
  4. W przypadku przejścia w tryb failover po awarii uzupełnij kopie zapasowe dziennika transakcji, które można znaleźć na woluminie /hana/logbackups , przy użyciu ostatnio wykonanych kopii zapasowych dziennika transakcji w udziale NFS w lokacji odzyskiwania po awarii.
  5. Uruchom kopię zapasową dziennika transakcji, aby przywrócić najnowszą kopię zapasową, która może zostać zapisana w regionie odzyskiwania po awarii.

Gdy operacje dużych wystąpień platformy HANA potwierdzają konfigurację relacji replikacji i uruchamiasz kopie zapasowe migawek magazynu wykonywania, rozpoczyna się replikacja danych.

W miarę postępu replikacji migawki woluminów PRD w regionach odzyskiwania po awarii platformy Azure nie są przywracane. Są one przechowywane tylko. Jeśli woluminy są zainstalowane w takim stanie, reprezentują one stan, w którym nie zainstalowano tych woluminów po zainstalowaniu wystąpienia SAP HANA PRD w jednostce serwera w regionie odzyskiwania po awarii platformy Azure. Reprezentują one również kopie zapasowe magazynu, które nie zostały jeszcze przywrócone.

Jeśli istnieje tryb failover, możesz również przywrócić starszą migawkę magazynu zamiast najnowszej migawki magazynu.

Monitorowanie replikacji odzyskiwania po awarii

Aby monitorować stan postępu replikacji magazynu, uruchom skrypt azure_hana_replication_status. To polecenie musi być uruchamiane z jednostki, która działa w lokalizacji odzyskiwania po awarii, aby działać zgodnie z oczekiwaniami. Polecenie działa niezależnie od tego, czy replikacja jest aktywna. Polecenie można uruchomić dla każdej jednostki dużego wystąpienia platformy HANA dzierżawy w lokalizacji odzyskiwania po awarii. Nie można go użyć do uzyskania szczegółowych informacji o woluminie rozruchowym.