Duże wystąpienia SAP HANA — wysoka dostępność i odzyskiwanie po awarii na platformie Azure

Ważne

Ta dokumentacja nie zastępuje dokumentacji administracyjnej oprogramowania SAP HANA ani notatek SAP. Oczekujemy, że masz doświadczenie w zakresie administrowania i operacji sap HANA, zwłaszcza w temacie tworzenia kopii zapasowych, przywracania, wysokiej dostępności i odzyskiwania po awarii.

W tym artykule przedstawimy omówienie wysokiej dostępności (HA) i odzyskiwania po awarii (DR) platformy SAP HANA w dużych wystąpieniach platformy Azure (inaczej nazywanej infrastrukturą BareMetal). Szczegółowo omówimy również niektóre wymagania i zagadnienia związane z wysoką dostępnością i odzyskiwaniem po awarii.

Niektóre procesy opisane w tej dokumentacji są uproszczone. Nie są one przeznaczone jako szczegółowe kroki, które należy uwzględnić w podręcznikach operacji. Aby utworzyć podręczniki operacji dla konfiguracji, uruchom i przetestuj procesy przy użyciu określonych wersji i wydań platformy HANA. Następnie można udokumentować procesy specyficzne dla konfiguracji.

Wysoka dostępność i odzyskiwanie po awarii

Wysoka dostępność i odzyskiwanie po awarii są kluczowymi aspektami uruchamiania misji krytycznej platformy SAP HANA na serwerze platformy Azure (duże wystąpienia). Ważne jest, aby pracować z oprogramowaniem SAP, integratorem systemu lub firmą Microsoft, aby prawidłowo zaprojektować i wdrożyć odpowiednie strategie wysokiej dostępności i odzyskiwania po awarii. Należy również wziąć pod uwagę cel punktu odzyskiwania (RPO) i cel czasu odzyskiwania (RTO), który jest specyficzny dla danego środowiska.

Firma Microsoft obsługuje niektóre funkcje wysokiej dostępności oprogramowania SAP HANA z dużymi wystąpieniami platformy HANA. Te funkcje obejmują:

  • Replikacja magazynu: system magazynu może replikować wszystkie dane do innej sygnatury dużego wystąpienia platformy HANA w innym regionie świadczenia usługi Azure. Platforma SAP HANA działa niezależnie od tej metody. Ta funkcja jest domyślnym mechanizmem odzyskiwania po awarii oferowanym dla dużych wystąpień platformy HANA.
  • Replikacja systemu HANA: replikacja wszystkich danych w oprogramowaniu SAP HANA do oddzielnego systemu SAP HANA. Cel czasu odzyskiwania jest minimalizowany przez replikację danych w regularnych odstępach czasu. Platforma SAP HANA obsługuje tryby asynchroniczne, synchroniczne w pamięci i synchroniczne. Tryb synchroniczny jest używany tylko dla systemów SAP HANA w tym samym centrum danych lub mniejszym niż 100 km. W przypadku bieżącego projektu dużych wystąpień platformy HANA replikacja systemu HANA może służyć tylko do wysokiej dostępności w jednym regionie. Replikacja systemu HANA wymaga zwrotnego serwera proxy lub składnika routingu innej firmy na potrzeby konfiguracji odzyskiwania po awarii w innym regionie świadczenia usługi Azure.
  • Automatyczne przełączanie w tryb failover hosta: lokalne rozwiązanie do odzyskiwania błędów dla platformy SAP HANA, które jest alternatywą dla replikacji systemu HANA. Jeśli węzeł podstawowy stanie się niedostępny, skonfiguruj co najmniej jeden węzł rezerwowy SAP HANA w trybie skalowania w poziomie, a platforma SAP HANA automatycznie przechodzi w tryb failover do węzła rezerwowego.

Platforma SAP HANA na platformie Azure (duże wystąpienia) jest oferowana w dwóch regionach świadczenia usługi Azure w czterech obszarach geopolitycznych: USA, Australia, Europa i Japonia. Dwa regiony w obszarze geopolitycznym hostujące sygnatury dużego wystąpienia HANA (HLI) są połączone z oddzielnymi dedykowanymi obwodami sieciowymi. Te HLI są używane do replikowania migawek magazynu w celu zapewnienia metod odzyskiwania po awarii. Replikacja nie jest domyślnie konfigurowana, ale tylko dla klientów, którzy zamówią funkcję odzyskiwania po awarii. Replikacja magazynu zależy od użycia migawek magazynu dla dużych wystąpień platformy HANA. Nie można wybrać regionu świadczenia usługi Azure jako regionu odzyskiwania po awarii, który znajduje się w innym obszarze geopolitycznym.

Obecnie obsługiwane opcje

W poniższej tabeli przedstawiono obecnie obsługiwane metody wysokiej dostępności i odzyskiwania po awarii oraz kombinacje:

Scenariusz obsługiwany w dużych wystąpieniach platformy HANA Opcja wysokiej dostępności Opcja odzyskiwania po awarii Komentarze
Jeden węzeł Niedostępne. Dedykowana konfiguracja odzyskiwania po awarii.
Konfiguracja odzyskiwania po awarii z wieloma zastosowaniami.
Automatyczne przełączanie w tryb failover hosta: skalowanie w poziomie (z rezerwą lub bez)
w tym 1+1
Możliwe w przypadku wstrzymania przy użyciu aktywnej roli.
Platforma HANA kontroluje przełącznik roli.
Dedykowana konfiguracja odzyskiwania po awarii.
Konfiguracja odzyskiwania po awarii z wieloma zastosowaniami.
Synchronizacja odzyskiwania po awarii przy użyciu replikacji magazynu.
Zestawy woluminów platformy HANA są dołączone do wszystkich węzłów.
Lokacja odzyskiwania po awarii musi mieć taką samą liczbę węzłów.
Replikacja systemu HANA Możliwe w przypadku konfiguracji podstawowej lub pomocniczej.
Pomocnicze przejście do roli głównej w przypadku przejścia w tryb failover.
Replikacja systemu HANA i tryb failover kontroli systemu OPERACYJNEGO.
Dedykowana konfiguracja odzyskiwania po awarii.
Konfiguracja odzyskiwania po awarii z wieloma zastosowaniami.
Synchronizacja odzyskiwania po awarii przy użyciu replikacji magazynu.
Odzyskiwanie po awarii przy użyciu replikacji systemu HANA nie jest jeszcze możliwe bez składników innych firm.
Oddzielny zestaw woluminów dysków jest dołączony do każdego węzła.
Tylko woluminy dysku repliki pomocniczej w lokacji produkcyjnej są replikowane do lokalizacji odzyskiwania po awarii.
Jeden zestaw woluminów jest wymagany w lokacji odzyskiwania po awarii.

Dedykowana konfiguracja odzyskiwania po awarii polega na tym, że jednostka dużego wystąpienia platformy HANA w lokacji odzyskiwania po awarii nie jest używana do uruchamiania żadnego innego obciążenia ani systemu nieprodukcyjnego. Jednostka jest pasywna i jest wdrażana tylko wtedy, gdy zostanie wykonany tryb failover po awarii. Ta konfiguracja nie jest preferowaną opcją dla większości klientów.

Aby dowiedzieć się więcej na temat układu magazynu i szczegółów sieci Ethernet dla architektury, zobacz Scenariusze obsługiwane przez usługę HLI.

Uwaga

Przed wersją HANA2.0 SPS4 nie było obsługiwane wykonywanie migawek baz danych z wieloma dzierżawami baz danych kontenerów (więcej niż jedna dzierżawa). Z dodatkiem SPS4 i nowszym oprogramowaniem SAP w pełni obsługuje tę funkcję migawki.

Konfiguracja odzyskiwania po awarii w wielu zastosowaniach polega na tym, że jednostka dużego wystąpienia platformy HANA w lokacji odzyskiwania po awarii uruchamia obciążenie nieprodukcyjne. Jeśli wystąpi awaria, zamknij system nieprodukcyjny, zainstaluj zestawy woluminów replikowanych przez magazyn (dodano) i uruchom produkcyjne wystąpienie platformy HANA. Większość klientów korzystających z funkcji odzyskiwania po awarii dużych wystąpień platformy HANA korzysta z tej konfiguracji.

Więcej informacji na temat wysokiej dostępności oprogramowania SAP HANA można znaleźć w następujących artykułach sap:

Zagadnienia dotyczące sieci związane z odzyskiwaniem po awarii za pomocą dużych wystąpień platformy HANA

Aby skorzystać z funkcji odzyskiwania po awarii dużych wystąpień platformy HANA, należy zaprojektować łączność sieciową z dwoma regionami świadczenia usługi Azure. Potrzebujesz połączenia obwodu usługi Azure ExpressRoute ze środowiska lokalnego w głównym regionie świadczenia usługi Azure i innego połączenia obwodu z lokalnego do regionu odzyskiwania po awarii. Ta miara obejmuje sytuację, w której występuje problem w regionie świadczenia usługi Azure, w tym lokalizację routera Microsoft Enterprise Edge Router (MSEE).

Możesz również połączyć wszystkie sieci wirtualne platformy Azure łączące się z platformą SAP HANA na platformie Azure (duże wystąpienia) w jednym regionie z obwodem usługi ExpressRoute, który łączy duże wystąpienia HANA w innym regionie. Dzięki temu połączeniu krzyżowe usługi działające w sieci wirtualnej platformy Azure w regionie 1 mogą łączyć się z jednostkami dużych wystąpień platformy HANA w regionie 2 i odwrotnie. Ta miara dotyczy przypadku, w którym tylko jedna z lokalizacji MSEE łącząca się z lokalizacją lokalną za pomocą platformy Azure przechodzi w tryb offline.

Na poniższej ilustracji przedstawiono odporną konfigurację dla przypadków odzyskiwania po awarii:

Optymalna konfiguracja odzyskiwania po awarii

Inne wymagania dotyczące replikacji magazynu dużych wystąpień platformy HANA na potrzeby odzyskiwania po awarii

  • Zamów jednostki SKU sap HANA na platformie Azure (duże wystąpienia) o takim samym rozmiarze jak jednostki SKU produkcyjne i wdróż je w regionie odzyskiwania po awarii. W przypadku bieżących wdrożeń klientów te wystąpienia są używane do uruchamiania nieprodukcyjnych wystąpień platformy HANA. Te konfiguracje są określane jako konfiguracje odzyskiwania po awarii w wielu zastosowaniach.
  • Zamów więcej magazynu w lokacji odzyskiwania po awarii dla każdej jednostki SKU sap HANA na platformie Azure (duże wystąpienia), które mają zostać odzyskane w lokacji odzyskiwania po awarii. Zakup większej ilości miejsca do magazynowania pozwala przydzielić woluminy magazynu. Woluminy docelowe replikacji magazynu z regionu produkcyjnego platformy Azure można przydzielić do regionu świadczenia usługi Azure odzyskiwania po awarii.
  • Replikacja systemu SAP HANA może być skonfigurowana na replikacji podstawowej i opartej na magazynie do lokacji odzyskiwania po awarii. Następnie należy zakupić więcej magazynu w lokacji odzyskiwania po awarii, aby dane węzłów głównych i pomocniczych były replikowane do lokacji odzyskiwania po awarii.

Następne kroki

Dowiedz się więcej na temat tworzenia kopii zapasowych i przywracania oprogramowania SAP HANA w dużych wystąpieniach platformy HANA.