Prinsip dan persiapan Pemulihan Bencana

Dalam artikel ini, kami akan membahas prinsip-prinsip pemulihan bencana (DR) yang penting untuk Instans Besar Hana (atau dikenal sebagai Infrastruktur BareMetal). Kami akan membahas langkah-langkah yang perlu Anda ambil dalam persiapan pemulihan bencana. Anda juga akan melihat cara mencapai tujuan waktu pemulihan (RTO) dan tujuan titik pemulihan (RPO) dalam bencana.

Prinsip DR untuk Instans Besar Hana

Instans Besar Hana menawarkan fungsionalitas pemulihan bencana antar-stempel Instans Besar Hana di berbagai wilayah Azure. Misalnya, katakanlah Anda menyebarkan Instans Besar Hana di wilayah US Barat Azure. Kemudian Anda dapat menggunakan Instans Besar Hana di wilayah US Timur sebagai unit pemulihan bencana. Pemulihan bencana tidak dikonfigurasi secara otomatis, karena mengharuskan Anda untuk membayar Instans Besar Hana lainnya di wilayah DR. Penyiapan pemulihan bencana berfungsi untuk penyiapan penambahan sekala dan perluasan skala.

Sebagian besar pelanggan menggunakan unit di wilayah DR untuk menjalankan sistem non-produksi yang menggunakan instans Hana yang diinstal. Instans Besar Hana harus memiliki SKU yang sama dengan SKU yang digunakan untuk tujuan produksi. Gambar berikut menunjukkan seperti apa konfigurasi disk antara unit server di wilayah produksi Azure dan di wilayah pemulihan bencana:

DR setup configuration from disk point of view

Seperti yang ditunjukkan dalam grafik ringkasan ini, Anda harus memesan set volume disk kedua. Volume disk target yang terkait dengan server Instans Besar Hana di situs DR memiliki ukuran yang sama dengan volume produksi.

Volume berikut direplikasi dari wilayah produksi ke situs DR:

  • /hana/data
  • /hana/logbackups
  • /hana/shared (mencakup /usr/sap)

Volume /hana/log tidak direplikasi. Log transaksi SAP Hana tidak diperlukan saat melakukan pemulihan dari volume tersebut.

Replikasi penyimpanan Instans Besar Hana

Dasar dari fungsionalitas DR dalam infrastruktur Instans Besar Hana adalah replikasi penyimpanannya. Fungsionalitas yang digunakan pada sisi penyimpanan bukanlah aliran perubahan konstan yang mereplikasi secara asinkron saat terjadi perubahan pada volume penyimpanan. Sebaliknya, ini adalah mekanisme yang bergantung pada rekam jepret volume ini yang dibuat secara teratur. Delta antara rekam jepret yang sudah direplikasi dan rekam jepret baru yang belum direplikasi kemudian ditransfer ke situs DR ke volume disk target. Rekam jepret ini disimpan pada volume. Jika ada failover pemulihan bencana, failover perlu dipulihkan pada volume tersebut.

Transfer pertama dari data lengkap volume harus terjadi sebelum jumlah data menjadi lebih kecil dari delta di antara rekam jepret. Kemudian volume di situs DR akan berisi setiap rekam jepret volume yang diambil di situs produksi. Akhirnya, Anda dapat menggunakan sistem DR tersebut untuk mengakses status sebelumnya untuk memulihkan data yang hilang, tanpa menggulung balik sistem produksi.

Jika ada penyebaran MCOD dengan beberapa instans SAP Hana independen pada satu Instans Besar Hana, semua instans SAP Hana harus memiliki penyimpanan yang direplikasi ke sisi DR.

Saat Anda menggunakan Replikasi Sistem Hana sebagai ketersediaan tinggi di situs produksi Anda, dan menggunakan replikasi berbasis penyimpanan untuk situs DR, volume kedua simpul dari situs primer ke instans DR direplikasi. Beli penyimpanan ekstra (ukuran yang sama dengan simpul primer) di situs DR untuk mengakomodasi replikasi dari simpul primer dan sekunder ke DR.

Catatan

Fungsionalitas replikasi penyimpanan Instans Besar Hana mencerminkan dan mereplikasi rekam jepret penyimpanan. Jika Anda tidak mengambil rekam jepret penyimpanan seperti yang dijelaskan di Cadangan dan pemulihan, tidak akan ada replikasi ke situs DR. Eksekusi rekam jepret penyimpanan adalah prasyarat untuk replikasi penyimpanan ke situs pemulihan bencana.

Persiapan skenario pemulihan bencana

Dalam skenario DR ini, Anda memiliki sistem produksi yang berjalan pada Instans Besar Hana di wilayah Azure produksi. Untuk langkah-langkah selanjutnya, misalkan SID dari sistem HANA tersebut adalah "PRD." Anda juga memiliki sistem non-produksi yang berjalan pada Instans Besar HANA di wilayah Azure DR. SID sistem HANA adalah "TST." Gambar berikut menunjukkan konfigurasi ini:

Start of DR setup

Katakanlah instans server belum diurutkan dengan set volume penyimpanan tambahan. Kemudian SAP Hana di Azure Service Management melampirkan volume yang ditambahkan. Mereka adalah target untuk replika produksi ke Instans Besar Hana di mana Anda menjalankan instans Hana TST. Anda perlu menyediakan SID instans Hana produksi Anda. Setelah SAP Hana di Azure Service Management mengonfirmasi lampiran volume tersebut, Anda perlu memasang volume tersebut ke Instans Besar Hana.

DR setup next step

Langkah selanjutnya adalah menginstal instans SAP Hana kedua pada Instans Besar Hana di wilayah Azure DR, tempat Anda menjalankan instans Hana TST. Instans SAP Hana yang baru dipasang harus memiliki SID yang sama. Pengguna yang dibuat harus memiliki UID dan ID Grup yang sama dengan instans produksi. Baca Pencadangan dan pemulihan untuk melihat detailnya. Jika penginstalan berhasil, Anda perlu:

  • Menjalankan langkah 2 dari persiapan rekam jepret penyimpanan yang dijelaskan dalam Pencadangan dan pemulihan.
  • Membuat kunci umum untuk unit DR Instans Besar Hana jika Anda belum melakukannya. Lihat langkah 3 dari persiapan rekam jepret penyimpanan yang dijelaskan di Pencadangan dan pemulihan.
  • Pertahankan HanaBackupCustomerDetails.txt dengan instans Hana baru dan uji apakah konektivitas ke penyimpanan berfungsi dengan benar.
  • Hentikan instans SAP Hana yang baru diinstal pada Instans Besar Hana di wilayah Azure DR.
  • Batalkan pemasangan volume PRD ini dan hubungi SAP Hana di Azure Service Management. Volume tidak dapat tetap dipasang ke unit karena volume tersebut tidak dapat diakses saat berfungsi sebagai target replikasi penyimpanan.

Diagram that shows the replication relationship between the PRD volumes in the production Azure region and the PRD volumes in the DR Azure region.

Tim operasi menetapkan hubungan replikasi antara volume PRD di wilayah produksi dan volume PRD di wilayah DR.

Penting

Volume /hana/log tidak direplikasi karena tidak diperlukan untuk memulihkan database SAP Hana yang direplikasi ke keadaan konsisten di situs pemulihan bencana.

Selanjutnya, atur jadwal cadangan rekam jepret penyimpanan untuk mencapai RTO dan RPO Anda jika terjadi bencana. Untuk meminimalkan RPO, atur interval replikasi berikut di layanan Instans Besar Hana:

  • Untuk volume yang dicakup oleh rekam jepret gabungan (jenis rekam jepret hana), diatur untuk mereplikasi setiap 15 menit ke target volume penyimpanan yang setara di situs pemulihan bencana.
  • Untuk volume cadangan log transaksi (jenis rekam jepret log), diatur untuk mereplikasi setiap 3 menit ke target volume penyimpanan yang setara di situs pemulihan bencana.

Untuk meminimalkan RPO:

  • Lakukan rekam jepret penyimpanan jenis hana setiap 30 menit hingga 1 jam. Untuk informasi lebih lanjut, lihat Mencadangkan dengan menggunakan alat Rekam Jepret Konsisten Aplikasi Azure.
  • Lakukan cadangan log transaksi SAP Hana setiap 5 menit.
  • Lakukan rekam jepret penyimpanan jenis log setiap 5-15 menit. Dengan periode interval ini, Anda mencapai RPO sekitar 15-25 menit.

Dengan penyiapan ini, urutan cadangan log transaksi, rekam jepret penyimpanan, dan replikasi volume cadangan log transaksi Hana dan /hana/data, dan /hana/shared (termasuk /usr/sap) mungkin terlihat seperti data yang ditunjukkan dalam grafik ini:

Relationship between a transaction log backup snapshot and a snap mirror on a time axis

Untuk mencapai RPO yang lebih baik dalam kasus pemulihan bencana, Anda dapat menyalin cadangan log transaksi Hana dari SAP Hana di Azure (Instans Besar) ke wilayah Azure lainnya. Untuk mencapai pengurangan RPO lebih lanjut ini, lakukan langkah-langkah berikut:

  1. Cadangkan log transaksi Hana sesering mungkin ke /hana/logbackups.
  2. Gunakan rsync untuk menyalin cadangan log transaksi ke komputer virtual Azure yang dihosting berbagi NFS. Mesin virtual (VM) berada di jaringan virtual Azure di wilayah produksi Azure dan di wilayah DR. Sambungkan kedua jaringan virtual Azure ke sirkuit yang menyambungkan produksi Instans Besar Hana ke Azure. Untuk informasi lebih lanjut, lihat Pertimbangan jaringan untuk pemulihan bencana dengan Instans Besar Hana.
  3. Simpan cadangan log transaksi di wilayah di mesin virtual yang terlampir pada penyimpanan yang diekspor NFS.
  4. Dalam kasus failover bencana, lengkapi cadangan log transaksi yang Anda temukan pada volume /hana/logbackups dengan cadangan log transaksi yang baru-baru ini diambil pada NFS yang dibagikan di situs DR.
  5. Mulai cadangan log transaksi untuk memulihkan ke cadangan terbaru yang mungkin disimpan ke wilayah DR.

Ketika operasi Instans Besar Hana mengonfirmasi pengaturan hubungan replikasi, dan Anda memulai pencadangan rekam jepret penyimpanan eksekusi, replikasi data dimulai.

DR setup step before establishing replication

Saat replikasi berlangsung, rekam jepret pada volume PRD di wilayah Azure DR tidak dipulihkan. Rekam jepret hanya disimpan. Jika volume dipasang dalam status seperti itu, volume tersebut mewakili status saat Anda membatalkan pemasangan volume tersebut setelah instans PRD SAP Hana diinstal di server di wilayah Azure DR. Volume tersebut juga mewakili cadangan penyimpanan yang belum dipulihkan.

Jika ada failover, Anda juga dapat memilih untuk memulihkan ke rekam jepret penyimpanan yang lebih lama alih-alih rekam jepret penyimpanan terbaru.

Langkah berikutnya

Pelajari prosedur failover di pemulihan bencana.