Ketersediaan tinggi pada Azure Database for PostgreSQL - Hyperscale (Citus)
BERLAKU UNTUK:
Azure Database for PostgreSQL - Hyperscale (Citus)
Ketersediaan tinggi (HA) menghindari waktu tidak berfungsi pada database dengan mempertahankan replika siaga setiap simpul dalam grup server. Jika sebuah simpul tidak berfungsi, Hyperscale (Citus) mengalihkan koneksi masuk dari simpul yang gagal ke siaganya. Kegagalan terjadi dalam beberapa menit, dan simpul yang dipromosikan selalu memiliki data baru melalui replikasi streaming sinkron PostgreSQL.
Bahkan tanpa HA yang aktif, setiap node Hyperscale (Citus) memiliki penyimpanan redundan lokal (LRS) sendiri dengan tiga replika sinkron yang dikelola oleh layanan Azure Storage. Jika ada kegagalan replika tunggal, kegagalan terdeteksi oleh layanan Azure Storage dan dibuat ulang secara transparan. Untuk durabilitas penyimpanan LRS, lihat metrik di halaman ini.
Ketika HA diaktifkan, Hyperscale (Citus) menjalankan satu node siaga untuk setiap node utama dalam grup server. Node utama dan node siaga menggunakan replikasi PostgreSQL sinkron. Replikasi ini memungkinkan pelanggan untuk memiliki waktu henti yang dapat diprediksi jika node utama gagal. Singkatnya, layanan kami mendeteksi kegagalan pada node utama, dan mengalihkan ke node siaga tanpa kehilangan data.
Untuk memanfaatkan HA pada simpul koordinator, aplikasi database perlu mendeteksi dan mencoba kembali koneksi yang terputus dan transaksi yang gagal. Koordinator yang baru dipromosikan akan dapat diakses dengan string koneksi yang sama.
Status ketersediaan tinggi
Pemulihan dapat dibagi menjadi tiga tahap: deteksi, kegagalan, dan pemulihan penuh. Hyperscale (Citus) menjalankan pemeriksaan kesehatan berkala pada setiap simpul, dan setelah empat pemeriksaan gagal, Hyperscale menentukan bahwa simpul sedang tidak berfungsi. Hyperscale (Citus) kemudian mempromosikan status siaga ke simpul primer (kondisi), dan memprovisikan siaga baru. Replikasi streaming dimulai, menghadirkan node baru terkini. Ketika semua data telah direplikasi, simpul telah mencapai pemulihan penuh.
Hyperscale (Citus) menampilkan status kemajuan failover di halaman Ringkasan untuk grup server di portal Microsoft Azure.
- Sehat: High availability diaktifkan dan node sepenuhnya direplikasi ke siaganya.
- Failover sedang berlangsung: Kegagalan terdeteksi pada node utama dan failover ke siaga dimulai. Status ini akan bertransisi ke Membuat siaga setelah failover ke node siaga selesai, dan siaga menjadi primer yang baru.
- Membuat siaga: Siaga sebelumnya dipromosikan ke primer, dan siaga baru sedang dibuat untuk itu. Ketika sekunder yang baru siap, keadaan ini akan bertransisi ke Replikasi sedang berlangsung.
- Replikasi sedang berlangsung: Node siaga baru diprovisikan dan sinkronisasi data sedang berlangsung. Setelah semua data direplikasi ke siaga baru, replikasi sinkron akan diaktifkan antara node primer dan siaga, dan status node akan beralih kembali ke Sehat.
- Tidak: High availability tidak diaktifkan pada node ini.
Langkah berikutnya
- Pelajari cara mengaktifkan ketersediaan tinggi dalam grup server Hyperscale (Citus).