Skenario failover Kubernetes pada perangkat Azure Stack Edge berkluster

Kluster Kubernetes disebarkan sebagai platform sumber terbuka populer untuk mengatur aplikasi kontainer. Artikel ini menjelaskan cara kerja Kubernetes pada perangkat Azure Stack Edge 2 simpul termasuk mode kegagalan dan respons perangkat yang sesuai.

Tentang Kubernetes di Azure Stack Edge

Pada perangkat Azure Stack Edge, Anda dapat membuat kluster Kubernetes dengan mengonfigurasi komputasi. Ketika peran komputasi dikonfigurasi, kluster Kubernetes termasuk node master dan pekerja semuanya disebarkan dan dikonfigurasi untuk Anda. Kluster ini kemudian digunakan untuk penyebaran beban kerja melalui kubectl, IoT Edge, atau Azure Arc.

Perangkat Azure Stack Edge tersedia sebagai konfigurasi 1 simpul atau konfigurasi 2 simpul yang merupakan kluster infrastruktur. Kluster Kubernetes terpisah dari kluster infrastruktur dan disebarkan di atas kluster infrastruktur. Kluster infrastruktur menyediakan penyimpanan persisten untuk perangkat Azure Stack Edge Anda sementara kluster Kubernetes bertanggung jawab hanya untuk orkestrasi aplikasi.

Kluster Kubernetes terdiri dari simpul master dan simpul pekerja. Node Kubernetes dalam kluster adalah komputer virtual yang menjalankan aplikasi dan alur kerja cloud.

  • Node master Kubernetes bertanggung jawab untuk mempertahankan keadaan yang diinginkan untuk kluster Anda. Simpul master juga mengontrol simpul pekerja.
  • Simpul pekerja menjalankan aplikasi dalam kontainer.

Kluster Kubernetes pada perangkat dua simpul

Kluster Kubernetes pada perangkat 2-node memiliki satu node master dan dua node pekerja. Perangkat 2-node sangat tersedia, dan jika salah satu node gagal, perangkat dan kluster Kubernetes terus berjalan. Untuk informasi selengkapnya tentang arsitektur kluster Kubernetes, buka konsep inti Kubernetes.

Pada perangkat Azure Stack Edge 2 simpul, VM master Kubernetes dan VM pekerja Kubernetes berjalan pada simpul A perangkat Anda. Pada simpul B, satu VM pekerja Kubernetes sedang berjalan.

Setiap VM pekerja di kluster Kubernetes adalah VM Hyper-V yang disematkan. VM yang disematkan terkait dengan simpul tertentu yang dijalankannya. Jika simpul A pada perangkat gagal, VM master gagal ke simpul B. Tetapi VM pekerja pada simpul A yang merupakan VM yang disematkan tidak gagal ke simpul B dan sebaliknya. Sebaliknya, pod dari VM pekerja pada simpul A diseimbangkan kembali ke simpul B.

Agar pod yang diseimbangkan kembali memiliki kapasitas yang cukup untuk berjalan pada node perangkat B, sistem memberlakukan bahwa tidak lebih dari 50% dari setiap kapasitas simpul ASE yang digunakan selama operasi kluster Azure Stack Edge 2 simpul reguler. Penggunaan kapasitas ini dilakukan berdasarkan upaya terbaik dan ada keadaan (misalnya, beban kerja yang membutuhkan sumber daya GPU yang tidak tersedia ketika diseimbangkan kembali ke ASE Node B) di mana pod yang diseimbangkan kembali mungkin tidak memiliki sumber daya yang cukup untuk dijalankan.

Skenario ini dibahas secara rinci di bagian berikutnya tentang Mode Kegagalan dan Perilaku.

Mode dan perilaku kegagalan

Simpul perangkat Azure Stack Edge mungkin gagal dalam kondisi tertentu. Berbagai mode kegagalan dan respons perangkat yang sesuai ditaulatasikan di bagian ini.

Kegagalan atau reboot simpul Azure Stack Edge

Simpul Kegagalan Respons
Node A mengalami kegagalan
(Simpul B tidak mengalami kegagalan)
Mengikuti kemungkinan kegagalan dapat terjadi:
  • Kedua PSU gagal
  • Satu atau kedua Port 3, Port 4 gagal
  • Komponen inti gagal, termasuk motherboard, DIMM, disk OS
  • Seluruh simpul gagal
    Respons berikut terlihat untuk setiap kegagalan ini:
    • VM master Kubernetes failover dari node A ke node B
    • Master VM membutuhkan waktu beberapa menit untuk muncul di node B
    • Pod dari simpul A diseimbangkan kembali pada simpul B
    • Beban kerja GPU terus berjalan jika GPU tersedia pada simpul B
    Simpul A reboot
    (Simpul B tidak mengalami kegagalan)
    Reboot node Setelah simpul A selesai di-boot ulang dan VM pekerja tersedia, VM master akan menyeimbangkan kembali pod dari simpul B.
    Node B mengalami kegagalan
    (Simpul A tidak memiliki kegagalan)
    Mengikuti kemungkinan kegagalan dapat terjadi:
    • Kedua PSU gagal
    • Satu atau kedua Port 3, Port 4 gagal
    • Komponen inti gagal, termasuk motherboard, DIMM, disk OS
    • Seluruh simpul gagal
      Respons berikut terlihat untuk setiap kegagalan ini:
      • Kubernetes master VM menyeimbangkan kembali pod dari simpul B. Ini bisa memakan waktu beberapa menit.
      Reboot Node B
      (Simpul A tidak memiliki kegagalan)
      Reboot node Setelah simpul B selesai di-boot ulang dan VM pekerja tersedia, VM master akan menyeimbangkan kembali pod dari simpul B.

      Pembaruan simpul Azure Stack Edge

      Jenis Pembaruan Respons
      Pembaruan simpul perangkat Pembaruan bergulir diterapkan ke simpul perangkat dan simpul akan di-boot ulang.
      Pembaruan layanan Kubernetes Pembaruan layanan Kubernetes meliputi:
      • Failover VM master Kubernetes dari node perangkat A ke node perangkat B
      • Pembaruan master Kubernetes.
      • Pembaruan simpul pekerja Kubernetes (belum tentu dalam urutan tersebut).
      Seluruh proses pembaruan bisa memakan waktu 30 menit atau lebih, dan selama jendela ini kluster Kubernetes tersedia untuk setiap operasi manajemen (seperti menyebarkan beban kerja baru). Meskipun pod akan dikosongkan dari simpul perangkat saat sedang diperbarui, beban kerja mungkin offline selama beberapa detik selama proses ini.

      Langkah berikutnya