Masalah umum dengan mesin AKS di Azure Stack Hub

Topik ini mencakup masalah umum untuk mesin AKS di Azure Stack Hub.

Rahasia kedaluwarsa untuk perwakilan layanan (SPN) menyebabkan kluster gagal

  • Berlaku: Masalah ini berlaku untuk semua rilis.
  • Penyebab: Ketika rahasia kedaluwarsa untuk SPN, kluster akan gagal. Hal ini akan memengaruhi semua kluster kubernetes yang disebarkan menggunakan mesin AKS. Ketika rahasia Anda kedaluwarsa, kluster Anda tidak akan berfungsi.
  • Remediasi: Untuk mengurangi masalah, masuk ke setiap node kubernetes untuk memperbarui file konfigurasi /etc/kubernetes/azure.json dengan ID Aplikasi SPN baru dan rahasia yang tidak kedaluwarsa. Anda mungkin perlu menghubungi operator cloud Azure Stack Hub untuk mendapatkan SPN dan rahasia saat ini. Untuk petunjuk, lihat Menggunakan identitas aplikasi untuk mengakses sumber daya
  1. Anda dapat menggunakan perintah berikut pada node Linux Anda:
    sudo sed -i s/f072c125-c99c-4781-9e85-246b981cd52b/094b1318-baea-4584-bf9c-4a40501ce21b/1 /etc/kubernetes/azure.json
    
  2. Hidupkan ulang layanan kubelet menggunakan perintah berikut:
    sudo systemctl restart kubelet
    

Anda juga dapat menggunakan SPN dan rahasia dengan model API dan memaksa peningkatan. Untuk mengetahui petunjuknya, lihat Memaksa peningkatan.

  • Kejadian: Umum

Sertifikat kedaluwarsa untuk proksi depan

  • Berlaku: Masalah ini berlaku untuk semua rilis.
  • Penyebab: Saat sertifikat Anda kedaluwarsa, kubectl top, server metrik, mungkin berhenti berfungsi.
  • Remediasi: Anda harus memperbarui sertifikat. Anda dapat menemukan langkah-langkah di Memutar sertifikat Kubernetes di Azure Stack Hub
  • Kejadian: Umum

Batas 50 node per langganan

  • Berlaku untuk: Azure Stack Hub, mesin AKS (semua)
  • Deskripsi: Saat membuat kluster, Anda perlu memastikan bahwa tidak lebih dari 50 node Kubernetes (sarana kontrol dan node agen) yang disebarkan per langganan. Total node Kubernetes yang disebarkan di semua kluster dalam satu langganan tidak boleh melebihi 50 node.
  • Remediasi: Gunakan kurang dari 51 node dalam langganan Anda.
  • Kejadian: Saat mencoba menambahkan lebih dari 50 node per langganan.

Tidak dapat mengubah ukuran VM kluster dengan layanan Compute

  • Berlaku untuk: Azure Stack Hub, mesin AKS (semua)
  • Deskripsi: Mengubah ukuran VM kluster melalui layanan Compute tidak berfungsi dengan mesin AKS. Mesin AKS mempertahankan status kluster dalam file json model API. Untuk memastikan bahwa ukuran VM yang diinginkan tercermin dalam setiap operasi pembuatan, peningkatan, atau penskalaan yang dilakukan dengan mesin AKS, Anda harus memperbarui model API sebelum menjalankan salah satu operasi tersebut. Misalnya, jika Anda mengubah ukuran VM pada kluster yang sudah disebarkan ke ukuran berbeda menggunakan layanan Compute, status akan hilang saat aks-engine upgrade dijalankan.
  • Remediasi: Untuk membuatnya berfungsi, temukan model API untuk kluster, ubah ukurannya di sana, lalu jalankan aks-engine upgrade.
  • Kejadian: Saat mencoba mengubah ukuran menggunakan layanan Compute.

Operasi copot disk gagal di mesin AKS 0.55.0

  • Berlaku untuk: Azure Stack Hub (pembaruan 2005), mesin AKS 0.55.0
  • Deskripsi: Saat Anda mencoba menghapus penyebaran yang berisi volume persistensi, operasi penghapusan memicu serangkaian kesalahan lampirkan/copot. Hal ini karena bug di mesin AKS v0.55.0 Penyedia Cloud. Penyedia Cloud memanggil Azure Resource Manager menggunakan versi API yang lebih baru daripada yang saat ini didukung oleh Azure Resource Manager di Azure Stack Hub (pembaruan 2005).
  • Remediasi: Anda dapat menemukan detail dan langkah-langkah mitigasi di repositori GitHub mesin AKS (Masalah 3817). Tingkatkan segera setelah mesin AKS versi baru dan gambar yang sesuai tersedia.
  • Kejadian: Saat menghapus penyebaran yang berisi volume persistensi.

Masalah peningkatan di mesin AKS 0.51.0

  • Selama peningkatan (peningkatan mesin aks) kluster Kubernetes dari versi 1.15.x ke 1.16.x, tingkatkan komponen kubernetes berikut memerlukan langkah manual tambahan: kube-proxy, azure-cni- networkmonitor, csi-secrets-store, kubernetes-dashboard. Berikut ini menjelaskan apa yang mungkin Anda amati dan cara mengatasi masalah tersebut.

    • Di lingkungan yang tersambung, tidak jelas untuk melihat masalah ini karena tidak ada tanda-tanda di kluster bahwa komponen yang terpengaruh tidak ditingkatkan. Semuanya tampak berfungsi seperti yang diharapkan.
    kubectl get pods -n kube-system
    
    • Sebagai solusi sementara untuk memecahkan masalah ini untuk setiap komponen ini, jalankan perintah di kolom Solusi Sementara di tabel berikut.

      Nama Komponen Solusi Sementara Skenario yang Terpengaruh
      proksi kube kubectl delete ds kube-proxy -n kube-system Tersambung, Terputus
      azure-cni-networkmonitor kubectl delete ds azure-cni-networkmonitor -n kube-system Tersambung, Terputus
      csi-secrets-store sudo sed -i s/Always/IfNotPresent/g /etc/kubernetes/addons/secrets-store-csi-driver.yaml
      kubectl delete ds csi-secrets-store -n kube-system
      Terputus
      kubernetes-dashboard Jalankan perintah berikut di setiap node sarana kontrol:
      sudo sed -i s/Always/IfNotPresent/g /etc/kubernetes/addons/kubernetes-dashboard.yaml
      Terputus
  • Kubernetes 1.17 tidak didukung dalam rilis ini. Meskipun ada permintaan pull GitHub (PR) yang merujuk pada 1.17, itu tidak didukung.

Langkah berikutnya

Ringkasan mesin AKS di Azure Stack Hub