Masalah yang diketahui terkait mesin AKS di Azure Stack Hub

Artikel ini menjelaskan masalah yang diketahui untuk mesin AKS di Azure Stack Hub.

Rahasia kedaluwarsa untuk perwakilan layanan (SPN) menyebabkan kluster gagal

  • Berlaku untuk: Masalah ini berlaku untuk semua rilis.

  • Deskripsi: Ketika rahasia kedaluwarsa untuk SPN, kluster akan gagal. Hal ini akan memengaruhi semua kluster kubernetes yang disebarkan menggunakan mesin AKS. Ketika rahasia Anda kedaluwarsa, kluster Anda tidak akan berfungsi.

  • Remediasi: Untuk mengurangi masalah, masuk ke setiap node kubernetes untuk memperbarui file konfigurasi /etc/kubernetes/azure.json dengan ID Aplikasi SPN baru dan rahasia yang tidak kedaluwarsa. Anda mungkin perlu menghubungi operator cloud Azure Stack Hub untuk mendapatkan SPN dan rahasia saat ini. Untuk petunjuk, lihat Menggunakan identitas aplikasi untuk mengakses sumber daya

    1. Anda dapat menggunakan perintah berikut pada node Linux Anda:

      sudo sed -i s/f072c125-c99c-4781-9e85-246b981cd52b/094b1318-baea-4584-bf9c-4a40501ce21b/1 /etc/kubernetes/azure.json
      
    2. Hidupkan ulang layanan kubelet menggunakan perintah berikut:

      sudo systemctl reboot node
      

    Anda juga dapat menggunakan SPN dan rahasia dengan model API dan memaksa peningkatan. Untuk mengetahui petunjuknya, lihat Memaksa peningkatan.

  • Kejadian: Umum

Sertifikat kedaluwarsa untuk proksi depan

  • Berlaku untuk: Masalah ini berlaku untuk semua rilis.
  • Deskripsi: Saat sertifikat Anda kedaluwarsa, kubectl top, server metrik, mungkin berhenti berfungsi.
  • Remediasi: Anda harus memperbarui sertifikat. Anda dapat menemukan langkah-langkah di Memutar sertifikat Kubernetes di Azure Stack Hub
  • Kejadian: Umum

Batas 50 node per langganan

  • Berlaku untuk: Azure Stack Hub, mesin AKS (semua)
  • Deskripsi: Saat membuat kluster, Anda harus memastikan bahwa tidak ada lebih dari 50 simpul Kube (sarana kontrol dan simpul agen) yang disebarkan per langganan. Total simpul Kubernetes yang disebarkan di semua kluster dalam satu langganan tidak boleh melebihi 50 simpul.
  • Remediasi: Gunakan kurang dari 51 simpul dalam langganan Anda.
  • Kejadian: Saat mencoba menambahkan lebih dari 50 node per langganan.

Tidak dapat mengubah ukuran VM kluster dengan layanan Compute

  • Berlaku untuk: Azure Stack Hub, mesin AKS (semua)
  • Deskripsi: Mengubah ukuran VM kluster melalui layanan Komputasi tidak berfungsi dengan mesin AKS. Mesin AKS mempertahankan status kluster dalam file JSON model API. Untuk memastikan bahwa ukuran VM yang diinginkan tercermin dalam operasi buat, tingkatkan, atau skala apa pun yang dilakukan dengan mesin AKS, perbarui model API sebelum Anda menjalankan salah satu operasi tersebut. Misalnya, jika Anda mengubah ukuran VM pada kluster yang sudah disebarkan ke ukuran yang berbeda menggunakan layanan Komputasi, status hilang saat aks-engine upgrade dijalankan.
  • Remediasi: Untuk membuat ini berfungsi, temukan model API untuk kluster, ubah ukuran di sana, lalu jalankan aks-engine upgrade.
  • Kejadian: Saat mencoba mengubah ukuran menggunakan layanan Compute.

Operasi copot disk gagal di mesin AKS 0.55.0

  • Berlaku untuk: Azure Stack Hub (pembaruan 2005), mesin AKS 0.55.0
  • Deskripsi: Saat Anda mencoba menghapus penyebaran yang berisi volume persisten, operasi penghapusan memicu serangkaian kesalahan lampirkan/lepaskan. Masalah ini disebabkan oleh bug di penyedia cloud mesin AKS v0.55.0. Penyedia cloud memanggil Azure Resource Manager menggunakan versi API yang lebih baru dari versi azure Resource Manager di Azure Stack Hub (pembaruan 2005) saat ini mendukung.
  • Remediasi: Untuk detail dan langkah-langkah mitigasi, lihat repositori GitHub mesin AKS (masalah 3817). Tingkatkan segera setelah build baru mesin AKS dan gambar yang sesuai tersedia.
  • Kemunculan: Saat menghapus penyebaran yang berisi volume persisten.

Masalah peningkatan di mesin AKS 0.51.0

  • Selama peningkatan mesin AKS dari kluster Kubernetes dari versi 1.15.x ke 1.16.x, meningkatkan komponen Kubernetes berikut memerlukan langkah-langkah manual tambahan: kube-proxy, azure-cni-networkmonitor, csi-secrets-store, kubernetes-dashboard. Informasi berikut menjelaskan apa yang mungkin Anda lihat dan cara mengatasi masalah tersebut.

    • Di lingkungan yang terhubung, masalah ini tidak jelas, karena tidak ada tanda-tanda di kluster bahwa komponen yang terpengaruh tidak ditingkatkan. Semuanya tampak berfungsi seperti yang diharapkan.

      kubectl get pods -n kube-system
      
    • Sebagai solusi untuk mengatasi masalah ini untuk setiap komponen ini, jalankan perintah di kolom Solusi dalam tabel berikut.

      Nama Komponen Solusi Sementara Skenario yang Terpengaruh
      proksi kube kubectl delete ds kube-proxy -n kube-system Tersambung, Terputus
      azure-cni-networkmonitor kubectl delete ds azure-cni-networkmonitor -n kube-system Tersambung, Terputus
      csi-secrets-store sudo sed -i s/Always/IfNotPresent/g /etc/kubernetes/addons/secrets-store-csi-driver.yaml
      kubectl delete ds csi-secrets-store -n kube-system
      Terputus
      kubernetes-dashboard Jalankan perintah berikut di setiap node sarana kontrol:
      sudo sed -i s/Always/IfNotPresent/g /etc/kubernetes/addons/kubernetes-dashboard.yaml
      Terputus
  • Kubernetes 1.17 tidak didukung dalam rilis ini. Meskipun ada permintaan pull GitHub (PR) yang merujuk pada 1.17, itu tidak didukung.

Node kluster berpindah ke status "Belum Siap" dan k8s-kern.log berisi pesan "Memori cgroup kehabisan memori"

  • Berlaku untuk: Azure Stack Hub, mesin AKS (semua)

  • Deskripsi: Simpul kluster berpindah ke status "Belum Siap" dan file k8s-kern.log berisi pesan Memory cgroup out of memory. Masalah ini berlaku untuk semua rilis mesin AKS. Untuk memeriksa apakah masalah ini terjadi pada sistem Anda, cari file k8s-kern.log untuk string "Memori cgroup kehabisan memori."

    Anda dapat menemukan file k8s-kern.log dengan:

    • Menjalankan aks-engine get-logs dan menavigasi ke ${NODE_NAME}/var/log/k8s-kern.log, OR
    • Menavigasi ke /var/log/kern.log pada sistem file simpul.
  • Remediasi: Untuk simpul sarana kontrol, tingkatkan ukuran VM profil master. Untuk simpul agen, tingkatkan ukuran VM kumpulan simpul atau tingkatkan kumpulan simpul. Untuk meningkatkan kumpulan simpul, jalankan perintah yang didokumen scale dan ikuti instruksinya.

    Untuk meningkatkan ukuran kumpulan VM, perbarui model API dan jalankan aks-engine upgrade. Semua VM dihapus dan dibuat ulang dengan ukuran VM baru.

  • Kemunculan: Ketika memori yang diperlukan/dikonsumsi oleh node kluster melebihi memori yang tersedia.

Langkah berikutnya

Ringkasan mesin AKS di Azure Stack Hub