Azure Kubernetes Service (AKS) düğümü otomatik onarımı
AKS, çalışan düğümlerinin sistem durumunu sürekli izler ve iyi durumda olmayan düğümler için otomatik düğüm onarımı gerçekleştirir. Azure sanal makine (VM) platformu, sorun yaşayan VM'lerde bakım gerçekleştirir.
AKS ve Azure VM'leri, kümeler için hizmet kesintilerini en aza indirmek için birlikte çalışır.
Bu belgede, otomatik düğüm onarım işlevinin hem düğümler hem de Linux düğümleri için Windows davranacağını öğrenirsiniz.
AKS,iyi durumda olmayan düğümleri nasıl denetler?
AKS, bir düğümün iyi durumda olup olmadığını ve onarıma ihtiyaç olup olmadığını belirlemek için aşağıdaki kuralları kullanır:
- Düğüm, 10 dakikalık bir zaman çerçevesi içinde ardışık denetimlerde NotReady durumunu raporlar.
- Düğüm 10 dakika içinde herhangi bir durum bildirmez.
Kubectl ile düğümlerinizin durumunu el ile kontrol edebilirsiniz.
kubectl get nodes
Otomatik onarım nasıl çalışır?
Not
AKS, aks-mediator kullanıcı hesabıyla onarım işlemleri başlatıyor.
AKS, 10 dakika boyunca iyi durumda olmayan bir düğümü tanımlarsa AKS aşağıdaki eylemleri gerçekleştirmektedir:
- Düğümü yeniden başlatın.
- Yeniden başlatma başarısız olursa düğümü yeniden başlatın.
Otomatik onarım başarısız olursa alternatif düzeltmeler AKS mühendisleri tarafından araştırılan bir yöntemdir.
AKS, bir durum denetimi sırasında birden çok iyi durumda olmayan düğüm bulursa, başka bir onarım başlamadan önce her düğüm ayrı ayrı onarıldı.
Sınırlamalar
Çoğu durumda AKS, bir düğümün iyi durumda olup olmadığını saptayarak sorunu onarmaya çalışsa da AKS'nin sorunu onarama veya bir sorun olduğunu algılayama gibi durumlar vardır. Örneğin AKS, ağ yapılandırmasında hata nedeniyle düğüm durumu bildirilene kadar sorunları algılayamaz.
Sonraki adımlar
AKS Kullanılabilirlik Alanları iş yükleriniz ile yüksek kullanılabilirliği artırmak için Kullanılabilirlik Alanları'i kullanın.