Azure Kubernetes Service uzlu (AKS)
AKS nepřetržitě monitoruje stav pracovních uzlů a provádí automatickou opravu uzlů, pokud nejsou v pořádku. Platforma virtuálních počítačů Azure provádí údržbu virtuálních počítačů, u kterých dochází k problémům.
AKS a virtuální počítače Azure spolupracují, aby se minimalizovala přerušení služeb pro clustery.
V tomto dokumentu se dozvíte, jak se funkce automatické opravy uzlů chová pro uzly Windows i Linuxu.
Jak AKS kontroluje uzly, které není v pořádku
AKS používá následující pravidla k určení, jestli uzel není v pořádku a potřebuje ho opravit:
- Uzel hlásí stav NotReady při po sobě jdoucích kontrolách během 10 minut.
- Uzel během 10 minut nenahlásit žádný stav.
Stav uzlů můžete ručně zkontrolovat pomocí kubectl.
kubectl get nodes
Jak funguje automatická oprava
Poznámka
AKS zahájí opravné operace pomocí uživatelského účtu aks-remediator.
Pokud AKS identifikuje uzel, který není v pořádku a není v pořádku po dobu 10 minut, AKS provede následující akce:
- Restartujte uzel.
- Pokud restartování neproběhne úspěšně, z image uzlu znovu z image.
Alternativní nápravy prověří technici AKS v případě neúspěchu automatické opravy.
Pokud AKS během kontroly stavu najde několik uzlů, které není v pořádku, opraví se každý uzel jednotlivě před zahájením další opravy.
Omezení
V mnoha případech může AKS určit, jestli uzel není v pořádku, a pokusit se problém opravit, ale existují případy, kdy AKS buď nemůže problém opravit, nebo nemůže zjistit, že došlo k problému. AKS například nezjistí problémy, pokud se stav uzlu nehlásil kvůli chybě v konfiguraci sítě.
Další kroky
Pomocí Zóny dostupnosti zvyšte vysokou dostupnost pomocí úloh clusteru AKS.