Azure Kubernetes Service uzlu (AKS)

AKS nepřetržitě monitoruje stav pracovních uzlů a provádí automatickou opravu uzlů, pokud nejsou v pořádku. Platforma virtuálních počítačů Azure provádí údržbu virtuálních počítačů, u kterých dochází k problémům.

AKS a virtuální počítače Azure spolupracují, aby se minimalizovala přerušení služeb pro clustery.

V tomto dokumentu se dozvíte, jak se funkce automatické opravy uzlů chová pro uzly Windows i Linuxu.

Jak AKS kontroluje uzly, které není v pořádku

AKS používá následující pravidla k určení, jestli uzel není v pořádku a potřebuje ho opravit:

  • Uzel hlásí stav NotReady při po sobě jdoucích kontrolách během 10 minut.
  • Uzel během 10 minut nenahlásit žádný stav.

Stav uzlů můžete ručně zkontrolovat pomocí kubectl.

kubectl get nodes

Jak funguje automatická oprava

Poznámka

AKS zahájí opravné operace pomocí uživatelského účtu aks-remediator.

Pokud AKS identifikuje uzel, který není v pořádku a není v pořádku po dobu 10 minut, AKS provede následující akce:

  1. Restartujte uzel.
  2. Pokud restartování neproběhne úspěšně, z image uzlu znovu z image.

Alternativní nápravy prověří technici AKS v případě neúspěchu automatické opravy.

Pokud AKS během kontroly stavu najde několik uzlů, které není v pořádku, opraví se každý uzel jednotlivě před zahájením další opravy.

Omezení

V mnoha případech může AKS určit, jestli uzel není v pořádku, a pokusit se problém opravit, ale existují případy, kdy AKS buď nemůže problém opravit, nebo nemůže zjistit, že došlo k problému. AKS například nezjistí problémy, pokud se stav uzlu nehlásil kvůli chybě v konfiguraci sítě.

Další kroky

Pomocí Zóny dostupnosti zvyšte vysokou dostupnost pomocí úloh clusteru AKS.