Azure Kubernetes Service (AKS) automatisk reparation av nod
AKS övervakar kontinuerligt hälsotillståndet för arbetsnoder och utför automatisk nodreparation om de inte är fel. Plattformen för virtuella Azure-datorer (VM) utför underhåll på virtuella datorer som har problem.
AKS och virtuella Azure-datorer fungerar tillsammans för att minimera tjänstavbrott för kluster.
I det här dokumentet får du lära dig hur funktionen för automatisk nodreparation fungerar för både Windows- och Linux-noder.
Så här söker AKS efter noder med feltillstånd
AKS använder följande regler för att avgöra om en nod är skadad och behöver repareras:
- Noden rapporterar NotReady-status vid efterföljande kontroller inom en tidsram på 10 minuter.
- Noden rapporterar ingen status inom 10 minuter.
Du kan manuellt kontrollera hälsotillståndet för noderna med kubectl.
kubectl get nodes
Så här fungerar automatisk reparation
Anteckning
AKS initierar reparationsåtgärder med användarkontots aks-remediator.
Om AKS identifierar en nod med feltillstånd som inte är feltillstånd i 10 minuter, vidtar AKS följande åtgärder:
- Starta om noden.
- Om omstarten misslyckas avbildar du noden igen.
Alternativa åtgärder undersöks av AKS-tekniker om den automatiska reparationen misslyckas.
Om AKS hittar flera noder med fel under en hälsokontroll repareras varje nod individuellt innan en annan reparation påbörjas.
Begränsningar
I många fall kan AKS avgöra om en nod är skadad och försöka reparera problemet, men det finns fall där AKS antingen inte kan reparera problemet eller inte kan identifiera att det finns ett problem. AKS kan till exempel inte identifiera problem om en nodstatus inte rapporteras på grund av fel i nätverkskonfigurationen.
Nästa steg
Använd Tillgänglighetszoner för att öka hög tillgänglighet med dina AKS-klusterarbetsbelastningar.