Automatisk reparation av Azure Kubernetes service-noden (AKS)Azure Kubernetes Service (AKS) node auto-repair

AKS övervakar kontinuerligt hälso tillståndet för arbetsnoder och utför automatisk reparation av noden om de blir felaktiga.AKS continuously monitors the health state of worker nodes and performs automatic node repair if they become unhealthy. Azure Virtual Machine (VM)-plattformen utför underhåll på virtuella datorer som har problem.The Azure virtual machine (VM) platform performs maintenance on VMs experiencing issues.

AKS och virtuella Azure-datorer fungerar tillsammans för att minimera tjänst avbrott i kluster.AKS and Azure VMs work together to minimize service disruptions for clusters.

I det här dokumentet får du lära dig hur automatisk reparation av noder fungerar för både Windows-och Linux-noder.In this document, you'll learn how automatic node repair functionality behaves for both Windows and Linux nodes.

Hur AKS söker efter felaktiga noderHow AKS checks for unhealthy nodes

AKS använder följande regler för att avgöra om en nod är felfri och behöver reparera:AKS uses the following rules to determine if a node is unhealthy and needs repair:

  • Noden rapporterar Notrappstegs status på efterföljande kontroller inom en tidsram på 10 minuter.The node reports NotReady status on consecutive checks within a 10-minute timeframe.
  • Noden rapporterar ingen status inom 10 minuter.The node doesn't report any status within 10 minutes.

Du kan kontrol lera hälso tillståndet för dina noder manuellt med kubectl.You can manually check the health state of your nodes with kubectl.

kubectl get nodes

Så här fungerar automatisk reparationHow automatic repair works

Anteckning

AKS initierar reparations åtgärder med användar kontot AKS-remediator.AKS initiates repair operations with the user account aks-remediator.

Om AKS identifierar en felaktig nod som inte är felfri i 10 minuter vidtar AKS följande åtgärder:If AKS identifies an unhealthy node that remains unhealthy for 10 minutes, AKS takes the following actions:

  1. Starta om noden.Reboot the node.
  2. Om omstarten Miss lyckas kan du återställa avbildningen av noden.If the reboot is unsuccessful, reimage the node.
  3. Om avbildningen Miss lyckas skapar du och återskapar en ny nod.If the reimage is unsuccessful, create and reimage a new node.

Alternativa reparationer undersökas av AKS-tekniker om automatisk reparation Miss lyckas.Alternative remediations are investigated by AKS engineers if auto-repair is unsuccessful.

Om AKS hittar flera felaktiga noder under en hälso kontroll repare ras varje nod individuellt innan en ny reparation påbörjas.If AKS finds multiple unhealthy nodes during a health check, each node is repaired individually before another repair begins.

Nästa stegNext steps

Använd Tillgänglighetszoner för att öka hög tillgänglighet med AKS-klustrets arbets belastningar.Use Availability Zones to increase high availability with your AKS cluster workloads.