Automatische reparatie van het knoop punt Azure Kubernetes service (AKS)Azure Kubernetes Service (AKS) node auto-repair

AKS bewaakt voortdurend de status van worker-knoop punten en voert automatisch een herstel van het knoop punt uit als ze een slechte status hebben.AKS continuously monitors the health state of worker nodes and performs automatic node repair if they become unhealthy. Het Azure virtual machine (VM)-platform voert onderhoud uit op vm's die problemen ondervinden.The Azure virtual machine (VM) platform performs maintenance on VMs experiencing issues.

AKS en Azure-Vm's werken samen om service onderbrekingen voor clusters te minimaliseren.AKS and Azure VMs work together to minimize service disruptions for clusters.

In dit document leert u hoe automatische functionaliteit voor knooppunt herstel zich gedraagt voor zowel Windows-als Linux-knoop punten.In this document, you'll learn how automatic node repair functionality behaves for both Windows and Linux nodes.

Hoe AKS controleert op beschadigde knoop puntenHow AKS checks for unhealthy nodes

AKS maakt gebruik van de volgende regels om te bepalen of een knoop punt een slechte status heeft en moet worden hersteld:AKS uses the following rules to determine if a node is unhealthy and needs repair:

  • Het knoop punt rapporteert de status van de niet-opeenvolgende controles binnen een periode van tien minuten.The node reports NotReady status on consecutive checks within a 10-minute timeframe.
  • Het knoop punt rapporteert geen status binnen 10 minuten.The node doesn't report any status within 10 minutes.

U kunt de status van uw knoop punten hand matig controleren met kubectl.You can manually check the health state of your nodes with kubectl.

kubectl get nodes

Hoe werkt automatisch herstellen?How automatic repair works

Notitie

AKS initieert herstel bewerkingen met het gebruikers account AKS- herstellen.AKS initiates repair operations with the user account aks-remediator.

Als AKS een niet-gezond knoop punt identificeert dat gedurende tien minuten niet in orde is, neemt AKS de volgende acties:If AKS identifies an unhealthy node that remains unhealthy for 10 minutes, AKS takes the following actions:

  1. Start het knoop punt opnieuw op.Reboot the node.
  2. Als het opnieuw opstarten is mislukt, moet u de installatie kopie van het knoop punt opnieuw.If the reboot is unsuccessful, reimage the node.
  3. Als de installatie kopie niet kan worden teruggezet, maakt en vernieuwt u een nieuwe installatie kopie van het knoop punt.If the reimage is unsuccessful, create and reimage a new node.

Alternatieve herstel bewerkingen worden door AKS engineers onderzocht als het automatisch herstellen is mislukt.Alternative remediations are investigated by AKS engineers if auto-repair is unsuccessful.

Als AKS meerdere beschadigde knoop punten vindt tijdens een status controle, wordt elk knoop punt afzonderlijk gerepareerd voordat een ander herstel wordt gestart.If AKS finds multiple unhealthy nodes during a health check, each node is repaired individually before another repair begins.

Volgende stappenNext steps

Gebruik Beschikbaarheidszones om maximale Beschik baarheid te verg Roten met uw AKS-cluster werkbelastingen.Use Availability Zones to increase high availability with your AKS cluster workloads.