Problembehandlung bei Knotenfehlern, die nicht bereit sind, gefolgt von Wiederherstellungen
Dieser Artikel hilft bei der Problembehandlung bei Szenarien, in denen ein Knoten in einem Microsoft Azure Kubernetes Service (AKS)-Cluster den Status "Knoten nicht bereit" anzeigt, dann aber automatisch in einen fehlerfreien Zustand wiederhergestellt wird.
Problembeschreibung
Sie stellen fest, dass Ihre Anwendung nicht mehr reagiert, während der Knoten meldet, dass er den Status "Nicht bereit" aufweist. Der Knoten wird jedoch automatisch wiederhergestellt, und jetzt sucht er nach einer Ursachenanalyse (Root Cause Analysis, RCA).
Ursache
Mögliche Ursachen für dieses Problem sind die folgenden Szenarien:
Der API-Server ist nicht verfügbar, und Sie verwenden eine Bereitschaftssonde für die Bereitstellung.
Wenn ein Pod ausgeführt wird, aber nicht bereit ist, bedeutet dies, dass die Bereitschaftssonde fehlschlägt. Wenn die Bereitschaftsüberprüfung fehlschlägt, ist der Pod nicht an den Dienst angefügt, und der Datenverkehr wird nicht an die Pod-Instanz weitergeleitet.
Vm-Hostfehler (Virtual Machine) treten auf. Um festzustellen, ob VM-Hostfehler aufgetreten sind, überprüfen Sie die folgenden Informationsquellen:
- AKS-Diagnose
- Azure-Status
- Azure-Benachrichtigungen (für alle kürzlichen Ausfälle oder Wartungszeiträume)
Prävention
Um zu verhindern, dass dieses Problem in der Zukunft auftritt, führen Sie eine oder mehrere der folgenden Aktionen aus:
- Stellen Sie sicher, dass Ihre Serviceebene vollständig bezahlt ist.
- Verringern Sie die Anzahl und
watchgetAnforderungen an den API-Server. - Ersetzen Sie den Knotenpool durch einen fehlerfreien Knotenpool.
Weitere Informationen
- Allgemeine Schritte zur Problembehandlung finden Sie unter "Grundlegende Problembehandlung" bei Node Not Ready-Fehlern.