Problembehandlung bei Knotenfehlern, die nicht bereit sind, gefolgt von Wiederherstellungen

Dieser Artikel hilft bei der Problembehandlung bei Szenarien, in denen ein Knoten in einem Microsoft Azure Kubernetes Service (AKS)-Cluster den Status "Knoten nicht bereit" anzeigt, dann aber automatisch in einen fehlerfreien Zustand wiederhergestellt wird.

Problembeschreibung

Sie stellen fest, dass Ihre Anwendung nicht mehr reagiert, während der Knoten meldet, dass er den Status "Nicht bereit" aufweist. Der Knoten wird jedoch automatisch wiederhergestellt, und jetzt sucht er nach einer Ursachenanalyse (Root Cause Analysis, RCA).

Ursache

Mögliche Ursachen für dieses Problem sind die folgenden Szenarien:

  • Der API-Server ist nicht verfügbar, und Sie verwenden eine Bereitschaftssonde für die Bereitstellung.

    Wenn ein Pod ausgeführt wird, aber nicht bereit ist, bedeutet dies, dass die Bereitschaftssonde fehlschlägt. Wenn die Bereitschaftsüberprüfung fehlschlägt, ist der Pod nicht an den Dienst angefügt, und der Datenverkehr wird nicht an die Pod-Instanz weitergeleitet.

  • Vm-Hostfehler (Virtual Machine) treten auf. Um festzustellen, ob VM-Hostfehler aufgetreten sind, überprüfen Sie die folgenden Informationsquellen:

Prävention

Um zu verhindern, dass dieses Problem in der Zukunft auftritt, führen Sie eine oder mehrere der folgenden Aktionen aus:

  • Stellen Sie sicher, dass Ihre Serviceebene vollständig bezahlt ist.
  • Verringern Sie die Anzahl und watch get Anforderungen an den API-Server.
  • Ersetzen Sie den Knotenpool durch einen fehlerfreien Knotenpool.

Weitere Informationen