Freigeben über


Grundlegende Problembehandlung bei Knotenfehlern, die nicht bereit sind

Dieser Artikel enthält Schritte zur Problembehandlung zum Wiederherstellen von AKS-Clusterknoten (Microsoft Azure Kubernetes Service) nach einem Fehler. In diesem Artikel werden insbesondere die häufigsten Fehlermeldungen behandelt, die beim Auftreten eines Knotenfehlers nicht bereit generiert werden, und es wird erläutert, wie die Knotenreparaturfunktionen sowohl für Windows- als auch für Linux-Knoten durchgeführt werden können.

Bevor Sie beginnen:

Lesen Sie den offiziellen Leitfaden zur Problembehandlung von Kubernetes-Clustern. Lesen Sie auch den Microsoft-Leitfaden für Techniker zur Problembehandlung bei Kubernetes. Dieser Leitfaden enthält Befehle zur Problembehandlung bei Pods, Knoten, Clustern und anderen Features.

Voraussetzungen

  • Azure CLI, Version 2.31 oder höher. Wenn die Azure CLI bereits installiert ist, können Sie die Versionsnummer ermitteln, indem Sie ausführen az --version.

Grundlegende Problembehandlung

AKS überwacht kontinuierlich den Integritätszustand von Workerknoten und repariert die Knoten automatisch, wenn sie fehlerhaft werden. Die Azure-VM-Plattform verwaltet VMs , bei denen Probleme auftreten. AKS und Azure-VMs arbeiten zusammen, um Dienstunterbrechungen für Cluster zu reduzieren.

Für Knoten gibt es zwei Arten von Takten:

Im Vergleich zu Aktualisierungen der .status-Datei eines Nodeist eine Lease einfache Ressource. Die Verwendung von Lease Objekten für Heartbeats verringert die Leistungsbeeinträchtigung dieser Updates für große Cluster.

Das Kubelet ist für das Erstellen und Aktualisieren der STATUS-Datei für Node -Objekte verantwortlich. Es ist auch für die Aktualisierung der Objekte verantwortlich, die Lease mit den Node -Objekten verknüpft sind.

Das Kubelet aktualisiert die Node.status-Datei, wenn eine der folgenden Bedingungen zutrifft:

  • Eine Änderung der status tritt auf.

  • Nach einem konfigurierten Zeitintervall erfolgt keine Aktualisierung.

Das Standardintervall für status Updates für ein Node beträgt fünf Minuten. Dieses Intervall ist viel länger als das Standardtimeout von 40 Sekunden für nicht erreichbare Knoten. Das Kubelet erstellt das Objekt und aktualisiert Lease es dann einmal alle zehn Sekunden (das Standardupdateintervall). Lease Updates unabhängig von Updates der Node status. Wenn das Lease Update fehlschlägt, wiederholt das Kubelet ein exponentielles Backoff, das bei 200 Millisekunden beginnt und auf maximal sieben Sekunden begrenzt ist.

Sie können keine für eine PodNode planen, die über eine status von NotReady oder Unknownverfügt. Sie können eine Pod nur für Knoten planen, die sich Ready im Zustand befinden.

Wenn sich Ihr Knoten im MemoryPressureZustand , DiskPressureoder PIDPressure befindet, müssen Sie Ihre Ressourcen verwalten, um zusätzliche Pods auf dem Knoten zu planen. Wenn sich Ihr Knoten im NetworkUnavailable Modus befindet, müssen Sie das Netzwerk auf dem Knoten ordnungsgemäß konfigurieren. Stellen Sie sicher, dass die folgenden Bedingungen erfüllt sind:

  • Ihr Cluster befindet sich im Status Erfolgreich (Wird ausgeführt). Um die cluster-status auf dem Azure-Portal zu überprüfen, suchen Sie nach Kubernetes-Diensten, wählen Sie diese Option aus, und wählen Sie den Namen Ihres AKS-Clusters aus. Suchen Sie dann auf der Seite Übersicht des Clusters in Essentials, um den Status zu finden. Oder geben Sie den Befehl az aks show in der Azure CLI ein.

    Azure-Portal Screenshot: Übersichtsseite eines Azure Kubernetes Service-Clusters Im abschnitt Essentials lautet der Status

  • Ihr Knotenpool verfügt über den BereitstellungsstatusErfolgreich und den EnergiestatusWird ausgeführt. Um den Knotenpool status auf dem Azure-Portal zu überprüfen, kehren Sie zur Seite Ihres AKS-Clusters zurück, und wählen Sie dann Knotenpools aus. Geben Sie alternativ den Befehl az aks nodepool show in der Azure CLI ein.

    Azure-Portal Screenshot eines Azure Kubernetes Service-Clusters (A K S)-Knotenpools. Der Bereitstellungsstatus lautet Erfolgreich. Der Energiezustand lautet Wird ausgeführt.

  • Die erforderlichen Ausgehenden Ports sind in Ihren Netzwerksicherheitsgruppen (NSGs) und der Firewall geöffnet, damit die IP-Adresse des API-Servers erreicht werden kann. Weitere Informationen finden Sie unter Erforderliche Netzwerkregeln für ausgehenden Datenverkehr und FQDNs für AKS-Cluster.

  • Ihre Knoten haben die neuesten Knotenimages bereitgestellt.

  • Ihre Knoten befinden sich Running im Zustand anstelle von Stopped oder Deallocated.

  • Ihr Cluster führt eine von AKS unterstützte Version von Kubernetes aus.

Haftungsausschluss für Kontaktinformationen von Drittanbietern

Die Kontaktinformationen zu den in diesem Artikel erwähnten Drittanbietern sollen Ihnen helfen, zusätzliche Informationen zu diesem Thema zu finden. Diese Kontaktinformationen können ohne vorherige Ankündigung geändert werden. Sie werden von Microsoft ohne jede Gewähr weitergegeben.