Grundlegende Problembehandlung bei Knotenfehlern, die nicht bereit sind
Dieser Artikel enthält Schritte zur Problembehandlung zum Wiederherstellen von AKS-Clusterknoten (Microsoft Azure Kubernetes Service) nach einem Fehler. In diesem Artikel werden insbesondere die häufigsten Fehlermeldungen behandelt, die beim Auftreten eines Knotenfehlers nicht bereit generiert werden, und es wird erläutert, wie die Knotenreparaturfunktionen sowohl für Windows- als auch für Linux-Knoten durchgeführt werden können.
Bevor Sie beginnen:
Lesen Sie den offiziellen Leitfaden zur Problembehandlung von Kubernetes-Clustern. Lesen Sie auch den Microsoft-Leitfaden für Techniker zur Problembehandlung bei Kubernetes. Dieser Leitfaden enthält Befehle zur Problembehandlung bei Pods, Knoten, Clustern und anderen Features.
Voraussetzungen
- Azure CLI, Version 2.31 oder höher. Wenn die Azure CLI bereits installiert ist, können Sie die Versionsnummer ermitteln, indem Sie ausführen
az --version
.
Grundlegende Problembehandlung
AKS überwacht kontinuierlich den Integritätszustand von Workerknoten und repariert die Knoten automatisch, wenn sie fehlerhaft werden. Die Azure-VM-Plattform verwaltet VMs , bei denen Probleme auftreten. AKS und Azure-VMs arbeiten zusammen, um Dienstunterbrechungen für Cluster zu reduzieren.
Für Knoten gibt es zwei Arten von Takten:
Updates zur STATUS-Datei eines
Node
Objekts.Leasen von Objekten im Kube-node-lease-Namespace . Jedem
Node
ist ein -Objekt zugeordnetLease
.
Im Vergleich zu Aktualisierungen der .status-Datei eines Node
ist eine Lease
einfache Ressource. Die Verwendung von Lease
Objekten für Heartbeats verringert die Leistungsbeeinträchtigung dieser Updates für große Cluster.
Das Kubelet ist für das Erstellen und Aktualisieren der STATUS-Datei für Node
-Objekte verantwortlich. Es ist auch für die Aktualisierung der Objekte verantwortlich, die Lease
mit den Node
-Objekten verknüpft sind.
Das Kubelet aktualisiert die Node
.status-Datei, wenn eine der folgenden Bedingungen zutrifft:
Eine Änderung der status tritt auf.
Nach einem konfigurierten Zeitintervall erfolgt keine Aktualisierung.
Das Standardintervall für status Updates für ein Node
beträgt fünf Minuten. Dieses Intervall ist viel länger als das Standardtimeout von 40 Sekunden für nicht erreichbare Knoten. Das Kubelet erstellt das Objekt und aktualisiert Lease
es dann einmal alle zehn Sekunden (das Standardupdateintervall). Lease
Updates unabhängig von Updates der Node
status. Wenn das Lease
Update fehlschlägt, wiederholt das Kubelet ein exponentielles Backoff, das bei 200 Millisekunden beginnt und auf maximal sieben Sekunden begrenzt ist.
Sie können keine für eine Pod
Node
planen, die über eine status von NotReady
oder Unknown
verfügt. Sie können eine Pod
nur für Knoten planen, die sich Ready
im Zustand befinden.
Wenn sich Ihr Knoten im MemoryPressure
Zustand , DiskPressure
oder PIDPressure
befindet, müssen Sie Ihre Ressourcen verwalten, um zusätzliche Pods auf dem Knoten zu planen. Wenn sich Ihr Knoten im NetworkUnavailable
Modus befindet, müssen Sie das Netzwerk auf dem Knoten ordnungsgemäß konfigurieren. Stellen Sie sicher, dass die folgenden Bedingungen erfüllt sind:
Ihr Cluster befindet sich im Status Erfolgreich (Wird ausgeführt). Um die cluster-status auf dem Azure-Portal zu überprüfen, suchen Sie nach Kubernetes-Diensten, wählen Sie diese Option aus, und wählen Sie den Namen Ihres AKS-Clusters aus. Suchen Sie dann auf der Seite Übersicht des Clusters in Essentials, um den Status zu finden. Oder geben Sie den Befehl az aks show in der Azure CLI ein.
Ihr Knotenpool verfügt über den BereitstellungsstatusErfolgreich und den EnergiestatusWird ausgeführt. Um den Knotenpool status auf dem Azure-Portal zu überprüfen, kehren Sie zur Seite Ihres AKS-Clusters zurück, und wählen Sie dann Knotenpools aus. Geben Sie alternativ den Befehl az aks nodepool show in der Azure CLI ein.
Die erforderlichen Ausgehenden Ports sind in Ihren Netzwerksicherheitsgruppen (NSGs) und der Firewall geöffnet, damit die IP-Adresse des API-Servers erreicht werden kann. Weitere Informationen finden Sie unter Erforderliche Netzwerkregeln für ausgehenden Datenverkehr und FQDNs für AKS-Cluster.
Ihre Knoten haben die neuesten Knotenimages bereitgestellt.
Ihre Knoten befinden sich
Running
im Zustand anstelle vonStopped
oderDeallocated
.Ihr Cluster führt eine von AKS unterstützte Version von Kubernetes aus.
Haftungsausschluss für Kontaktinformationen von Drittanbietern
Die Kontaktinformationen zu den in diesem Artikel erwähnten Drittanbietern sollen Ihnen helfen, zusätzliche Informationen zu diesem Thema zu finden. Diese Kontaktinformationen können ohne vorherige Ankündigung geändert werden. Sie werden von Microsoft ohne jede Gewähr weitergegeben.
Feedback
https://aka.ms/ContentUserFeedback.
Bald verfügbar: Im Laufe des Jahres 2024 werden wir GitHub-Issues stufenweise als Feedbackmechanismus für Inhalte abbauen und durch ein neues Feedbacksystem ersetzen. Weitere Informationen finden Sie unterFeedback senden und anzeigen für