Procedure di valutazione per le operazioni del servizio Azure Kubernetes

Un'analisi della causa radice per un cluster servizio Azure Kubernetes (servizio Azure Kubernetes) è spesso complessa. Per semplificare il processo, valutare i problemi usando un approccio dall'alto verso il basso basato sulla gerarchia del cluster. Iniziare a livello di cluster ed eseguire il drill-down, se necessario.

Diagram that shows the hierarchy of AKS cluster components: Cluster, node pools, nodes, pods, and containers.

La sezione seguente offre una panoramica di una serie di procedure di valutazione, che descrivono in dettaglio l'approccio dall'alto verso il basso. Gli articoli forniscono esempi che usano un set di strumenti e dashboard. Gli articoli descrivono in che modo questi esempi evidenziano i sintomi dei problemi.

I problemi comuni risolti in questa serie includono:

  • Problemi di rete e connettività causati da una configurazione non corretta.
  • Comunicazione interrotta tra il piano di controllo e il nodo.
  • Carichi di lavoro Kubelet causati da risorse di calcolo, memoria o archiviazione insufficienti.
  • Problemi di risoluzione dns (Domain Name System).
  • Nodi che eseguono operazioni di input/output del disco al secondo (IOPS).
  • Pipeline di controllo di ammissione che blocca diverse richieste al server API.
  • Un cluster che non dispone delle autorizzazioni per eseguire il pull dal registro contenitori appropriato.

Questa serie non è progettata per risolvere problemi specifici. Per informazioni sulla risoluzione dei problemi specifici, vedere Risoluzione dei problemi del servizio Azure Kubernetes.

Serie di procedure di valutazione

Passaggio Descrizione
1. Valutare l'integrità del cluster del servizio Azure Kubernetes. Controllare l'integrità complessiva del cluster e della rete.
2. Esaminare l'integrità dei nodi e dei pod. Valutare l'integrità dei nodi del ruolo di lavoro del servizio Azure Kubernetes.
3. Monitorare le distribuzioni dei carichi di lavoro. Assicurarsi che tutte le distribuzioni e DaemonSet le funzionalità siano in esecuzione.
4. Convalidare i controller di ammissione. Verificare se i controller di ammissione funzionano come previsto.
5. Verificare la connessione al registro contenitori. Verificare la connessione al registro contenitori.

Collaboratori

Questo articolo viene gestito da Microsoft. Originariamente è stato scritto dai seguenti contributori.

Autore principale:

Altri contributori:

Per visualizzare i profili LinkedIn non pubblici, accedere a LinkedIn.

Passaggi successivi