容器深入解析中的報表

容器深入解析中的報表針對 Azure 活頁簿現成提供,並建議使用。 本文描述可用的不同活頁簿,以及如何存取它們。

檢視活頁簿

在 Azure 入口網站的 [Azure 監視器] 功能表中,選取 [容器]。 在 [監視] 區段中選取 [深入解析],選擇特定的叢集,然後選取 [報表] 索引標籤。您也可以從 Azure 監視器中的活頁簿資源庫檢視。

Screenshot that shows the Reports page.

叢集最佳化活頁簿

叢集最佳化活頁簿提供多個分析器,讓您快速檢視 Kubernetes 叢集的健康情況和效能。 這有多個分析器,每個分析器都會提供與叢集相關的不同資訊。 叢集上啟用容器深入解析後,就不需要設定活頁簿。

活躍度探查失敗

活躍度探查失敗分析器會顯示最近失敗的活躍度探查,以及頻率。 選取一個以檢視時間序列的發生次數。 這分析器具有下列資料行:

  • 總計:計算整個時間範圍的活躍度探查失敗次數
  • 控制器總計:計算由控制器管理所有容器的活躍度探查失敗次數

Screenshot of Cluster Optimization Workbook.

事件異常

事件異常分析器會將類似的事件分組在一起,以便分析。 這也會顯示最近增加的事件群組數量。 清單中的事件會根據一般片語分組。 例如,具有訊息的兩個事件「pod-abc-123 失敗,無法提取映射」「pod-def-456 失敗,無法提取映射」會分組在一起。 峰值度資料行會評斷哪些事件為最近發生的。 例如,如果上個月的事件 A 和 B 平均每天發生 10 次,但事件 A 昨天發生 1,000 次,而事件 B 昨天發生 2 次,則事件 A 會比 B 高得多。

Screenshot of event anomaly analyzer in Cluster Optimization Workbook.

容器最佳化器

容器最佳化器分析器會顯示具有過多 CPU 和儲存體限制和要求的容器。 每個圖格都能以相同的規格來代表多個容器。例如,如果部署會建立 100 個相同的 Pod,且各有一個容器 C1 和 C2,則所有 C1 容器都會有單一圖格,而所有 C2 容器都會有單一圖格。 具有設定限制和要求的容器會以綠色到紅色的漸層進行色彩編碼。

重要

此檢視不包含 kube 系統命名空間中的容器,且不支援 Windows Server 節點。

每個圖格上的數字代表容器限制/要求與最佳/建議值之間的距離。 數字越接近 0 越好。 每個圖格都有色彩指出下列內容:

  • 綠色:完善設定限制和要求
  • 紅色:過多限制或要求
  • 灰色:取消設定限制或要求

Screenshot of container optimizer analyzer in the Cluster Optimization Workbook.

節點監視活頁簿

  • 磁碟容量:向容器內節點呈現的每個磁碟的互動式磁碟使用量圖表,會依下列透視圖:

    • 所有磁碟的磁碟使用量百分比。
    • 所有磁碟的可用磁碟空間。
    • 一個方格,顯示每個節點的磁碟、所使用空間的百分比、所使用空間百分比的趨勢、可用磁碟空間 (GiB),以及可用磁碟空間 (GiB) 的趨勢。 在資料表中選取資料列時,已使用空間的百分比和可用磁碟空間 (GiB) 會顯示在資料列下方。
  • 磁碟 IO:向容器內節點呈現的每個磁碟的互動式磁碟使用率圖表,會依下列透視圖:

    • 依讀取位元組/秒、寫入位元組/秒和讀取和寫入位元組/秒趨勢,以彙總所有磁碟的磁碟 I/O。
    • 八個效能圖表會顯示關鍵效能指標,以協助測量和識別磁碟 I/O 瓶頸。
  • GPU:每個 GPU 感知 Kubernetes 叢集節點的互動式 GPU 使用量圖表。

注意

根據 Kubernetes 上游公告,現成的 GPU 計量集合將會停用。 如需如何繼續收集 GPU 計量的指示,請參閱使用容器深入解析設定 GPU 監視

  • 子網路 IP 使用量:以下列檢視方塊顯示叢集內每個節點的互動式 IP 使用量圖表:

    • 從子網路配置 IP。
    • 指派給 Pod 的 IP。

注意

根據預設,會從子網路配置 16 個 IP 到每個節點。 這無法修改為小於 16。 如需如何啟用子網路 IP 使用計量的指示,請參閱監視 IP 子網路使用量

資源監視活頁簿

  • 部署:您的部署狀態和水平 Pod 自動調整程式 (HPA) 包括自訂 HPA。

  • 工作負載詳細資料:會顯示命名空間工作負載的效能統計資料的互動式圖表。 包括下列多個索引標籤:

    • POD 的 CPU 和記憶體使用量概觀
    • POD/容器狀態,顯示 POD 重新啟動趨勢、容器重新啟動趨勢,以及 POD 的容器狀態。
    • Kubernetes 事件,顯示控制器的事件摘要。
  • Kubelet:包含兩個方格,其中顯示主要節點作業統計資料:

    • 依節點方格的概觀會依每個節點的百分比和趨勢,彙總作業總計、錯誤總計和成功的作業。
    • 依作業類型的概觀會依百分比和趨勢,彙總每個作業的作業總計、錯誤總計和成功的作業。

帳單活頁簿

  • 資料使用量:協助您以視覺化方式呈現資料的來源,而不需透過我們在文件中共用的項目建置您自己的查詢程式庫。 在此活頁簿中,您可以檢視呈現可計費資料的圖表,例如:

    • 依解決方案內嵌的可計費資料總計 (以 GB 為單位)。
    • 依容器記錄 (應用程式記錄) 內嵌的可計費資料。
    • 依 Kubernetes 命名空間內嵌的可計費容器記錄資料。
    • 依叢集名稱隔離、內嵌的可計費容器記錄資料。
    • 依記錄來源項目內嵌的可計費容器記錄資料。
    • 依診斷主節點記錄內嵌的可計費診斷資料。

網路活頁簿

  • NPM 設定:監視透過網路原則管理員 (NPM) 設定的網路設定,其中針對:

    • 整體設定複雜度的相關摘要資訊。
    • 一段時間的原則、規則和設定計數,允許深入解析這三者之間的關聯性,以及新增時間維度來偵錯設定。
    • 所有 IPSet 和每個 IPSet 中的項目數。
    • 每個節點最差和平均案例效能,用於將元件新增至網路設定。
  • 網路:每個節點網路介面卡的互動式網路使用率圖表。 格線會呈現關鍵效能指標,以協助測量網路介面卡的效能。

建立自訂活頁簿

若要根據上述任何活頁簿建立自訂活頁簿,請選取 [檢視活頁簿] 下拉式清單,然後在清單底部選則 [移至 AKS 資源庫]。 若需活頁簿和使用活頁簿範本的詳細資訊,請參閱 Azure 監視器活頁簿

Screenshot that shows the AKS gallery.

下一步

如需 Azure 監視器活頁簿的詳細資訊,請參閱使用 Azure 監視器活頁簿建立互動式報表