適用於 Prometheus 的 Azure 監視器受管理服務

適用於 Prometheus 的 Azure 監視器受控服務是 Azure 監視器計量元件,可讓您在 Azure 監視器收集和分析計量數據類型方面提供更多彈性。 Prometheus 計量支援分析工具,例如搭配 PromQL 的 Azure 監視器計量總管,以及 PromQLGrafana 等 開放原始碼 工具。

適用於 Prometheus 的 Azure 監視器受控服務可讓您根據 Cloud Native Computing Foundation 的 Prometheus 專案,使用與 Prometheus 相容的監視解決方案大規模收集及分析計量。 此完全受控的服務可讓您使用 Prometheus 查詢語言 (PromQL) 來分析和警示受監視基礎結構和工作負載的效能,而不需要操作基礎結構。

重要

適用於 Prometheus 的 Azure 監視器受控服務旨在儲存客戶機器和應用程式服務健康情況的相關信息。 它不適用於儲存任何分類為個人標識資訊 (PII) 或使用者標識資訊 (EUII) 的數據。 強烈建議您不要將任何敏感性資訊(使用者名稱、信用卡號碼等)傳送至適用於 Prometheus 的 Azure 監視器受控服務,例如計量名稱、標籤名稱或標籤值。

資料來源

適用於 Prometheus 的 Azure 監視器受控服務目前可從下列任何資料來源收集資料:

  • Azure Kubernetes Service (AKS)
  • 已啟用 Azure Arc 的 Kubernetes

啟用

啟用適用於 Prometheus 的 Azure 監視器受控服務的唯一需求是建立 Azure 監視器工作區,也就是 Prometheus 計量的儲存位置。 建立此工作區之後,您即可將收集 Prometheus 計量的服務上線。

遠端寫入

除了 Prometheus 的受控服務之外,您也可以使用自我管理 Prometheus 和遠端寫入來收集計量,並將其儲存在 Azure 監視器工作區中。

Kubernetes 服務

從 Kubernetes 叢集上的自我管理 Prometheus 傳送計量。 如需 Kubernetes 服務的 Azure 監視器工作區遠端寫入詳細資訊,請參閱下列文章:

虛擬機器和虛擬機擴展集

從虛擬機和虛擬機擴展集上的自我管理 Prometheus 傳送數據。 伺服器可以位於 Azure 管理的環境或內部部署環境中。 Fro 詳細資訊,請參閱將 Prometheus 計量從 虛擬機器 傳送至 Azure 監視器工作區

使用 PromQL 的 Azure 監視器計量總管

具有 PromQL 的計量總管可讓您分析及可視化平台計量,並使用 Prometheus 查詢語言 (PromQL) 來查詢 Prometheus 和其他儲存在 Azure 監視器工作區中的計量。 您可以從 Azure 入口網站 中任何 Azure 監視器工作區的 [計量] 功能表項,取得具有 PromQL 的計量瀏覽器。 如需詳細資訊,請參閱 使用 PromQL 的計量總管。

Grafana 整合

可視化 Prometheus 計量 的主要方法是 Azure Managed Grafana連線 您的 Azure 監視器工作區至 Grafana 工作區,使其可作為 Grafana 儀錶板中的數據源。 接著,您可以存取多個使用 Prometheus 計量的預先建置儀錶板,以及建立任意數目自定義儀錶板的能力。

規則和警示

適用於 Prometheus 的 Azure 監視器受控服務支援使用 PromQL 查詢記錄規則和警示規則。 錄製規則所記錄的計量會儲存在 Azure 監視器工作區中,而且可由儀錶板或其他規則查詢。 您可以使用 Azure 受控 Prometheus 規則群組來建立和管理警示規則和錄製規則。 針對您的 AKS 叢集,會提供一組 預先定義的 Prometheus 警示規則錄製規則 ,以方便快速啟動。

警示規則引發的警示可以觸發動作或通知,如針對警示規則設定的 動作群組 中所定義。 您也可以檢視 Azure 入口網站 中已引發和已解決的 Prometheus 警示,以及其他警示類型。

服務限制與配額

適用於 Prometheus 的 Azure 監視器受控服務具有擷取的預設限制和配額。 當您達到擷取限制時,可能會發生節流。 您可以要求增加這些限制。 如需節流和要求增加限制的詳細資訊,請參閱 計量節流。 如需 Prometheus 計量限制的資訊,請參閱 Azure 監視器服務限制

限制/已知問題 - 適用於 Prometheus 的 Azure 監視器受控服務

  • 不支援以低於 1 秒的頻率擷取和儲存計量。
  • Prometheus 的 Azure 受 Azure 監視器受控服務不支援由 21Vianet 雲端和 Air gapped 雲端運作的 Microsoft Azure。
  • 若要監視叢集中的 Windows 節點和 Pod,請參閱 啟用 Azure Kubernetes Service (AKS) 叢集的監視。
  • Azure 受控 Grafana 目前無法在 Azure 美國政府雲端中使用。
  • 使用量計量(Azure 監視器工作區功能表下的 Metrics 計量) - 美國政府雲端尚未提供擷取配額限制和任何 Azure 監視器工作區的目前使用量。
  • 在節點更新期間,您可能會在叢集層級收集器的某些計量集合中遇到持續 1 到 2 分鐘的差距。 此差距是由於來自 Azure Kubernetes Service 的一般動作來更新叢集中的節點。 這是預期的行為,發生的原因是執行的節點正在更新。 我們建議的警示規則都不會受到此行為的影響。

區分大小寫

Azure 受控 Prometheus 是不區分大小寫的系統。 如果字串 (例如計量名稱、標籤名稱或標籤值) 只利用字串的大小寫來區別其他時間序列,則系統會將這些字串視為相同的時間序列。

注意

此行為與原生 開放原始碼 Prometheus 不同,這是區分大小寫的系統。

在 Azure 受控 Prometheus 中,下列時間序列會視為相同:

diskSize(cluster="eastus", node="node1", filesystem="usr_mnt")
diskSize(cluster="eastus", node="node1", filesystem="usr_MNT")

上述範例是時間序列資料庫中的單一時間序列。

  • 針對它們擷取的任何樣本,會儲存為針對單一時間序列進行報廢/擷取。
  • 如果上述範例會以相同的時間戳內嵌,則會隨機卸除其中一個範例。
  • 儲存在時間序列資料庫中並由查詢傳回的大小寫無法預測。 同一時間序列的不同時間可能會傳回不同的大小寫。
  • 查詢中存在的任何計量名稱或標籤名稱/值比對器,都是透過不區分大小寫的比較,從時間序列資料庫擷取。 如果查詢中有區分大小寫的比對器,在進行字串比較時,會自動將其視為不區分大小寫的比對器。

最佳做法是確保使用單一致案例產生或報廢時間序列。

在開放原始碼 Prometheus 中,上述時間序列會被視為兩個不同的時間序列。 針對它們擷取/擷取的任何樣本會分開儲存。

Prometheus 參考

以下是 Prometheus 檔的連結。

常見問題集

本節提供常見問題的答案。

如何? 擷取 Prometheus 計量嗎?

所有數據都是使用 Prometheus 查詢語言 (PromQL) 撰寫的查詢,從 Azure 監視器工作區擷取。 您可以撰寫自己的查詢、使用來自 開放原始碼 社群的查詢,以及使用包含 PromQL 查詢的 Grafana 儀錶板。 請參閱 Prometheus 專案

我可以在 Azure 監視器計量瀏覽器中檢視我的 Prometheus 計量嗎?

具有 PromQL 的計量瀏覽器支援使用 PromQL 將 Prometheus 計量數據可視化。 若要搭配 PromQL 支援使用計量總管,請從 Azure 入口網站 中的任何 Azure 監視器工作區中選取 [計量] 功能表項。 如需詳細資訊,請參閱 PromQL 的計量瀏覽器(預覽版)。

當我使用 Prometheus 的受控服務時,我可以在 Azure 監視器工作區中儲存多個叢集的數據嗎?

是。 Prometheus 的受控服務旨在讓您能夠在單一 Azure 監視器工作區中儲存數個 Azure Kubernetes Service 叢集的數據。 請參閱 Azure 監視器工作區概觀

哪些類型的資源可以將 Prometheus 計量傳送至 Prometheus 的受控服務?

我們的代理程式可用於 Azure Kubernetes Service 叢集和已啟用 Azure Arc 的 Kubernetes 叢集。 其會安裝為 AKS 叢集的受控附加元件,以及已啟用 Azure Arc 的 Kubernetes 叢集擴充功能,您可以將其設定為收集數據。 您也可以遵循啟用遠端寫入的指示,在 Azure、另一個雲端或內部部署執行的 Kubernetes 叢集上設定遠端寫入。

如果您使用 Azure 入口網站 來啟用 Prometheus 計量集合,並從叢集的 [深入解析] 頁面安裝 AKS 附加元件或已啟用 Azure Arc 的 Kubernetes 擴充功能,它會將記錄收集到 Log Analytics 和 Prometheus 計量集合中,並安裝到 Prometheus 的受控服務。 如需詳細資訊,請參閱 數據源

下一步