使用標籤監視使用量

若要監視成本,並準確地將 Azure Databricks 使用量歸因於您組織的業務單位和小組(例如退款),您可以標記工作區(資源群組)和計算資源。 這些標籤會傳播至詳細的成本分析報告,您可以在Azure 入口網站中存取。

以下是 Azure 入口網站 中的成本分析發票詳細數據報告,該報表會依標記在一個月期間內詳細clusterid數據成本:

依叢集標識碼的成本分析

標記的物件和資源

Object 標記介面 (UI) 標記介面 (API)
工作區 Azure 入口網站 Azure 資源 API
集區 Azure Databricks 工作區中的集區 UI 實例集區 API
所有用途和作業計算 Azure Databricks 工作區中的計算 UI 叢集 API
SQL 倉儲 Azure Databricks 工作區中的 SQL 倉儲 UI 倉儲 API

警告

請勿將具有索引鍵 Name 的自定義標籤指派給叢集。 每個叢集都有一個標記 Name ,其值是由 Azure Databricks 設定。 如果您變更與索引鍵 Name相關聯的值,Azure Databricks 就無法再追蹤叢集。 因此,叢集在閑置后可能不會終止,而且會繼續產生使用量成本。

默認標籤

Azure Databricks 會將下列預設標籤新增至所有用途的計算:

標記索引鍵
Vendor 常數值: Databricks
ClusterId 叢集的 Azure Databricks 內部識別碼
ClusterName 叢集的名稱
Creator 建立叢集之使用者的使用者名稱(電子郵件位址)

在作業叢集上,Azure Databricks 也會套用下列預設標記:

標記索引鍵
RunName 作業名稱
JobId 作業識別碼

Azure Databricks 會將下列預設標籤新增至所有集區:

標記索引鍵
Vendor 常數值: Databricks
DatabricksInstancePoolCreatorId 建立集區之使用者的 Azure Databricks 內部標識碼
DatabricksInstancePoolId 集區的 Azure Databricks 內部識別碼

在 Lakehouse 監視所使用的計算上,Azure Databricks 也會套用下列標籤:

標記索引鍵
LakehouseMonitoring true
LakehouseMonitoringTableId 受監視數據表的標識碼
LakehouseMonitoringWorkspaceId 建立監視器所在的工作區標識碼
LakehouseMonitoringMetastoreId 受監視數據表存在之中繼存放區的標識碼

標記傳播

工作區、集區和叢集卷標會由 Azure Databricks 匯總,並傳播至 Azure VM 以進行 成本分析報告。 但集區和叢集卷標會彼此傳播不同。

Databricks 對象標記階層

工作區和集區標籤會匯總並指派為裝載集區之 Azure VM 的資源標籤。

工作區和叢集標籤會彙總,並指派為裝載叢集之 Azure VM 的資源標籤。

從集區建立叢集時,僅將工作區標籤和集區標籤傳播至 VM。 不會傳播叢集標籤,以保留集區叢集啟動效能。

卷標衝突解決

如果自定義叢集標籤、集區標籤或工作區標籤的名稱與 Azure Databricks 預設叢集或集區標籤相同,則自定義標籤會在傳播時加上 x_ 前置詞。

例如,如果工作區標記為 vendor = Azure Databricks,該標籤將會與預設叢集卷標 vendor = Databricks衝突。 因此,標記會傳播為 x_vendor = Azure Databricksvendor = Databricks

限制

  • 在進行任何變更之後,自訂工作區標籤最多可能需要一小時才會傳播至 Azure Databricks。
  • 無法將超過 50 個標籤指派給 Azure 資源。 如果匯總標籤的整體計數超過此限制,前面加上 x_ 的標籤會依字母順序評估,並忽略超過限制的標籤。 如果忽略所有前面加上 x_ 的標籤,而且計數直到超過限制,則會依字母順序評估其餘標籤,並忽略超過限制的標籤。
  • 標籤索引鍵和值只能包含 ISO 8859-1 (latin1) 集合中的字元。 系統會忽略包含其他字元的標籤。
  • 如果您變更標籤索引鍵名稱或值,這些變更只適用於叢集重新啟動或集區擴充之後。
  • 如果叢集的自訂標籤與集區的自訂標籤衝突,就無法建立叢集。

使用原則強制執行標籤

您可以使用計算原則在叢集上強制執行標籤。 如需詳細資訊,請參閱 自定義標籤強制執行