タグを使用した使用状況の監視

コストを監視し、Azure Databricks の使用量を組織の事業単位およびチームに正確に関連付ける (たとえば、チャージバックのため) には、ワークスペース (リソース グループ) とコンピューティング リソースにタグを付けることができます。 これらのタグは、Azure portal でアクセスできる、詳細な コスト分析レポート に反映されます。

以下は、1か月分の clusterid タグごとのコストを詳細に表示している、Azure portal の詳細な請求書のコスト分析レポートです。

クラスター ID 別のコスト分析

タグ付けされたオブジェクトとリソース

オブジェクト タグ付けインターフェイス (UI) タグ付けインターフェイス (API)
ワークスペース Azure Portal Azure リソース API
プール Azure Databricks ワークスペースのプール UI インスタンス プール API
汎用とジョブのコンピューティング Azure Databricks ワークスペースのコンピューティング UI クラスター API
SQL ウェアハウス Azure Databricks ワークスペースの SQL ウェアハウス UI Warehouses API

警告

キー Name を持つカスタム タグをクラスターに割り当てないでください。 すべてのクラスターにはタグ Name があり、この値は Azure Databricks によって設定されます。 キー Name に関連付けられている値を変更すると、Azure Databricks でそのクラスターを追跡できなくなります。 その結果、アイドル状態になってもクラスターが終了されない可能性があり、使用コストが引き続き発生することになります。

既定のタグ

Azure Databricks により、次の既定のタグが汎用コンピューティングに追加されます。

タグ キー Value
Vendor 定数値: Databricks
ClusterId クラスターの Azure Databricks 内部 ID
ClusterName クラスターの名前
Creator クラスターを作成したユーザーのユーザー名 (メール アドレス)

ジョブ クラスターの場合、Azure Databricks では次の既定のタグも適用されます。

タグ キー Value
RunName ジョブ名
JobId ジョブ ID

Azure Databricks により、すべてのプールに次の既定のタグが追加されます。

タグ キー Value
Vendor 定数値: Databricks
DatabricksInstancePoolCreatorId プールを作成したユーザーの Azure Databricks 内部 ID
DatabricksInstancePoolId プールの Azure Databricks 内部 ID

Lakehouse Monitoring によって使われるコンピューティングには、Azure Databricks によって次のタグも適用されます。

タグ キー Value
LakehouseMonitoring true
LakehouseMonitoringTableId 監視対象テーブルの ID
LakehouseMonitoringWorkspaceId モニターが作成されたワークスペースの ID
LakehouseMonitoringMetastoreId 監視対象テーブルが存在するメタストアの ID

タグの伝達

ワークスペース、プール、クラスターのタグは Azure Databricks で集計され、コスト分析レポートのために Azure VM に伝達されます。 ただし、プールとクラスターのタグは相互に異なる方法で伝達されます。

Databricks オブジェクト タグ階層

ワークスペース タグとプール タグは集計され、プールをホストする Azure VM のリソース タグとして割り当てられます。

ワークスペース タグとクラスター タグは集計され、クラスターをホストする Azure VM のリソース タグとして割り当てられます。

クラスターがプールから作成される場合、ワークスペース タグとプール タグのみが VM に伝達されます。 プール クラスターの起動パフォーマンスを維持するために、クラスター タグは伝達されません。

タグ競合の解決

カスタムのクラスター タグ、プール タグ、またはワークスペース タグに Azure Databricks の既定のクラスターまたはプール タグと同じ名前が付いている場合、伝達されるときに、カスタム タグの方に x_ がプレフィックスとして付加されます。

たとえば、ワークスペースにタグ vendor = Azure Databricks が付けられている場合、このタグは既定のクラスター タグ vendor = Databricks と競合します。 そのため、タグは x_vendor = Azure Databricksvendor = Databricks として伝達されます。

制限事項

  • カスタム ワークスペース タグが変更された後に Azure Databricks に反映されるまで、最大 1 時間かかることがあります。
  • Azure リソースに割り当てることができるタグは 50 個までです。 集計されたタグの総数がこの制限個数を超えると、 x_ がプレフィックスとして付加されたタグはアルファベット順に評価され、制限個数を超えるタグは無視されます。 すべての x_ プレフィックス付きのタグを無視しても、タグの個数が制限を超えている場合、残りのタグがアルファベット順に評価され、制限個数を超えるタグは無視されます。
  • タグのキーと値には、ISO 8859-1 (latin1) セットの文字のみを含めることができます。 他の文字を含むタグは無視されます。
  • タグ キー名または値を変更した場合、これらの変更は、クラスターの再起動またはプールの展開の後にのみ適用されます。
  • クラスターのカスタム タグがプールのカスタム タグと競合している場合は、クラスターを作成できません。

ポリシーを使用したタグの適用

コンピューティング ポリシーを使用してクラスターにタグを適用できます。 詳細については、「カスタム タグの適用」を参照してください。