使用 Unity 目錄進行數據控管

本指南說明如何在 Azure Databricks 中管理數據和 AI 物件存取。 如需 Azure Databricks 安全性的相關信息,請參閱 安全性指南。 Azure Databricks 針對具有 Unity 目錄和 Delta 共用的數據和 AI 提供集中式治理。

使用 Unity 目錄集中存取控制

Unity 目錄 是 Databricks 平臺上數據和 AI 的細部治理解決方案。 它藉由提供集中位置來管理和稽核數據和 AI 資產的存取權,協助簡化數據和 AI 資產的安全性與治理。

在大部分的帳戶中,當您建立工作區時,預設會啟用 Unity 目錄。 如需詳細資訊,請參閱 自動啟用 Unity 目錄

如需如何有效地使用 Unity 目錄的討論,請參閱 Unity 目錄最佳做法

使用 Unity 目錄追蹤資料譜系

您可以使用 Unity 目錄,在 Azure Databricks 叢集或 SQL 倉儲上執行的任何語言,跨查詢擷取運行時間數據譜系。 譜系會擷取到數據行層級,並包含與查詢相關的筆記本、工作流程和儀錶板。 若要深入瞭解,請參閱 使用 Unity 目錄擷取和檢視數據譜系。

使用目錄總管探索數據

Databricks 目錄總 管提供UI來探索和管理數據和 AI 資產,包括架構(資料庫)、數據表、磁碟區(非表格式數據)和已註冊的 ML 模型,以及資產許可權、數據擁有者、外部位置和認證。 您可以使用 [目錄總管] 中的 [深入解析 ] 索引標籤來檢視 Unity 目錄中註冊之任何數據表的最新查詢和使用者。

使用差異共用共享共享數據

Delta Sharing 是由 Databricks 開發的開放通訊協定,用於與其他組織或組織內的其他小組進行安全數據和 AI 資產共用,無論其使用何種運算平臺。

設定稽核記錄

Databricks 可讓您存取 Databricks 使用者所執行之活動的稽核記錄 ,讓您的企業能夠監視詳細的 Databricks 使用模式。

Unity 目錄可讓您輕鬆地存取及查詢帳戶的操作數據,包括使用系統數據表的稽核記錄、可計費使用量,以及歷程記錄(公開預覽)。

設定身分識別

每個良好的數據控管案例都是以強大的身分識別基礎開始。 若要瞭解如何在 Azure Databricks 中最佳設定身分識別,請參閱 身分識別最佳做法

舊版數據控管解決方案

Azure Databricks 也提供這些舊版治理模型:

  • 數據表訪問控制 是一種舊版數據控管模型,可讓您以程序設計方式授與和撤銷工作區內建 Hive 中繼存放區所管理物件的存取權。 Databricks 建議您使用 Unity 目錄,而不是數據表訪問控制。 Unity 目錄藉由提供集中位置來管理和稽核帳戶中多個工作區的數據存取,藉此簡化數據的安全性和控管。

  • Azure Data Lake 儲存體 認證傳遞(舊版)也是一項舊版數據控管功能,可讓您使用您用來登入 Azure Databricks 的相同 Microsoft Entra ID(先前稱為 Azure Active Directory)身分識別,自動驗證從 Azure Databricks 叢集 Azure 儲存體。 Databricks 建議您改用 Unity 目錄。