Gegevensbeheer met Unity Catalog

Deze handleiding laat zien hoe u toegang tot gegevens en AI-objecten beheert in Azure Databricks. Zie de beveiligingshandleiding voor informatie over Azure Databricks-beveiliging. Azure Databricks biedt gecentraliseerd beheer voor gegevens en AI met Unity Catalog en Delta Sharing.

Toegangsbeheer centraliseren met Behulp van Unity Catalog

Unity Catalog is een verfijnde governanceoplossing voor gegevens en AI op het Databricks-platform. Het helpt de beveiliging en governance van uw gegevens en AI-assets te vereenvoudigen door een centrale plaats te bieden voor het beheren en controleren van toegang tot gegevens en AI-assets.

In de meeste accounts is Unity Catalog standaard ingeschakeld wanneer u een werkruimte maakt. Zie Automatische activering van Unity Catalog voor meer informatie.

Zie best practices voor Unity Catalog voor een bespreking van hoe u Unity Catalog effectief kunt gebruiken.

Gegevensherkomst bijhouden met Behulp van Unity Catalog

U kunt Unity Catalog gebruiken om runtimegegevensherkomst vast te leggen in query's in elke taal die wordt uitgevoerd op een Azure Databricks-cluster of SQL Warehouse. Herkomst wordt vastgelegd op kolomniveau en bevat notebooks, werkstromen en dashboards die betrekking hebben op de query. Zie Gegevensherkomst vastleggen en weergeven met behulp van Unity Catalog voor meer informatie.

Gegevens detecteren met Behulp van Catalog Explorer

Databricks Catalog Explorer biedt een gebruikersinterface voor het verkennen en beheren van gegevens en AI-assets, waaronder schema's (databases), tabellen, volumes (niet-tabellaire gegevens) en geregistreerde ML-modellen, samen met assetmachtigingen, gegevenseigenaren, externe locaties en referenties. U kunt het tabblad Inzichten in Catalog Explorer gebruiken om de meest recente query's en gebruikers van elke tabel weer te geven die zijn geregistreerd in Unity Catalog.

Gegevens delen met Delta Sharing

Delta Sharing is een open protocol dat is ontwikkeld door Databricks voor het veilig delen van gegevens en AI-assets met andere organisaties, of met andere teams binnen uw organisatie, ongeacht welke computingplatforms ze gebruiken.

Auditlogboekregistratie configureren

Databricks biedt toegang tot auditlogboeken van activiteiten die door Databricks-gebruikers worden uitgevoerd, zodat uw bedrijf gedetailleerde databricks-gebruikspatronen kan bewaken.

Met Unity Catalog kunt u eenvoudig de operationele gegevens van uw account openen en er query's op uitvoeren, zoals auditlogboeken, factureerbare gebruik en herkomst met behulp van systeemtabellen (openbare preview).

Identiteit configureren

Elk goed verhaal over gegevensbeheer begint met een sterke identiteitsbasis. Zie best practices voor identiteiten voor meer informatie over het configureren van identiteiten in Azure Databricks.

Verouderde oplossingen voor gegevensbeheer

Azure Databricks biedt ook deze verouderde governancemodellen:

  • Toegangsbeheer voor tabellen is een verouderd gegevensbeheermodel waarmee u programmatisch toegang kunt verlenen aan objecten die worden beheerd door de ingebouwde Hive-metastore van uw werkruimte. Databricks raadt u aan Unity Catalog te gebruiken in plaats van toegangsbeheer voor tabellen. Unity Catalog vereenvoudigt de beveiliging en governance van uw gegevens door een centrale plaats te bieden voor het beheren en controleren van toegang tot gegevens in meerdere werkruimten in uw account.

  • Azure Data Lake Storage-referentiepassthrough (verouderd) is ook een verouderde functie voor gegevensbeheer waarmee u automatisch kunt verifiëren bij Azure Storage vanuit Azure Databricks-clusters met behulp van dezelfde Microsoft Entra-id (voorheen Azure Active Directory) identiteit die u gebruikt om u aan te melden bij Azure Databricks. Databricks raadt u aan unity catalog te gebruiken.