Tata kelola data dengan Unity Catalog

Panduan ini memperlihatkan cara mengelola data dan akses objek AI di Azure Databricks. Untuk informasi tentang keamanan Azure Databricks, lihat Panduan keamanan. Azure Databricks menyediakan tata kelola terpusat untuk data dan AI dengan Unity Catalog dan Delta Sharing.

Mempusatkan kontrol akses menggunakan Katalog Unity

Unity Catalog adalah solusi tata kelola terperintah untuk data dan AI pada platform Databricks. Ini membantu menyederhanakan keamanan dan tata kelola data dan aset AI Anda dengan menyediakan tempat terpusat untuk mengelola dan mengaudit akses ke data dan aset AI.

Di sebagian besar akun, Unity Catalog diaktifkan secara default saat Anda membuat ruang kerja. Untuk detailnya, lihat Pengaktifan Otomatis Katalog Unity.

Untuk diskusi tentang cara menggunakan Katalog Unity secara efektif, lihat Praktik terbaik Katalog Unity.

Melacak silsilah data menggunakan Katalog Unity

Anda dapat menggunakan Unity Catalog untuk mengambil silsilah data runtime di seluruh kueri dalam bahasa apa pun yang dijalankan pada kluster Azure Databricks atau gudang SQL. Silsilah data diambil ke tingkat kolom, dan menyertakan buku catatan, alur kerja, dan dasbor yang terkait dengan kueri. Untuk mempelajari selengkapnya, lihat Mengambil dan melihat silsilah data menggunakan Katalog Unity.

Menemukan data menggunakan Catalog Explorer

Databricks Catalog Explorer menyediakan UI untuk menjelajahi dan mengelola data dan aset AI, termasuk skema (database), tabel, volume (data non-tabular), dan model ML terdaftar, bersama dengan izin aset, pemilik data, lokasi eksternal, dan kredensial. Anda dapat menggunakan tab Wawasan di Catalog Explorer untuk melihat kueri dan pengguna terbaru dari tabel apa pun yang terdaftar di Katalog Unity.

Berbagi data menggunakan Delta Sharing

Berbagi Delta adalah protokol terbuka yang dikembangkan oleh Databricks untuk berbagi data dan aset AI yang aman dengan organisasi lain, atau dengan tim lain dalam organisasi Anda, terlepas dari platform komputasi mana yang mereka gunakan.

Mengonfigurasi log audit

Databricks menyediakan akses ke log audit aktivitas yang dilakukan oleh pengguna Databricks, memungkinkan perusahaan Anda untuk memantau pola penggunaan Databricks terperinci.

Unity Catalog memungkinkan Anda dengan mudah mengakses dan mengkueri data operasional akun Anda, termasuk log audit, penggunaan yang dapat ditagih, dan silsilah data menggunakan tabel sistem (Pratinjau Umum).

Mengonfigurasi identitas

Setiap cerita tata kelola data yang baik dimulai dengan fondasi identitas yang kuat. Untuk mempelajari cara terbaik mengonfigurasi identitas di Azure Databricks, lihat Praktik terbaik identitas.

Solusi tata kelola data warisan

Azure Databricks juga menyediakan model tata kelola warisan ini:

  • Kontrol akses tabel adalah model tata kelola data warisan yang memungkinkan Anda memberikan dan mencabut akses secara terprogram ke objek yang dikelola oleh metastore Apache Hive bawaan ruang kerja Anda. Databricks merekomendasikan agar Anda menggunakan Unity Catalog alih-alih kontrol akses tabel. Unity Catalog menyederhanakan keamanan dan tata kelola data Anda dengan menyediakan tempat terpusat untuk mengelola dan mengaudit akses data di beberapa ruang kerja di akun Anda.

  • Passthrough kredensial Azure Data Lake Storage (warisan) juga merupakan fitur tata kelola data warisan yang memungkinkan Anda mengautentikasi secara otomatis ke Azure Storage dari kluster Azure Databricks menggunakan identitas Microsoft Entra ID (sebelumnya Azure Active Directory) yang sama dengan yang Anda gunakan untuk masuk ke Azure Databricks. Databricks merekomendasikan agar Anda menggunakan Unity Catalog sebagai gantinya.