Batasan mode akses komputasi untuk Katalog Unity
Databricks merekomendasikan penggunaan Unity Catalog dan mode akses bersama untuk sebagian besar beban kerja. Artikel ini menguraikan berbagai batasan untuk setiap mode akses dengan Unity Catalog. Untuk detail tentang mode akses, lihat Mode akses.
Databricks merekomendasikan penggunaan kebijakan komputasi untuk menyederhanakan opsi konfigurasi bagi sebagian besar pengguna. Lihat Membuat dan mengelola kebijakan komputasi.
Catatan
Tidak ada isolasi yang dibagikan adalah mode akses lama yang tidak mendukung Katalog Unity.
Penting
Skrip dan pustaka init memiliki dukungan yang berbeda di seluruh mode akses dan versi Databricks Runtime. Lihat Di mana skrip init dapat diinstal? dan Pustaka cakupan kluster.
Batasan mode akses pengguna tunggal pada Unity Catalog
Mode akses pengguna tunggal pada Unity Catalog memiliki batasan berikut. Ini selain batasan umum untuk semua mode akses Katalog Unity. Lihat Batasan umum untuk Katalog Unity.
Batasan kontrol akses menenangkan untuk mode akses pengguna tunggal Katalog Unity
Tampilan dinamis tidak didukung.
Untuk membaca dari tampilan, Anda harus memiliki
SELECT
semua tabel dan tampilan yang dirujuk.Anda tidak dapat mengakses tabel yang memiliki filter baris atau masker kolom.
Anda tidak dapat menggunakan satu komputasi pengguna untuk mengkueri tabel yang dibuat oleh alur Tabel Langsung Delta yang didukung Katalog Unity, termasuk tabel streaming dan tampilan materialisasi yang dibuat di Databricks SQL. Untuk mengkueri tabel yang dibuat oleh alur Tabel Langsung Delta, Anda harus menggunakan komputasi bersama menggunakan Databricks Runtime 13.3 LTS ke atas.
Batasan streaming untuk mode akses pengguna tunggal Katalog Unity
- Titik pemeriksaan asinkron tidak didukung di Databricks Runtime 11.3 LTS dan di bawahnya.
Batasan mode akses bersama pada Unity Catalog
Mode akses bersama pada Unity Catalog memiliki batasan berikut. Ini selain batasan umum untuk semua mode akses Katalog Unity. Lihat Batasan umum untuk Katalog Unity.
Databricks Runtime ML dan Spark Pembelajaran Mesin Library (MLlib) tidak didukung.
Pekerjaan Spark-submit tidak didukung.
Pada Databricks Runtime 13.3 ke atas, baris individual tidak boleh melebihi ukuran maksimum 128MB.
Saat digunakan dengan passthrough kredensial, fitur Katalog Unity dinonaktifkan.
Kontainer kustom tidak didukung.
Dukungan bahasa untuk mode akses bersama Katalog Unity
- R tidak didukung.
- Scala didukung pada Databricks Runtime 13.3 ke atas.
Batasan API Spark untuk mode akses bersama Katalog Unity
- API RDD tidak didukung.
- DBUtils dan klien lain yang langsung membaca data dari penyimpanan cloud hanya didukung saat Anda menggunakan lokasi eksternal untuk mengakses lokasi penyimpanan. Lihat Membuat lokasi eksternal untuk menyambungkan penyimpanan cloud ke Azure Databricks.
- Konteks Spark (
sc
),spark.sparkContext
, dansqlContext
tidak didukung untuk Scala dalam Databricks Runtime apa pun dan tidak didukung untuk Python di Databricks Runtime 14.0 ke atas.- Databricks merekomendasikan penggunaan
spark
variabel untuk berinteraksi denganSparkSession
instans. - Fungsi berikut juga
sc
tidak didukung:emptyRDD
,init_batched_serializer
textFile
newAPIHadoopFile
parallelize
newAPIHadoopRDD
binaryFiles
wholeTextFiles
binaryRecords
range
pickleFile
sequenceFile
,runJob
setSystemProperty
hadoopFile
hadoopRDD
union
, ,uiWebUrl
stop
, , ,setJobGroup
, ,setLocalProperty
, .getConf
- Databricks merekomendasikan penggunaan
Batasan UDF untuk mode akses bersama Unity Catalog
Penting
Dukungan untuk UDF Scala pada komputasi yang mendukung Katalog Unity dengan mode akses bersama ada di Pratinjau Umum.
Fungsi yang ditentukan pengguna (UDF) memiliki batasan berikut dengan mode akses bersama:
UDF Apache Hive tidak didukung.
applyInPandas
danmapInPandas
tidak didukung di Databricks Runtime 14.2 ke bawah.Di Databricks Runtime 14.2 ke atas, UDF skalar Scala didukung. UDF dan UDAF Scala lainnya tidak didukung.
Dalam Databricks Runtime 13.3 LTS ke atas, UDF skalar Python dan UDF Pandas didukung. UDF Python lainnya, termasuk UDAF, UDTF, dan Panda di Spark tidak didukung.
Lihat Fungsi yang ditentukan pengguna (UDF) di Unity Catalog.
Batasan streaming untuk mode akses bersama Unity Catalog
Catatan
Beberapa opsi Kafka yang tercantum memiliki dukungan terbatas saat digunakan untuk konfigurasi yang didukung di Azure Databricks. Lihat Pemrosesan aliran dengan Apache Kafka dan Azure Databricks.
- Untuk Scala,
foreach
danforeachBatch
tidak didukung. - Untuk Python,
foreachBatch
memiliki perilaku baru di Databricks Runtime 14.0 ke atas. Lihat Perubahan perilaku untuk foreachBatch di Databricks Runtime 14.0. - Untuk Scala,
from_avro
memerlukan Databricks Runtime 14.2 atau lebih tinggi. applyInPandasWithState
tidak didukung.- Bekerja dengan sumber soket tidak didukung.
sourceArchiveDir
harus berada di lokasi eksternal yang sama dengan sumber saat Anda menggunakanoption("cleanSource", "archive")
sumber data yang dikelola oleh Katalog Unity.- Untuk sumber dan sink Kafka, opsi berikut tidak didukung:
kafka.sasl.client.callback.handler.class
kafka.sasl.login.callback.handler.class
kafka.sasl.login.class
kafka.partition.assignment.strategy
- Opsi Kafka berikut didukung di Databricks Runtime 13.3 LTS ke atas tetapi tidak didukung di Databricks Runtime 12.2 LTS. Anda hanya dapat menentukan lokasi eksternal yang dikelola oleh Unity Catalog untuk opsi berikut:
kafka.ssl.truststore.location
kafka.ssl.keystore.location
Batasan akses jaringan dan sistem file untuk mode akses bersama Katalog Unity
Harus menjalankan perintah pada simpul komputasi sebagai pengguna dengan hak istimewa rendah yang dilarang mengakses bagian sensitif sistem file.
Di Databricks Runtime 11.3 LTS dan di bawahnya, Anda hanya dapat membuat koneksi jaringan ke port 80 dan 443.
Tidak dapat tersambung ke layanan metadata instans atau Azure WireServer.
Batasan umum untuk Unity Catalog
Batasan berikut berlaku untuk semua mode akses yang diaktifkan Katalog Unity.
Batasan streaming untuk Unity Catalog
- Mode pemrosesan berkelanjutan Apache Spark tidak didukung. Lihat Pemrosesan Berkelanjutan di Panduan Pemrograman Streaming Terstruktur Spark.
StreamingQueryListener
tidak dapat menggunakan kredensial atau berinteraksi dengan objek yang dikelola oleh Katalog Unity.
Lihat juga Batasan streaming untuk mode akses pengguna tunggal Katalog Unity dan Batasan streaming untuk mode akses bersama Katalog Unity.
Untuk informasi selengkapnya tentang streaming dengan Katalog Unity, lihat Menggunakan Katalog Unity dengan Streaming Terstruktur.
Saran dan Komentar
https://aka.ms/ContentUserFeedback.
Segera hadir: Sepanjang tahun 2024 kami akan menghentikan penggunaan GitHub Issues sebagai mekanisme umpan balik untuk konten dan menggantinya dengan sistem umpan balik baru. Untuk mengetahui informasi selengkapnya, lihat:Kirim dan lihat umpan balik untuk