Mode himpunan data di layanan Power BI

Artikel ini memberikan penjelasan teknis tentang mode himpunan data Power BI. Ini berlaku untuk himpunan data yang mewakili koneksi langsung ke model Layanan Analisis yang dihosting eksternal, dan juga untuk model yang dikembangkan dalam Power BI Desktop. Artikel ini menekankan alasan untuk setiap mode, dan kemungkinan dampak pada sumber daya kapasitas Power BI.

Ketiga himpunan data tersebut merupakan:

Mode impor

Mode impor adalah mode paling umum yang digunakan untuk mengembangkan himpunan data. Mode ini memberikan performa yang sangat cepat berkat kueri dalam memori. Ini juga menawarkan fleksibilitas desain kepada pemodel, dan dukungan untuk fitur layanan Power BI tertentu (Q&A, Quick Insights, dll.). Karena keunggulan tersebut, ini adalah mode default saat membuat solusi Power BI Desktop baru.

Penting dipahami bahwa data yang diimpor selalu disimpan ke disk. Saat dikueri atau di-refresh, data harus dimuat sepenuhnya ke dalam memori kapasitas Power BI. Setelah dalam memori, Model impor kemudian dapat mencapai hasil kueri yang sangat cepat. Penting juga untuk dipahami bahwa tidak ada konsep model Impor yang dimuat sebagian ke dalam memori.

Saat di-refresh, data dikompresi dan dioptimalkan lalu disimpan ke disk oleh mesin penyimpanan VertiPaq. Ketika dimuat dari disk ke dalam memori, dimungkinkan untuk melihat kompresi 10x. Jadi, masuk akal untuk mengira bahwa 10 GB data sumber dapat memadatkan hingga ukuran sekitar 1 GB. Penyimpanan pada disk dapat mencapai pengurangan 20% dari ukuran terkompresi. (Perbedaan ukuran dapat ditentukan dengan membandingkan ukuran file Power BI Desktop dengan penggunaan memori file Task Manager.)

Fleksibilitas desain dapat dicapai dengan tiga cara. Pemodel data dapat:

  • Mengintegrasikan data dengan penembolokan data dari aliran data, dan sumber data eksternal, apa pun jenis atau format sumber datanya
  • Manfaatkan seluruh set fungsi bahasa rumus Power Query (yang secara informal disebut sebagai M) saat membuat kueri persiapan data
  • Manfaatkan seluruh set fungsi Data Analysis Expressions (DAX) saat meningkatkan model dengan logika bisnis. Ada dukungan untuk kolom terhitung, tabel terhitung, dan pengukuran.

Seperti yang ditunjukkan pada gambar berikut, model Impor dapat mengintegrasikan data dari sejumlah jenis sumber data yang didukung.

An Import model can integrate data from any number of external data source types

Namun, meskipun ada keuntungan menarik yang terkait dengan model Impor, ada juga kerugiannya:

  • Seluruh model harus dimuat ke memori sebelum Power BI dapat meminta model, yang dapat menempatkan tekanan pada sumber daya kapasitas yang tersedia, terutama seiring bertambahnya jumlah dan ukuran model Impor

  • Data model hanya terkini sebagai refresh terbaru, sehingga model Impor perlu di-refresh, biasanya secara terjadwal

  • Refresh penuh akan menghapus semua data dari semua tabel dan memuat ulang dari sumber data. Operasi ini bisa mahal dalam hal waktu dan sumber daya untuk layanan Power BI, dan sumber data.

    Catatan

    Power BI dapat mencapai refresh bertahap untuk menghindari pemotongan dan pemuatan ulang seluruh tabel. Untuk informasi selengkapnya, termasuk paket dan lisensi yang didukung, lihat Refresh bertahap untuk himpunan data.

Dari perspektif sumber daya layanan Power BI, Model impor memerlukan:

  • Memori yang cukup untuk memuat model saat dikueri atau disegarkan
  • Memproses sumber daya dan sumber daya memori tambahan untuk me-refresh data

Mode DirectQuery

Mode DirectQuery adalah alternatif untuk mode Impor. Model yang dikembangkan dalam mode DirectQuery tidak mengimpor data. Sebaliknya, metadata hanya terdiri dari metadata yang menentukan struktur model. Saat model dikueri, kueri asli digunakan untuk mengambil data dari sumber data yang mendasarinya.

A DirectQuery model issues native queries to the underlying data source

Ada dua alasan utama yang harus dipertimbangkan untuk mengembangkan model DirectQuery:

  • Ketika volume data terlalu besar - bahkan ketika metode pengurangan data diterapkan - untuk dimuat ke dalam model, atau praktis refresh
  • Ketika laporan dan dasbor perlu mengirimkan data "mendekati real-time", di luar apa yang dapat dicapai dalam batas refresh terjadwal. (Batas refresh terjadwal delapan kali sehari untuk kapasitas bersama, dan 48 kali sehari untuk kapasitas Premium.)

Ada beberapa keuntungan yang terkait dengan model DirectQuery:

  • Batas ukuran model impor tidak berlaku
  • Model tidak memerlukan refresh data terjadwal
  • Pengguna laporan akan melihat data terbaru saat berinteraksi dengan filter laporan dan pemotong. Selain itu, pengguna laporan dapat me-refresh seluruh laporan untuk mengambil data saat ini.
  • Laporan real-time dapat dikembangkan dengan menggunakan fitur Refresh halaman otomatis.
  • Petak dasbor, saat berdasarkan model DirectQuery, dapat diperbarui secara otomatis sesering setiap 15 menit

Namun, ada beberapa batasan yang terkait dengan model DirectQuery:

  • Ekspresi Power Query/Mashup hanya dapat berfungsi hanya jika ditransposisikan ke kueri asli yang dipahami oleh sumber data.
  • Rumus DAX terbatas untuk hanya menggunakan fungsi yang dapat ditransposisikan ke kueri asli yang dipahami oleh sumber data. Tabel terhitung tidak didukung.
  • Fitur Quick Insights tidak didukung.

Dari perspektif sumber daya layanan Power BI, model DirectQuery memerlukan:

  • Memori minimal untuk memuat model (hanya metadata) saat dikueri.
  • Terkadang layanan Power BI harus menggunakan sumber daya prosesor yang signifikan untuk menghasilkan dan memproses kueri yang dikirim ke sumber data. Ketika situasi ini muncul, itu dapat berdampak pada throughput, terutama ketika pengguna bersamaan mengkueri model.

Untuk informasi selengkapnya, lihat Menggunakan Kueri Langsung di Power BI Desktop.

Mode komposit

Mode komposit dapat mencampur mode Impor dan DirectQuery, atau mengintegrasikan beberapa sumber data DirectQuery. Model yang dikembangkan dalam mode Komposit mendukung konfigurasi mode penyimpanan untuk setiap tabel model. Mode ini juga mendukung tabel terhitung (ditentukan dengan DAX).

Mode penyimpanan tabel dapat dikonfigurasi sebagai Impor, DirectQuery, atau Ganda. Tabel yang dikonfigurasi sebagai Mode penyimpanan ganda adalah Impor dan DirectQuery, dan pengaturan ini memungkinkan layanan Power BI menentukan mode yang paling efisien untuk digunakan berdasarkan kueri demi kueri.

A Composite model is a combination of Import and DirectQuery storage modes, configured at table level

Model komposit berusaha untuk memberikan mode Impor dan DirectQuery terbaik. Saat dikonfigurasi dengan tepat, mereka dapat menggabungkan performa kueri tinggi model dalam memori dengan kemampuan untuk mengambil data mendekati real-time dari sumber data.

Untuk informasi selengkapnya, lihat Menggunakan model komposit di Power BI Desktop.

Tabel Impor dan DirectQuery Murni

Pemodel data yang mengembangkan model Komposit cenderung mengonfigurasi tabel jenis dimensi dalam mode Impor atau Penyimpanan ganda, dan tabel jenis fakta dalam mode DirectQuery. Untuk informasi selengkapnya tentang peran tabel model, lihat Memahami skema bintang dan pentingnya Power BI.

Misalnya, pertimbangkan model dengan tabel jenis dimensi Produk dalam mode Ganda, dan tabel jenis fakta Penjualan dalam mode DirectQuery. Tabel Produk dapat dikueri secara efisien dan cepat dari dalam memori untuk merender pemotong laporan. Tabel Penjualan juga dapat dikueri dalam mode DirectQuery dengan tabel Produk terkait. Kueri terakhir dapat mengaktifkan pembuatan kueri SQL asli tunggal yang efisien yang menggabungkan tabel Produk dan Penjualan, dan memfilter berdasarkan nilai pemotong.

Tabel hibrid

Pemodel data yang mengembangkan model Komposit juga dapat mengonfigurasi tabel fakta sebagai tabel hibrid. Tabel hibrid adalah tabel dengan satu atau beberapa partisi Impor dan satu partisi DirectQuery. Keuntungan dari tabel hibrid adalah dapat secara efisien dan cepat dikueri dari dalam memori sementara pada saat yang sama termasuk perubahan data terbaru dari sumber data yang terjadi setelah siklus impor terakhir, seperti yang diilustrasikan visualisasi berikut.

Image of a hybrid table partition.

Cara termudah untuk membuat tabel hibrid adalah dengan mengonfigurasi kebijakan refresh bertahap di Power BI Desktop dan mengaktifkan opsi Dapatkan data terbaru secara real time dengan DirectQuery (hanya Premium). Saat Power BI menerapkan kebijakan refresh bertahap yang mengaktifkan opsi ini, opsi ini mempartisi tabel seperti skema partisi yang ditampilkan di atas. Untuk memastikan performa yang baik, konfigurasikan tabel jenis dimensi Anda dalam mode Penyimpanan ganda sehingga Power BI dapat menghasilkan kueri SQL asli yang efisien saat mengkueri partisi DirectQuery.

Catatan

Power BI mendukung tabel hibrid hanya saat himpunan data dihosting di ruang kerja pada kapasitas Premium. Oleh karena itu, Anda harus mengunggah himpunan data ke ruang kerja Premium jika Mengonfigurasi kebijakan refresh bertahap dengan opsi untuk mendapatkan data terbaru secara real time dengan DirectQuery. Untuk informasi selengkapnya, lihat Refresh bertahap dan data real-time untuk himpunan data.

Memungkinkan juga untuk mengonversi tabel Impor ke tabel hibrid dengan menambahkan partisi DirectQuery menggunakan Tabular Model Scripting Language (TMSL) atau Tabular Object Model (TOM) atau dengan menggunakan alat pihak ketiga. Misalnya, Anda dapat mempartisi tabel fakta sehingga sebagian besar data ditinggalkan di gudang data sementara hanya sebagian kecil dari data terbaru yang diimpor. Pendekatan ini dapat membantu mengoptimalkan performa jika sebagian besar data ini adalah data historis yang jarang diakses. Tabel hibrid dapat memiliki beberapa partisi Impor, tetapi hanya satu partisi DirectQuery.

Langkah berikutnya