Premium fitur aliran data

Aliran data didukung untuk pengguna Power BI Pro, Premium Per Pengguna (PPU), dan Power BI Premium. Beberapa fitur hanya tersedia dengan langganan Power BI Premium (yang merupakan kapasitas Premium atau lisensi Premium Per Pengguna (PPU)). Artikel ini menjelaskan dan merinci Premium Per Pengguna (PPU) dan fitur khusus Premium dan penggunaannya.

Fitur berikut hanya tersedia dengan Power BI Premium (PPU atau langganan kapasitas Premium):

  • Mesin komputasi yang ditingkatkan
  • Kueri Langsung
  • Entitas terkomputasi
  • Entitas tertaut
  • Refresh bertahap

Bagian berikut ini menjelaskan masing-masing fitur ini secara rinci.

Mesin komputasi yang ditingkatkan

Mesin komputasi yang ditingkatkan di Power BI memungkinkan pelanggan Power BI Premium menggunakan kapasitasnya untuk mengoptimalkan penggunaan aliran data. Menggunakan mesin komputasi yang ditingkatkan memberikan keuntungan berikut:

  • Secara drastis mengurangi waktu refresh yang diperlukan untuk langkah-langkah ETL yang berjalan lama atas entitas komputasi, seperti melakukan gabungan, berbeda, filter, dan grup menurut
  • Melakukan kueri DirectQuery melalui entitas

Catatan

  • Proses validasi dan refresh menginformasikan aliran data skema model. Untuk mengatur skema tabel sendiri, gunakan Editor PowerQuery dan atur jenis data.
  • Fitur ini tersedia di semua kluster Power BI kecuali WABI-INDIA-CENTRAL-A-PRIMARY

Mengaktifkan mesin komputasi yang ditingkatkan

Penting

Mesin komputasi yang ditingkatkan hanya berfungsi untuk kapasitas Power BI A3 atau lebih besar.

Di Premium Gen2, mesin komputasi yang ditingkatkan diatur secara individual untuk setiap aliran data. Ada tiga konfigurasi yang dapat dipilih:

  • Nonaktif

  • Dioptimalkan (default) - Mesin komputasi yang ditingkatkan dimatikan. Ini secara otomatis diaktifkan ketika aliran data tersambung ke aliran data lain.

  • Aktif

Untuk mengubah pengaturan default dan mengaktifkan mesin komputasi yang ditingkatkan, lakukan hal berikut:

  1. Di ruang kerja Anda, di samping aliran data yang ingin Anda ubah pengaturannya, pilih Opsi lainnya.

  2. Dari menu opsi aliran data lainnya, pilih Pengaturan.

    Screenshot of a dataflows more options menu with the settings setting highlighted.

  3. Perluas pengaturan mesin komputasi yang ditingkatkan.

    Screenshot of a dataflows settings page with the enhanced compute engine settings setting highlighted.

  4. Di pengaturan Mesin komputasi yang ditingkatkan, pilih Aktif lalu pilih Terapkan.

    Screenshot of the enhanced compute engine settings with the on selection turned on and the apply button highlighted.

Menggunakan mesin komputasi yang ditingkatkan

Setelah mesin komputasi yang ditingkatkan aktif, kembali ke aliran data dan Anda akan melihat peningkatan performa dalam tabel komputasi apa pun yang melakukan operasi kompleks, seperti gabungan atau kelompokkan menurut operasi untuk aliran data yang dibuat dari entitas tertaut yang ada pada kapasitas yang sama.

Untuk memanfaatkan mesin komputasi dengan sebaik-baiknya, bagi tahap ETL menjadi dua aliran data terpisah, dengan cara berikut:

  • Aliran data 1 - aliran data ini seharusnya hanya menyerap semua yang diperlukan dari sumber data, dan menempatkannya ke dalam aliran data 2.
  • Aliran data 2 - lakukan semua operasi ETL dalam aliran data kedua ini, tetapi pastikan Anda mereferensikan Aliran Data 1, yang seharusnya berada pada kapasitas yang sama. Pastikan juga Anda melakukan operasi yang dapat melipat (filter, kelompokkan menurut, berbeda, bergabung) terlebih dahulu, sebelum operasi lainnya, untuk memastikan mesin komputasi digunakan.

Pertanyaan dan jawaban umum

Pertanyaan: Saya telah mengaktifkan mesin komputasi yang ditingkatkan, tetapi refresh saya lebih lambat. Mengapa?

Jawaban: Jika Anda mengaktifkan mesin komputasi yang ditingkatkan, ada dua kemungkinan penjelasan yang dapat menyebabkan waktu refresh yang lebih lambat:

  • Ketika mesin komputasi yang ditingkatkan diaktifkan, dibutuhkan beberapa memori untuk berfungsi dengan baik. Dengan demikian, memori yang tersedia untuk melakukan refresh berkurang dan oleh karena itu meningkatkan kemungkinan refresh untuk diantrekan, yang pada gilirannya mengurangi jumlah aliran data yang dapat di-refresh secara bersamaan. Untuk mengatasi hal ini, saat mengaktifkan komputasi yang ditingkatkan, tingkatkan memori yang ditetapkan untuk aliran data untuk memastikan memori yang tersedia untuk refresh aliran data bersamaan tetap sama.

  • Alasan lain Anda mungkin mengalami refresh yang lebih lambat adalah bahwa mesin komputasi hanya berfungsi di atas entitas yang ada. Jika aliran data Anda mereferensikan sumber data yang bukan aliran data, Anda tidak akan melihat peningkatan. Tidak akan ada peningkatan performa, karena dalam beberapa skenario big data, bacaan awal dari sumber data akan lebih lambat karena data perlu diteruskan ke mesin komputasi yang ditingkatkan.

Pertanyaan: Saya tidak dapat melihat tombol mesin komputasi yang ditingkatkan. Mengapa?

Jawaban: Mesin komputasi yang ditingkatkan sedang dirilis secara bertahap ke wilayah di seluruh dunia, tetapi belum tersedia di setiap wilayah.

Pertanyaan: Apa saja jenis data yang didukung untuk mesin komputasi?

Jawaban: Mesin komputasi dan aliran data yang ditingkatkan saat ini mendukung jenis data berikut. Jika aliran data Anda tidak menggunakan salah satu jenis data berikut, kesalahan terjadi selama refresh:

  • Tanggal/Waktu
  • Bilangan Desimal
  • Teks
  • Bilangan bulat
  • Tanggal/Waktu/Zona Waktu
  • True/False
  • Tanggal
  • Waktu

Menggunakan DirectQuery dengan aliran data di Power BI

Anda dapat menggunakan DirectQuery untuk terhubung langsung ke aliran data, dan dengan demikian terhubung langsung ke aliran data Anda tanpa harus mengimpor datanya.

Menggunakan DirectQuery dengan aliran data memungkinkan penyempurnaan berikut ke proses Power BI dan aliran data Anda:

  • Hindari jadwal refresh terpisah - DirectQuery terhubung langsung ke aliran data, menghapus kebutuhan untuk membuat himpunan data yang diimpor. Dengan demikian, menggunakan DirectQuery dengan aliran data Anda berarti Anda tidak lagi memerlukan jadwal refresh terpisah untuk aliran data dan himpunan data untuk memastikan data Anda disinkronkan.

  • Memfilter data - DirectQuery berguna untuk mengerjakan tampilan data yang difilter di dalam aliran data. Jika Anda ingin memfilter data, dan dengan demikian bekerja dengan subset data yang lebih kecil di aliran data Anda, Anda dapat menggunakan DirectQuery (dan mesin komputasi) untuk memfilter data aliran data dan bekerja dengan subset yang difilter yang Anda butuhkan.

Menggunakan DirectQuery untuk aliran data

Menggunakan DirectQuery dengan aliran data tersedia di Power BI Desktop.

Ada juga prasyarat untuk menggunakan DirectQuery dengan aliran data:

  • Aliran data Anda harus berada dalam ruang kerja yang diaktifkan Power BI Premium
  • Mesin komputasi harus dinyalakan

Anda dapat mempelajari selengkapnya tentang DirectQuery dengan aliran data di artikel menggunakan DirectQuery dengan aliran data.

Mengaktifkan DirectQuery untuk aliran data

Untuk memastikan aliran data Anda tersedia untuk akses DirectQuery, mesin komputasi yang ditingkatkan harus dalam keadaan dioptimalkan. Untuk mengaktifkan DirectQuery untuk aliran data, atur opsi pengaturan mesin komputasi yang ditingkatkan baru ke Aktif. Gambar berikut menunjukkan pengaturan yang dipilih dengan benar.

Granular control for direct query

Setelah Anda menerapkan pengaturan tersebut, refresh aliran data agar pengoptimalan diterapkan.

Pertimbangan dan batasan untuk DirectQuery

Ada beberapa batasan yang diketahui dengan DirectQuery dan aliran data:

  • Model gabungan/campuran yang memiliki sumber data impor dan DirectQuery saat ini tidak didukung.

  • Aliran data besar mungkin mengalami masalah dengan masalah waktu habis saat melihat visualisasi. Aliran data besar yang mengalami masalah dengan masalah waktu habis harus menggunakan mode Impor.

  • Di bawah pengaturan sumber data, konektor aliran data akan menampilkan info masuk yang tidak valid jika Anda menggunakan DirectQuery. Ini tidak memengaruhi perilaku, dan himpunan data akan berfungsi dengan baik.

Entitas terkomputasi

Anda dapat melakukan komputasi dalam penyimpanan saat menggunakan aliran data dengan langganan Power BI Premium. Ini memungkinkan Anda melakukan perhitungan pada aliran data yang ada, dan mengembalikan hasil yang memungkinkan Anda untuk fokus pada pembuatan laporan dan analitik.

Computed table

Untuk melakukan komputasi dalam penyimpanan, Anda harus terlebih dahulu membuat aliran data dan membawa data ke penyimpanan aliran data Power BI tersebut. Setelah Anda memiliki aliran data yang berisi data, Anda dapat membuat entitas komputasi, yang merupakan entitas yang melakukan komputasi dalam penyimpanan.

Pertimbangan dan batasan entitas komputasi

  • Saat bekerja dengan aliran data yang dibuat di akun Azure Data Lake Storage Gen2 organisasi, entitas tertaut dan entitas terkomputasi hanya berfungsi dengan baik ketika entitas berada di akun penyimpanan yang sama.

Sebagai praktik terbaik, saat melakukan komputasi pada data yang bergabung dengan data lokal dan cloud, buat aliran data baru untuk setiap sumber (satu untuk lokal dan satu untuk cloud) lalu buat aliran data ketiga untuk menggabungkan/menghitung dua sumber data ini.

Entitas tertaut

Anda dapat mereferensikan aliran data yang ada saat menggunakan dengan langganan Power BI Premium, yang memungkinkan Anda melakukan penghitungan pada entitas ini menggunakan entitas komputasi atau memungkinkan Anda membuat tabel "sumber tunggal kebenaran" yang dapat Anda gunakan kembali dalam beberapa aliran data.

Refresh bertahap

Aliran data dapat diatur untuk menyegarkan secara bertahap untuk menghindari harus menarik semua data pada setiap refresh. Untuk melakukannya, pilih aliran data lalu pilih ikon refresh bertahap.

Incremental refresh

Pengaturan refresh bertahap menambahkan parameter ke aliran data untuk menentukan rentang tanggal. Untuk informasi detail tentang cara menyiapkan refresh bertahap, lihat artikel refresh bertahap.

Pertimbangan kapan tidak mengatur refresh bertahap

Jangan atur aliran data ke refresh bertahap dalam situasi berikut:

  • Entitas tertaut tidak boleh menggunakan refresh bertahap jika mereferensikan aliran data.

Langkah berikutnya

Artikel berikut ini menyediakan informasi selengkapnya tentang aliran data dan Power BI: