Terminologi Microsoft Fabric

Pelajari definisi istilah yang digunakan dalam Microsoft Fabric, termasuk istilah khusus untuk Synapse Data Warehouse, Synapse Rekayasa Data, Synapse Ilmu Data, Synapse Real-Time Analytics, Data Factory, dan Power BI.

Ketentuan umum

  • Kapasitas: Kapasitas adalah sekumpulan sumber daya khusus yang tersedia pada waktu tertentu untuk digunakan. Kapasitas mendefinisikan kemampuan sumber daya untuk melakukan aktivitas atau menghasilkan output. Item yang berbeda mengonsumsi kapasitas yang berbeda pada waktu tertentu. Fabric menawarkan kapasitas melalui Fabric SKU dan Trials. Untuk informasi selengkapnya, lihat Apa itu kapasitas?

  • Pengalaman: Kumpulan kemampuan yang ditargetkan ke fungsionalitas tertentu. Pengalaman Fabric termasuk Synapse Data Warehouse, Synapse Rekayasa Data, Synapse Ilmu Data, Synapse Real-Time Analytics, Data Factory, dan Power BI.

  • Item: Item sekumpulan kemampuan dalam pengalaman. Pengguna dapat membuat, mengedit, dan menghapusnya. Setiap jenis item menyediakan kemampuan yang berbeda. Misalnya, pengalaman Rekayasa Data mencakup item definisi kerja lakehouse, notebook, dan Spark.

  • Penyewa: Penyewa adalah satu instans Fabric untuk organisasi dan selaras dengan ID Microsoft Entra.

  • Ruang kerja: Ruang kerja adalah kumpulan item yang menyandingkan fungsionalitas yang berbeda dalam satu lingkungan yang dirancang untuk kolaborasi. Ini bertindak sebagai kontainer yang menggunakan kapasitas untuk pekerjaan yang dijalankan, dan menyediakan kontrol untuk siapa yang dapat mengakses item di dalamnya. Misalnya, di ruang kerja, pengguna membuat laporan, notebook, model semantik, dll. Untuk informasi selengkapnya, lihat artikel Ruang kerja.

Rekayasa Data Synapse

  • Lakehouse: Lakehouse adalah kumpulan file, folder, dan tabel yang mewakili database melalui data lake yang digunakan oleh mesin Apache Spark dan mesin SQL untuk pemrosesan big data. Lakehouse mencakup kemampuan yang ditingkatkan untuk transaksi ACID saat menggunakan tabel berformat Delta sumber terbuka. Item lakehouse dihosting dalam folder ruang kerja unik di Microsoft OneLake. Ini berisi file dalam berbagai format (terstruktur dan tidak terstruktur) yang diatur dalam folder dan subfolder. Untuk informasi selengkapnya, lihat Apa itu lakehouse?

  • Notebook: Notebook Fabric adalah alat pemrograman interaktif multi-bahasa dengan fungsi yang kaya. Yang mencakup penulisan kode dan markdown, menjalankan dan memantau pekerjaan Spark, melihat dan memvisualisasikan hasil, dan berkolaborasi dengan tim. Ini membantu teknisi data dan ilmuwan data untuk menjelajahi dan memproses data, dan membangun eksperimen pembelajaran mesin dengan kode dan pengalaman kode rendah. Ini dapat dengan mudah diubah menjadi aktivitas alur untuk orkestrasi.

  • Aplikasi Spark: Aplikasi Apache Spark adalah program yang ditulis oleh pengguna menggunakan salah satu bahasa API Spark (Scala, Python, Spark SQL, atau Java) atau bahasa yang ditambahkan Microsoft (.NET dengan C# atau F#). Saat aplikasi berjalan, aplikasi dibagi menjadi satu atau beberapa pekerjaan Spark yang berjalan secara paralel untuk memproses data lebih cepat. Untuk informasi selengkapnya, lihat Pemantauan aplikasi Spark.

  • Pekerjaan Apache Spark: Pekerjaan Spark adalah bagian dari aplikasi Spark yang dijalankan secara paralel dengan pekerjaan lain dalam aplikasi. Pekerjaan terdiri dari beberapa tugas. Untuk informasi selengkapnya, lihat Pemantauan pekerjaan Spark.

  • Definisi kerja Apache Spark: Definisi pekerjaan Spark adalah sekumpulan parameter, yang ditetapkan oleh pengguna, menunjukkan bagaimana aplikasi Spark harus dijalankan. Ini memungkinkan Anda untuk mengirimkan pekerjaan batch atau streaming ke kluster Spark. Untuk informasi selengkapnya, lihat Apa itu definisi kerja Apache Spark?

  • Urutan V: Pengoptimalan tulis ke format file parke yang memungkinkan pembacaan cepat dan memberikan efisiensi biaya dan performa yang lebih baik. Semua mesin Fabric menulis file parket yang diurutkan v secara default.

Data Factory

  • Koneksi or: Data Factory menawarkan sekumpulan konektor kaya yang memungkinkan Anda terhubung ke berbagai jenis penyimpanan data. Setelah tersambung, Anda dapat mengubah data. Untuk informasi selengkapnya, lihat konektor.

  • Alur data: Di Data Factory, alur data digunakan untuk mengatur pergerakan dan transformasi data. Alur ini berbeda dari alur penyebaran di Fabric. Untuk informasi selengkapnya, lihat Alur di gambaran umum Data Factory.

  • Aliran Data Gen2: Aliran data menyediakan antarmuka kode rendah untuk menyerap data dari ratusan sumber data dan mengubah data Anda. Aliran data dalam Fabric disebut sebagai Dataflow Gen2. Aliran Data Gen1 ada di Power BI. Dataflow Gen2 menawarkan kemampuan tambahan dibandingkan dengan Aliran Data di Azure Data Factory atau Power BI. Anda tidak dapat meningkatkan dari Gen1 ke Gen2. Untuk informasi selengkapnya, lihat Aliran data di gambaran umum Data Factory.

Ilmu Data Synapse

  • Data Wrangler: Data Wrangler adalah alat berbasis notebook yang memberi pengguna pengalaman imersif untuk melakukan analisis data eksploratif. Fitur ini menggabungkan tampilan data seperti kisi dengan statistik ringkasan dinamis dan serangkaian operasi pembersihan data umum, semuanya tersedia dengan beberapa ikon yang dipilih. Setiap operasi menghasilkan kode yang dapat disimpan kembali ke buku catatan sebagai skrip yang dapat digunakan kembali.

  • Eksperimen: Eksperimen pembelajaran mesin adalah unit utama organisasi dan kontrol untuk semua eksekusi pembelajaran mesin terkait. Untuk informasi selengkapnya, lihat Eksperimen pembelajaran mesin di Microsoft Fabric.

  • Model: Model pembelajaran mesin adalah file yang dilatih untuk mengenali jenis pola tertentu. Anda melatih model melalui sekumpulan data, dan Anda menyediakannya dengan algoritma yang digunakannya untuk menjelaskan dan belajar dari himpunan data tersebut. Untuk informasi selengkapnya, lihat Model pembelajaran mesin.

  • Jalankan: Eksekusi sesuai dengan satu eksekusi kode model. Di MLflow, pelacakan didasarkan pada eksperimen dan eksekusi.

Gudang data Synapse

  • Titik akhir analitik SQL: Setiap Lakehouse memiliki titik akhir analitik SQL yang memungkinkan pengguna untuk mengkueri data tabel delta dengan TSQL melalui TDS. Untuk informasi selengkapnya, lihat Titik akhir analitik SQL.

  • Gudang Data Synapse: Gudang Data Synapse berfungsi sebagai gudang data tradisional dan mendukung kemampuan T-SQL transaksi penuh yang Anda harapkan dari gudang data perusahaan. Untuk informasi selengkapnya, lihat Gudang Data Synapse.

Analitik Real-Time Synapse

  • Database KQL: Database KQL menyimpan data dalam format yang dapat Anda jalankan kueri KQL. Untuk informasi selengkapnya, lihat Mengkueri database KQL.

  • KQL Queryset: KQL Queryset adalah item yang digunakan untuk menjalankan kueri, menampilkan hasil, dan memanipulasi hasil kueri pada data dari database Data Explorer Anda. Set kueri mencakup database dan tabel, kueri, dan hasilnya. Set Kueri KQL memungkinkan Anda menyimpan kueri untuk digunakan di masa mendatang, atau mengekspor dan berbagi kueri dengan orang lain. Untuk informasi selengkapnya, lihat Data kueri di Set Kueri KQL

  • Aliran peristiwa: Fitur streaming peristiwa Microsoft Fabric menyediakan tempat terpusat di platform Fabric untuk menangkap, mengubah, dan merutekan peristiwa real-time ke tujuan dengan pengalaman tanpa kode. Aliran peristiwa terdiri dari berbagai sumber data streaming, tujuan penyerapan, dan prosesor peristiwa saat transformasi diperlukan. Untuk informasi selengkapnya, lihat Aliran peristiwa Microsoft Fabric.

OneLake

  • Pintasan: Pintasan adalah referensi yang disematkan dalam OneLake yang menunjuk ke lokasi penyimpanan file lainnya. Mereka menyediakan cara untuk terhubung ke data yang ada tanpa harus langsung menyalinnya. Untuk informasi selengkapnya, lihat Pintasan OneLake.