Microsoft Fabric 術語

瞭解 Microsoft Fabric 中使用的詞彙定義,包括 Synapse 數據倉儲、Synapse 資料工程師、Synapse 資料科學、Synapse 即時分析、Data Factory 和 Power BI 的特定詞彙。

一般條款

  • 容量: 容量是一組專用的資源,可在指定時間使用。 容量會定義資源執行活動或產生輸出的能力。 不同的項目在特定時間會耗用不同的容量。 Fabric 會透過 Fabric SKU 和試用版提供容量。 如需詳細資訊,請參閱 什麼是容量?

  • 體驗: 以特定功能為目標的功能集合。 網狀架構體驗包括 Synapse 數據倉儲、Synapse 資料工程師 ing、Synapse 資料科學、Synapse 即時分析、Data Factory 和 Power BI。

  • 項目: 體驗內一組功能的專案。 使用者可以建立、編輯和刪除它們。 每個項目類型都提供不同的功能。 例如,資料工程師 體驗包括 Lakehouse、Notebook 和 Spark 作業定義專案。

  • 租使用者: 租用戶是組織的 Fabric 單一實例,且與 Microsoft Entra 標識符一致。

  • 工作區: 工作區是專案集合,可將不同功能結合在專為共同作業設計的單一環境中。 它會做為容器,其會針對執行的工作使用容量,併為誰可以存取其中的專案提供控件。 例如,在工作區中,使用者會建立報表、筆記本、語意模型等。如需詳細資訊,請參閱 工作區 一文。

Synapse 資料工程

  • Lakehouse: Lakehouse 是檔案、資料夾和數據表的集合,代表 Apache Spark 引擎和 SQL 引擎用於巨量數據處理之數據湖上的資料庫。 Lakehouse 在使用開放原始碼 Delta 格式化數據表時,包含 ACID 交易的增強功能。 Lakehouse 專案裝載於 Microsoft OneLake 中唯一的工作區資料夾內。 它包含以資料夾和子資料夾組織的各種格式檔案(結構化和非結構化)。 如需詳細資訊,請參閱 什麼是湖屋?

  • 筆記本: 網狀架構筆記本是具有豐富函式的多語言互動式程序設計工具。 其中包括撰寫程式代碼和 Markdown、執行和監視 Spark 作業、檢視和可視化結果,以及與小組共同作業。 它可協助數據工程師和數據科學家探索和處理數據,以及使用程式碼和低程式碼體驗建置機器學習實驗。 它可以輕鬆地轉換成協調流程的管線活動。

  • Spark 應用程式: Apache Spark 應用程式是由使用者使用其中一種 Spark API 語言 (Scala、Python、Spark SQL 或 Java) 或 Microsoft 新增的語言 (.NET 搭配 C# 或 F# 撰寫的程式)。 當應用程式執行時,它會分成一或多個平行執行的Spark作業,以更快處理數據。 如需詳細資訊,請參閱 Spark應用程式監視

  • Apache Spark 作業: Spark 作業是與應用程式中其他作業平行執行的 Spark 應用程式的一部分。 作業是由多個工作所組成。 如需詳細資訊,請參閱 Spark作業監視

  • Apache Spark 作業定義: Spark 作業定義是由使用者設定的一組參數,指出應該如何執行 Spark 應用程式。 它可讓您將批次或串流作業提交至 Spark 叢集。 如需詳細資訊,請參閱 什麼是 Apache Spark 作業定義?

  • V 順序: 對 parquet 檔案格式的寫入優化,可快速讀取並提供成本效益和更佳的效能。 所有網狀架構引擎預設都會寫入 v 排序的 parquet 檔案。

Data Factory

  • 連線 or:Data Factory 提供一組豐富的連接器,可讓您連線到不同類型的數據存放區。 線上之後,您就可以轉換數據。 如需詳細資訊,請參閱 連接器

  • 數據管線: 在Data Factory中,資料管線用於協調數據移動和轉換。 這些管線與 Fabric 中的部署管線不同。 如需詳細資訊,請參閱 Data Factory 概觀中的管線

  • 數據流 Gen2: 數據流提供低程式碼介面,可從數百個數據源擷取數據,以及轉換您的數據。 Fabric 中的數據流稱為數據流 Gen2。 數據流 Gen1 存在於 Power BI 中。 相較於 Azure Data Factory 或 Power BI 中的數據流,數據流 Gen2 提供額外的功能。 您無法從 Gen1 升級至 Gen2。 如需詳細資訊,請參閱 Data Factory 概觀中的數據流

Synapse 資料科學

  • Data Wrangler: Data Wrangler 是以筆記本為基礎的工具,可為使用者提供沉浸式體驗來執行探勘數據分析。 此功能會結合類似網格線的數據顯示與動態摘要統計數據和一組常見的數據清理作業,所有作業都有一些選取的圖示。 每個作業都會產生可儲存回筆記本作為可重複使用腳本的程序代碼。

  • 實驗: 機器學習實驗是所有相關機器學習執行的組織和控制主要單位。 如需詳細資訊,請參閱 Microsoft Fabric 中的機器學習實驗。

  • 模型: 機器學習模型是經過定型以辨識特定模式類型的檔案。 您可以透過一組數據來定型模型,並提供用來推論及從該數據集學習的演算法。 如需詳細資訊,請參閱 機器學習模型

  • 執行: 執行會對應至單一執行模型程序代碼。 在 MLflow,追蹤是以實驗和執行為基礎。

Synapse 數據倉儲

  • SQL 分析端點: 每個 Lakehouse 都有一個 SQL 分析端點,可讓使用者透過 TDS 使用 TSQL 查詢差異資料表數據。 如需詳細資訊,請參閱 SQL 分析端點

  • Synapse 數據倉儲: Synapse 數據倉儲可作為傳統數據倉儲,並支援企業數據倉儲所預期的完整交易式 T-SQL 功能。 如需詳細資訊,請參閱 Synapse 數據倉儲

Synapse 即時分析

  • KQL 資料庫: KQL 資料庫會以您可以對其執行 KQL 查詢的格式來儲存數據。 如需詳細資訊,請參閱 查詢 KQL 資料庫

  • KQL 查詢集: KQL 查詢集是用來執行查詢、檢視結果,以及操作數據總管資料庫中數據的查詢結果的專案。 查詢集包含資料庫和數據表、查詢和結果。 KQL 查詢集可讓您儲存查詢以供日後使用,或匯出查詢並與他人共用。 如需詳細資訊,請參閱 KQL 查詢集中的查詢數據

  • 事件串流: Microsoft Fabric 事件串流功能會在 Fabric 平臺中提供集中式位置,以擷取、轉換和路由即時事件到沒有程式代碼體驗的目的地。 事件數據流包含各種串流數據源、擷取目的地,以及需要轉換時的事件處理器。 如需詳細資訊,請參閱 Microsoft Fabric 事件數據流

OneLake

  • 快捷方式: 快捷鍵是指向其他檔案存放區位置的 OneLake 內嵌參考。 它們提供連線到現有數據的方法,而不需要直接複製它。 如需詳細資訊,請參閱 OneLake 快捷方式