什麼是 Microsoft Fabric 中的 Lakehouse?

Microsoft Fabric Lakehouse 是一個數據架構平臺,可用來在單一位置儲存、管理和分析結構化和非結構化數據。 這是一個彈性且可調整的解決方案,可讓組織使用各種工具和架構來處理和分析該數據的大量數據。 它與其他數據管理和分析工具整合,為數據工程和分析提供完整的解決方案。

Gif of overall lakehouse experience.

Lakehouse SQL 分析端點

Lakehouse 會在建立期間自動產生 SQL 分析端點和預設語意模型,以建立服務層。 這項新的檢視功能可讓使用者直接在湖中的 Delta 數據表上工作,以從數據擷取到報告,提供無摩擦且高效能的體驗。

請務必注意, SQL 分析端點 是唯讀體驗,且不支援事務數據倉儲的完整 T-SQL 介面區。

注意

只有 Delta 格式的數據表可在 SQL 分析端點中使用。 無法使用 SQL 分析端點來查詢 Parquet、CSV 和其他格式。 如果您沒有看到數據表,則需要將它轉換成 Delta 格式。

自動數據表探索和註冊

自動數據表探索和註冊是 Lakehouse 的一項功能,可為數據工程師和數據科學家提供完全受控的檔案給數據表體驗。 您可以將檔案放入 Lakehouse 的受管理區域,而系統會自動驗證它是否支持結構化格式,並使用數據行名稱、格式、壓縮等必要元數據將其註冊至中繼存放區。 (目前唯一支援的格式是 Delta 資料表。然後,您可以將檔案參考為數據表,並使用 SparkSQL 語法來與數據互動。

與 Lakehouse 項目互動

數據工程師可以透過數種方式與 Lakehouse 和 Lakehouse 中的數據互動:

  • Lakehouse 總管:總管是湖屋的主要互動頁面。 您可以在 Lakehouse 中載入數據、使用物件總管探索 Lakehouse 中的數據、設定 MIP 標籤和各種其他專案。 深入瞭解總管體驗: 流覽 Fabric Lakehouse 總管

  • 筆記本:數據工程師可以使用筆記本撰寫程序代碼,以數據表和/或資料夾的形式直接讀取、轉換和寫入 Lakehouse。 您可以深入瞭解如何使用 Lakehouse 的筆記本:使用筆記本探索 Lakehouse 中的數據,以及如何使用筆記本將數據載入 Lakehouse。

  • 管線:數據工程師可以使用數據整合工具,例如管線複製工具,從其他來源提取數據,並降落到 Lakehouse。 尋找如何使用複製活動的詳細資訊: 如何使用複製活動複製數據。

  • Apache Spark 作業定義:數據工程師可以開發強固的應用程式,並在 Java、Scala 和 Python 中協調已編譯 Spark 作業的執行。 深入瞭解 Spark 作業: 什麼是 Apache Spark 作業定義?

  • 數據流第 2 代:資料工程師可以使用資料流 Gen 2 來內嵌和準備其數據。 尋找使用數據流載入資料的詳細資訊: 建立您的第一個數據流以取得和轉換數據

深入了解將數據載入 Lakehouse 的不同方式: 將數據放入 Fabric Lakehouse 的選項。

多任務與湖屋

多任務體驗提供瀏覽器索引標籤設計,可讓您在多個專案之間開啟和切換,讓您比以往更有效率地管理 Data Lakehouse。 不同的窗口之間不再雜亂無章,也不會失去工作的追蹤。 Lakehouse 提供增強的多任務處理體驗,讓您的數據管理旅程盡可能有效率且方便使用者使用下列功能:

  • 保留執行中的作業: 您可以在某個索引標籤中上傳或執行數據載入作業,並檢查不同索引標籤中的另一個工作。透過增強的多任務處理,當您在索引標籤之間巡覽時,不會取消執行中的作業。 您可以專注於您的工作,而不會中斷。

  • 保留內容: 當您在索引標籤之間切換時,選取的物件、數據表或檔案會保持開啟且可供使用。 Data Lakehouse 的內容總是在您的指尖上。

  • 非封鎖清單重載: 檔案和數據表清單的非封鎖重載機制。 當清單在背景重新整理時,您可以繼續運作。 它可確保您擁有最新的數據,同時提供順暢且不間斷的體驗。

  • 清楚定義的通知: 快顯通知會指定其來源的 Lakehouse,讓您更輕鬆地追蹤多任務環境中的變更和更新。

無障礙湖屋設計

輔助功能一直是確保 Lakehouse 對每個人的包容性和方便使用的重中之重。 以下是我們迄今已實作以支持輔助功能的重要計劃:

  • 螢幕助讀程式相容性: 您可以與熱門螢幕助讀程序順暢地合作,讓視覺受損的用戶能夠有效地流覽和與平台互動。

  • 適用於不同螢幕大小和方向的文字重排 響應式設計。 文字和內容動態重排,讓使用者更輕鬆地在各種裝置上檢視和互動應用程式。

  • 鍵盤流覽: 改良的鍵盤流覽,可讓使用者在不依賴滑鼠的情況下穿過湖屋,提高運動障礙者的體驗。

  • 影像的替代文字: 所有影像現在都包含描述性替換文字,讓螢幕助讀程式能夠傳達有意義的資訊。

  • 表單域和標籤: 所有表單域都有相關聯的標籤,簡化每個人的數據輸入,包括使用螢幕助讀程式的數據輸入。

在此概觀中,您會對湖屋有基本的瞭解。 前進到下一篇文章,瞭解如何建立和使用您自己的 Lakehouse: