分享方式:


流覽 Fabric Lakehouse 總管

Lakehouse 總管頁面可作為 Lakehouse 環境中所有互動的中央中樞。 總管內建於網狀架構入口網站中。 若要開啟 Lakehouse 總管,請切換至使用工作負載切換器 資料工程師。 尋找並流覽至您的 Lakehouse 專案,這會開啟總管,您可以在其中與 Lakehouse 數據互動。 總管是您閘道,可順暢地將數據載入 Lakehouse、流覽您的數據、預覽內容,以及執行各種數據相關工作。 此頁面分成三個主要區段:Lakehouse 總管、主要檢視和功能區。

Gif 說明 Lakehouse 總管內的控件。

Lakehouse 總管

Lakehouse 總管提供整個 Lakehouse 的統一圖形表示法,為使用者提供數據導覽、存取和管理的直覺式介面。

  • [ 表格區段 ] 是湖屋內受管理區域的易記表示法。 此區域通常會組織並控管,以協助有效率的數據處理和分析。 在這裡,您會找到所有數據表,不論數據表是自動產生,還是明確建立並註冊在中繼存放區中。 您可以選取要預覽的數據表、檢查數據表架構、存取基礎檔案,以及執行與數據相關的各種其他動作。

  • 不明區域是湖屋管理區域內的唯一空間。 它會顯示在 SyMS 中缺少相關聯數據表之受管理區域中的任何資料夾或檔案。 例如,如果使用者將影像或音訊檔案等不支援的檔案上傳至受管理區域,則不會自動偵測到這些檔案並連結到數據表。 相反地,它們會出現在這個不明區域中。 本節的主要目的是要提示使用者從受管理區域移除這些檔案,或將它們傳輸到 [檔案區段] 以進行進一步處理。

  • [檔案] 區 代表湖屋的 Unmanaged 區域,可視為從各種來源擷取的原始數據「登陸區域」。 在這些數據可用於分析之前,通常需要額外的處理。 在本節中,您可以瀏覽目錄、選取要預覽的目錄、將資料夾載入數據表,以及執行各種其他動作。 值得注意的是 ,檔案區段會以獨佔方式顯示資料夾層級物件。 若要檢視檔案層級物件,您必須使用 [主要檢視] 區域。

主要檢視區域

Lakehouse 頁面的主要檢視區域是大部分數據互動發生的空間。 檢視會根據您選取的內容而變更。 由於物件總管只會顯示 Lake 的資料夾層級階層,因此主要檢視區域是您用來巡覽檔案、預覽檔案和數據表,以及各種其他工作的內容。

數據表預覽

我們的數據表預覽數據格配備了一套功能強大的功能,可提升數據互動能力,讓您的數據更順暢地使用。 以下是一些主要功能:

  • 使用簡單的按兩下,以遞增或遞減順序排序數據行。 這項功能可讓您完全掌控數據的組織,同時處理大型語意模型,或需要快速識別趨勢時。

  • 依子字串或從數據表中可用值清單選取來篩選數據。

  • 調整數據行的大小,以量身打造您的數據檢視,以符合您的喜好設定。 這項功能可協助您排定基本數據的優先順序,或擴充視野,以包含更廣泛的資訊範圍。

檔案預覽

在 Lakehouse 中預覽數據檔提供一系列優點,可提升數據品質、瞭解和整體數據管理效率。 它可讓數據專業人員做出明智的決策、優化資源配置,並確保其分析是以可靠且有價值的數據為基礎。

預覽適用於下列檔類型: bmp、css、csv、gif、html、jpeg、jpg、js、json、md、mjs、png、ps1、py、svg、ts、tsx、txt、xml、yaml

功能區

Lakehouse 功能區是您快速存取的動作列,提供在湖屋內執行基本工作的便利方式。 您可以從這裡重新整理 Lakehouse、更新設定、載入數據、建立或開啟筆記本、建立新的自定義語意模型,輕鬆管理 OneLake 數據存取。

將數據載入 Lakehouse 的不同方式

有數種方式可從總管頁面將數據載入 Lakehouse:

  • 本機檔案/資料夾上傳: 輕鬆地將數據從本機計算機直接上傳至 Lakehouse 的 [檔案] 區段。 在這裡深入了解。

  • 筆記本程序代碼: 利用可用的Spark連結庫來連線到數據源,並將數據載入數據框架,然後將它儲存在Lakehouse中。 在這裡尋找其他資訊

  • 在管線中複製工具:連線 至各種數據源,並以原始格式將數據登陸,或將其轉換成 Delta 資料表。 在這裡深入了解。

  • 數據流 Gen 2: 建立數據流以匯入數據、轉換數據,並將其發佈至您的 Lakehouse。 在這裡深入瞭解

  • 快捷方式: 建立可連線到 Lakehouse 中現有數據的快捷方式,而不需要複製它。 在這裡尋找其他資訊

  • 範例: 快速內嵌範例數據,以快速開始探索語意模型和數據表。

探索不同的使用案例,以瞭解在 Lakehouse 中載入數據的最佳方式

存取 Lakehouse 的 SQL 分析端點

您可以使用功能區右上方區域中的下拉式清單,直接從 Lakehouse 存取 SQL 分析端點。 使用此快速存取方法,您會立即進入 t-sql 模式,這可讓您直接在湖中的 Delta 數據表上工作,以協助您準備報告。

我們希望本指南能協助您充分利用湖屋探險家及其多樣化的功能。 您可以隨意探索、實驗及讓您的數據管理工作更有效率。