分享方式:


如何使用 Microsoft Fabric 筆記本

Microsoft Fabric 筆記本是用來開發 Apache Spark 作業和機器學習實驗的主要程式代碼專案。 這是數據科學家和數據工程師用來撰寫受益於豐富視覺效果和 Markdown 文字的程式代碼的網頁式互動式介面。 數據工程師撰寫程式代碼來擷取數據、數據準備和數據轉換。 數據科學家也會使用筆記本來建置機器學習解決方案,包括建立實驗和模型、模型追蹤和部署。

使用網狀架構筆記本,您可以:

  • 開始使用零設定工作。
  • 使用直覺式低程式代碼體驗輕鬆探索和處理數據。
  • 使用內建企業安全性功能保護數據安全。
  • 使用強大的 Spark 功能,分析原始格式(CSV、txt、JSON 等)處理過的檔格式(parquet、Delta Lake 等)。
  • 透過增強的撰寫功能和內建數據視覺效果,提高生產力。

本文說明如何在數據科學和數據工程體驗中使用筆記本。

建立筆記本

您可以建立新的筆記本或匯入現有筆記本。

建立新的 Notebook

與其他標準網狀架構專案建立程序一樣,您可以從網狀架構 資料工程師 首頁、工作區 [新增] 選項或 [建立中樞] 輕鬆建立新的筆記本。

匯入現有的筆記本

您可以從本機計算機將一或多個現有的筆記本從 資料工程師 或 資料科學 首頁匯入到 Fabric 工作區。 網狀架構筆記本可辨識標準 Jupyter Notebook .ipynb 檔案,以及來源檔案,例如.py、.scala 和 .sql,並據以建立新的筆記本專案。

顯示 [新增] 功能表上尋找筆記本選項位置的螢幕快照。

匯出筆記本

您可以將筆記本匯出為其他標準格式。 Synapse 筆記本可以匯出為:

  • 用於 Jupyter Notebook 的標準筆記本檔案 (.ipynb)。
  • 可從瀏覽器直接開啟的 HTML 檔案 (.html)。
  • Python 檔案 (.py)。
  • Latex 檔案 (.tex)。

顯示要匯出筆記本位置的螢幕快照。

儲存筆記本

在 Fabric 中,筆記本預設會在開啟並編輯後自動儲存;您不需要擔心遺失程式代碼變更。 您也可以使用 [儲存複本] 來複製目前工作區中的另一個複本 或另一個工作區。

顯示儲存複本位置的螢幕快照。

如果您想要手動儲存筆記本,您可以切換至 [手動 儲存] 選項,讓筆記本專案的本機分支,然後使用 SaveCTRL+s 儲存變更。

顯示切換手動儲存位置的螢幕快照。

您也可以選取 [編輯 -> 儲存選項 -> 手動] 來切換至手動儲存模式。 若要開啟筆記本的本機分支,然後手動儲存,請選取 [儲存] 或使用 Ctrl+s 鍵盤快捷方式。

連線 湖屋和筆記本

網狀架構筆記本現在支援與 Lakehouses 的密切互動;您可以從 Lakehouse 總管輕鬆新增或現有的 Lakehouse。

您可以在 Lakehouse 總管中巡覽至不同的湖屋,並釘選一個湖屋作為預設值。 您的預設值接著會掛接至運行時間工作目錄,而您可以使用本機路徑讀取或寫入預設 Lakehouse。

顯示釘選預設 Lakehouse 位置的螢幕快照。

注意

您必須在釘選新的 Lakehouse 或重新命名預設 Lakehouse 之後重新啟動會話。

新增或移除 Lakehouse

選取 Lakehouse 名稱旁邊的 X 圖示會從筆記本索引標籤中移除它,但 Lakehouse 專案仍存在於工作區中。

選取 [新增 Lakehouse ] 以將更多 Lakehouse 新增至筆記本,方法是新增現有的湖屋或建立新的 Lakehouse。

探索 Lakehouse 檔案

Lake view 的 [數據表和檔案] 區段下的子資料夾和檔案會出現在 Lakehouse 列表與筆記本內容之間的內容區域中。 在 [ 數據表檔案 ] 區段中選取不同的資料夾,以重新整理內容區域。

資料夾和檔案作業

如果您使用滑鼠右鍵選取檔案(.csv、.parquet、.txt、.jpg、.png等),您可以使用Spark或 Pandas API 來載入數據。 新的程式代碼儲存格會產生並插入焦點儲存格下方。

您可以從選取的檔案或資料夾,輕鬆地複製具有不同格式的路徑,並在程式碼中使用對應的路徑。

顯示 Lakehouse 中檔案操作功能表的螢幕快照。

筆記本資源

Notebook 資源總管提供類似 Unix 的文件系統,可協助您管理資料夾和檔案。 它提供可寫入的檔案系統空間,您可以在其中儲存小型檔案,例如程式代碼模組、語意模型和影像。 您可以使用筆記本中的程式代碼輕鬆地存取它們,就像您使用本機文件系統一樣。

筆記本資源的動畫 GIF。

這個內建資料夾是每個筆記本實例的系統預先定義資料夾。 它會保留最多 500 MB 的記憶體,以儲存目前筆記本的相依性。 以下是筆記本資源的主要功能:

  • 您可以使用一般作業,例如建立/刪除、上傳/下載、拖放、重新命名、重複,以及透過UI搜尋。
  • 您可以使用相對路徑,例如 builtin/YourData.txt 快速探索。 方法 mssparkutils.nbResPath 可協助您撰寫完整路徑。
  • 您可以透過 [寫入至 lakehouse] 選項,輕鬆地將已驗證的數據移至 Lakehouse。 Fabric 已內嵌常見文件類型的豐富代碼段,可協助您快速開始使用。
  • 這些資源也可透過 在參考筆記本執行案例mssparkutils.notebook.run()中使用

注意

  • 目前,Fabric 支援透過UI上傳特定文件類型,包括.py、.whl.jar、.txt.json、.yml、.xml、.csv、.html、.png、.jpg.xlsx檔案。 您可以透過程式代碼寫入內建資料夾,其中包含不在清單中的檔類型,不過,Fabric 筆記本不支援在不支援的檔案類型上產生代碼段。
  • 每個檔案大小都必須小於 50MB,而內建資料夾總共允許最多 100 個檔案/資料夾實例。
  • 使用 mssparkutils.notebook.run()時,請使用 mssparkutils.nbResPath 命令來存取目標筆記本資源。 相對路徑 「builtin/」 一律指向根筆記本的內建資料夾。

在筆記本中共同作業

Fabric 筆記本是共同作業專案,可支援多個使用者編輯相同的筆記本。

當您開啟筆記本時,預設會輸入共同編輯模式,而且會自動儲存每個筆記本編輯。 如果您的同事同時開啟相同的筆記本,您會看到其配置檔、執行輸出、游標指標、選取指標,以及編輯追蹤。 藉由使用共同作業功能,您可以輕鬆地完成配對程式設計、遠端偵錯和輔導案例。

顯示另一位用戶編輯程式代碼儲存格的螢幕快照。

共用筆記本

共用筆記本是與小組成員共同作業的便利方式。 根據預設,授權的工作區角色可以檢視或編輯/執行筆記本。 您可以使用已授與的指定許可權來共享筆記本。

  1. 在筆記本工具列上選取 [共享 ]。

    顯示要選取共用位置的螢幕快照。

  2. 選取可檢視此筆記本的人員對應的類別。 您可以選擇 收件者的 [共享]、 [編輯] 或 [執行 ] 許可權。

    顯示選取許可權位置的螢幕快照。

  3. 選取 [ 套用] 之後,您可以直接傳送筆記本,或將連結複製到其他人。 收件者接著可以使用其許可權等級授與的對應檢視來開啟筆記本。

    顯示建立和傳送連結位置的螢幕快照。

  4. 若要進一步管理筆記本許可權,請選取 [工作區專案] 清單>[更多選項],然後選取 [管理許可權]。 您可以從該畫面更新現有的筆記本存取權和許可權。

    顯示工作區中管理許可權位置的螢幕快照。

為程式代碼儲存格加上批注

批注是共同作業案例的另一個實用功能。 目前,Fabric 支援新增數據格層級批注。

  1. 選取筆記本工具列或儲存格批註指示器上的 [ 批註 ] 按鈕,以開啟 [ 批註 ] 窗格。

    顯示選取 [批注] 位置的螢幕快照。

  2. 在程式代碼數據格中選取程序代碼,在 [批註] 窗格中選取 [新增],新增批注,然後選取 [張貼批注] 以儲存。

    顯示要選取 [新增] 位置的螢幕快照。

  3. 如有需要,請選取批注旁的 [更多] 選項,尋找 [編輯批注]、 [解決線程] 和 [刪除線程 ] 選項。

在批註中標記其他人

「標記」是指在批註線程中提及並通知使用者,以有效率地加強特定專案的共同作業。

  1. 選取儲存格中的程式碼區段,並新增批注線程。

  2. 如果您想要提及某人討論特定區段,請輸入用戶名稱,並選擇建議清單中的正確名稱。

  3. 分享您的深入解析並 張貼

  4. 系統將會觸發電子郵件通知,用戶按兩下 [ 開啟批註 ] 連結以快速找出此單元格。

  5. 此外,在標記沒有存取權的人員時,授權並設定用戶的許可權,以確保您的程式代碼資產受到妥善管理。

以批註標記其他人的動畫GIF。

注意

針對批註專案,如果一小時內更新批註,標記的使用者將不會再收到電子郵件通知。 但它會將電子郵件通知傳送給新的已標記使用者。

切換筆記本模式

網狀架構筆記本支援兩種模式,您可以輕鬆地切換: 編輯 模式和 檢視 模式。

顯示切換模式位置的螢幕快照。

  • 編輯模式:您可以編輯和執行儲存格,並與筆記本上的其他人共同作業。
  • 檢視模式:您只能檢視筆記本的數據格內容、輸出和批注。 對筆記本進行變更的所有作業都會停用。