將資料放入 Fabric Lakehouse 的選項
取得資料體驗涵蓋將資料帶入 Lakehouse 的所有使用者案例,例如:
- 連線現有的 SQL Server,並將資料複製到 Lakehouse 上的 Delta 資料表。
- 從您的電腦上傳檔案。
- 將其他 Lakehouse 中的多個資料表複製併合並到新的 Delta 資料表。
- 連線串流來源以降落在湖屋中的資料。
- 參考資料而不從其他內部 Lakehouse 或外部來源複製資料。
將資料載入 Lakehouse 的不同方式
在 Microsoft Fabric 中,有幾種方式可將資料放入 Lakehouse:
- 從本機電腦上傳檔案
- 在管線中執行複製工具
- 設定資料流程
- Notebook 程式碼中的 Apache Spark 程式庫
本機檔案上傳
您也可以上傳儲存在本機電腦上的資料。 您可以直接在 Lakehouse 總管中執行。
管線中的複製工具
複製工具是可高度調整的資料整合解決方案,可讓您連線到不同的資料來源,並以原始格式載入資料,或將其轉換成 Delta 資料表。 複製工具是管線活動的一部分,您可以透過多種方式修改,例如根據事件排程或觸發。 如需詳細資訊,請參閱 如何使用複製活動 複製資料。
資料流程
對於熟悉 Power BI 資料流程的使用者,可以使用相同的工具將資料載入您的 Lakehouse。 您可以從 Lakehouse 總管 [取得資料] 選項快速存取它,並從超過 200 個連接器載入資料。 如需詳細資訊,請參閱 快速入門:建立您的第一個資料流程以取得和轉換資料 。
筆記本程式碼
您可以使用可用的 Spark 程式庫直接連線到資料來源、將資料載入資料框架,然後將它儲存在 Lakehouse 中。 此方法是載入 Lakehouse 中使用者程式碼完全管理之資料的最開放方式。
注意
使用 Spark 程式碼建立的外部差異資料表不會顯示在 SQL 分析端點上。 使用資料表空間中的快捷方式,讓外部差異資料表可供 SQL 分析端點看見。
選擇載入資料的方法時的考慮
使用案例 | 建議 |
---|---|
從本機電腦上傳小型檔案 | 使用本機檔案上傳 |
小型資料或特定連接器 | 使用資料流程 |
大型資料來源 | 在管線中使用複製工具 |
複雜的資料轉換 | 使用 Notebook 程式碼 |
相關內容
意見反映
https://aka.ms/ContentUserFeedback。
即將推出:我們會在 2024 年淘汰 GitHub 問題,並以全新的意見反應系統取代並作為內容意見反應的渠道。 如需更多資訊,請參閱:提交及檢視以下的意見反映: