分享方式:


Lakehouse 教學課程:將數據內嵌至 Lakehouse

在本教學課程中,您會從Wide World Importers (WWI) 內嵌更多維度和事實數據表到 Lakehouse。

必要條件

內嵌資料

在本節中,您會使用 Data Factory 管線的複製數據活動 ,將範例數據從 Azure 記憶體帳戶擷取到 您稍早建立之 Lakehouse 的 [檔案 ] 區段。

  1. 在左側瀏覽窗格中選取 [工作區 ],然後從 [工作區 ] 功能選取新的工作區。 工作區的項目檢視隨即出現。

  2. 從工作區功能區中的 [ +新增 ] 功能表項,選取 [數據管線]。

    顯示如何建立新數據管線的螢幕快照。

  3. 在 [ 新增管線] 對話框中,將名稱指定為 IngestDataFromSourceToLakehouse ,然後選取 [ 建立]。 系統會建立並開啟新的數據處理站管線。

  4. 在您新建立的數據處理站管線上,選取 [管線活動 ] 以將活動新增至管線,然後選取 [ 複製數據]。 此動作會將複製資料活動新增至管線畫布。

    顯示選取 [管線活動] 和 [複製數據的位置] 的螢幕快照。

  5. 從畫布選取新增的複製數據活動。 活動屬性會出現在畫布下方的窗格中(您可能需要拖曳上邊緣來向上展開窗格)。 在 [屬性] 窗格中的 [一般] 索引標籤上,於 [名稱] 字段中輸入 [複製到 Lakehouse 的數據複製]。

    顯示 [一般] 索引標籤上要新增複製活動名稱的位置螢幕快照。

  6. 在所選取資料活動的 [ 來源 ] 索引標籤上,選取 [外部 ] 作為 [資料存放區類型 ],然後選取 [+ 新增 ] 以建立與數據源的新連線。

    顯示 [來源] 索引標籤上選取 [外部] 和 [+ 新增] 位置的螢幕快照。

  7. 在本教學課程中,所有範例數據都可在 Azure Blob 記憶體的公用容器中使用。 您可以連線到此容器,以從中複製數據。 在第一個 [新增連線] 畫面上,選取 [Azure Blob 儲存體],然後選取 [繼續]。

    [新增連線精靈] 的螢幕快照,其中顯示要選取 Azure Blob 儲存體 的位置。

  8. [連線 ion 設定] 畫面上,輸入下列詳細數據,然後選取 [建立] 以建立數據源的連線。

    屬性
    帳戶名稱或 URL https://azuresynapsestorage.blob.core.windows.net/sampledata
    連線 建立新連線
    連線名稱 wwisampledata
    驗證種類 匿名

    連線 設定畫面的螢幕快照,其中顯示輸入詳細數據的位置,然後選取 [建立]。

  9. 建立新的連接之後,返回 複製數據活動的 [來源 ] 索引標籤,預設會選取新建立的連線。 在移至目的地設定之前,請先指定下列屬性。

    屬性
    數據存放區類型 外部
    連線 wwisampledata
    檔案路徑類型 檔案路徑
    檔案路徑 容器名稱(第一個文本框):sampledata
    目錄名稱(第二個文本框):WideWorldImportersDW/parquet
    Recursively 已選取
    File format 二進位

    來源索引標籤的螢幕快照,其中顯示輸入特定詳細數據的位置。

  10. 在選取資料活動的 [ 目的地 ] 索引標籤上,指定下列屬性:

    屬性
    數據存放區類型 工作區
    工作區數據存放區類型 Lakehouse
    Lakehouse wwilakehouse
    根資料夾 檔案
    檔案路徑 目錄名稱(第一個文本框):wwi-raw-data
    File format 二進位

    [目的地] 索引標籤的螢幕快照,其中顯示輸入特定詳細數據的位置。

  11. 您已設定複製資料活動。 選取頂端功能區上的儲存圖示(首頁下方)以儲存變更,然後選取 [執行] 以執行管線及其活動。 您也可以排程管線,以根據定義的間隔重新整理數據,以符合您的商務需求。 在本教學課程中,我們只會選取 [ 執行] 來執行管線一次。

    此動作會觸發基礎數據源的數據複製到指定的 Lakehouse,最多可能需要一分鐘的時間才能完成。 您可以在 [輸出] 索引標籤下監視管線的執行及其活動,當您按下畫布上的任意位置時,就會顯示該索引標籤。 您可以選擇性地選取眼鏡圖示,當您將滑鼠停留在名稱上方時,即可查看數據傳輸的詳細數據。

    此螢幕快照顯示選取 [儲存並執行] 的位置,以及在 [輸出] 索引標籤上尋找執行詳細數據和眼鏡圖示的位置。

  12. 複製數據之後,請移至工作區的項目檢視,然後選取新的 Lakehouse (wwilakehouse) 以啟動 [ 總管 ] 檢視。

    此螢幕快照顯示要選取湖屋以啟動 [總管] 檢視的位置。

  13. 驗證新的資料夾 wwi-raw-data 會出現在 [總管] 檢視中,而且所有數據表的數據都會複製到該處。

    此螢幕快照顯示源數據已複製到 Lakehouse 總管中。

若要將累加式數據載入 Lakehouse,請參閱 將數據從數據倉儲累加載入至 Lakehouse

後續步驟