快速入門:使用 Azure Data Factory Studio 的複製資料工具來複製資料

適用於:Azure Data Factory Azure Synapse Analytics

提示

試用 Microsoft Fabric 中的 Data Factory,這是適用於企業的全方位分析解決方案。 Microsoft Fabric 涵蓋從資料移動到資料科學、即時分析、商業智慧和報告的所有項目。 了解如何免費開始新的試用

在此快速入門中,您會使用「複製資料」工具建立管線,將資料從 Azure Blob 儲存體的來源資料夾複製到目標資料夾。

必要條件

Azure 訂用帳戶

如尚未擁有 Azure 訂用帳戶,請在開始之前先建立免費帳戶

準備 Azure Blob 儲存體中的來源資料

選取下方的按鈕以試用!

Try your first data factory demo

系統會將您重新導向至下圖中顯示的設定頁面,以部署範本。 您只需要在這裡建立新的資源群組。 (您可以保留所有其他值的預設值)。然後,按一下 [檢閱 + 建立],接著按一下 [建立] 來部署資源。

注意

範本的部署使用者必須將角色指派給受控識別。 這需要可透過擁有者、使用者存取管理員或受控識別操作員角色授與的權限。

新的 Blob 儲存體帳戶將會在新的資源群組中建立,而 moviesDB2.csv 檔案會儲存在 Blob 儲存體中名為 input 的資料夾中。

A screenshot of the deployment template creation dialog.

建立資料處理站

您可以如快速入門:使用 Azure 入口網站建立資料處理站中所述,使用現有的資料處理站或建立新的資料處理站。

使用複製資料工具複製資料

下列步驟將逐步引導您瞭解如何在 Azure Data Factory 中使用複製資料工具輕鬆地複製資料。

步驟 1:啟動複製資料工具

  1. 在 Azure Data Factory 首頁上,選取 [內嵌] 圖格以啟動 [複製資料] 工具。

    Screenshot that shows the Azure Data Factory home page.

  2. 在 [資料複製] 工具的 [屬性] 頁面上,選擇 [工作型別] 底下的 [內建複製工作],然後選取 [下一步]

    Screenshot that shows the Properties page.

步驟 2:完成來源設定

  1. 按一下 [+ 建立新連線] 以新增連線。

  2. 選取您要為來源連線建立的連結服務類型。 在本教學課程中,我們會使用 Azure Blob 儲存體。 請從資源庫中選取,然後選取 [繼續]

    Screenshot that shows the Select Blob dialog.

  3. 在 [新增連線 (Azure Blob 儲存體)] 頁面上,輸入連線的名稱。 從 [Azure 訂閱] 清單選取您的 Azure 訂閱,並從 [儲存體帳戶名稱] 清單選取您的儲存體帳戶,測試連線,然後選取 [建立]

    Screenshot that shows where to configure the Azure Blob storage account.

  4. 在 [連線] 區塊中選取新建立的連線。

  5. 在 [檔案或資料夾] 區段中,選取 [瀏覽] 瀏覽至 adftutorial/input 資料夾,選取 emp.txt 檔案,然後按一下 [確定]

  6. 選取 [二進位複製] 核取方塊以依原狀複製檔案,然後選取 [下一步]

    Screenshot that shows the Source data store page.

步驟 3:完成目的地設定

  1. 選取您在 [連線] 區塊中建立的 AzureBlobStorage 連線。

  2. 在 [資料夾路徑] 區段中,輸入資料夾路徑 adftutorial/output

    Screenshot that shows the Destination data store page.

  3. 將其他設定保留為預設值,然後選取 [下一步]

步驟 4:檢閱所有設定和部署

  1. 在 [設定] 頁面上,輸入管線名稱及描述,然後選取 [下一步] 使用其他預設管線設定。

    Screenshot that shows the settings page.

  2. 檢閱 [摘要] 頁面上的所有設定,然後選取 [下一步]

  3. 在 [部署完成] 頁面上選取 [監視],以監視您建立的管線。

    Screenshot that shows the Deployment complete page.

步驟 5:監視執行中的結果

  1. 應用程式會切換至 [監視] 索引標籤。您會在此索引標籤上看到管線的狀態。選取 [重新整理] 可重新整理清單。 按一下 [管線名稱] 下方的連結,檢視活動執行詳細資料,或重新執行管線。

    Screenshot that shows the refresh pipeline button.

  2. 在 [活動執行] 頁面上,選取 [活動名稱] 資料行下的 [詳細資料] 連結 (眼鏡圖示),取得複製作業的詳細資訊。 如需屬性的詳細資訊,請參閱複製活動概觀

此範例中的管線會將資料從 Azure Blob 儲存體中的一個位置複製到其他位置。 若想了解使用 Data Factory 的更多案例,請瀏覽教學課程