你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

快速入门:开始使用 Azure 数据工厂

适用于: Azure 数据工厂 Azure Synapse Analytics

提示

试用 Microsoft Fabric 中的数据工厂,这是一种适用于企业的一站式分析解决方案。 Microsoft Fabric 涵盖从数据移动到数据科学、实时分析、商业智能和报告的所有内容。 了解如何免费开始新的试用版

欢迎使用 Azure 数据工厂! 本入门文章将指导你在 5 分钟内创建第一个数据工厂和管道。 下面的 ARM 模板将创建并配置试用所需的所有内容。然后,只需导航到演示数据工厂,再单击一次即可触发管道,该管道将一些示例数据从一个 Azure Blob 存储移到另一个 Blob 存储。

先决条件

如果没有 Azure 订阅,请在开始之前创建一个免费帐户

视频摘要

以下视频演示了示例:

单击一下,试用第一个演示

在第一个演示场景中,你将使用数据工厂中的复制活动将名为 moviesDB2.csv 的 Azure blob 从Azure Blob 存储上的输入文件夹复制到输出文件夹。 在实际场景中,服务中任何受支持的数据源和接收器皆可使用此复制操作。 还可能涉及数据转换。

单击一下即可立即试用! 单击下面的按钮后,将在 Azure 中创建以下对象:

  • 数据工厂帐户
  • 数据工厂中包含一个复制活动的管道
  • moviesDB2.csv 上传到输入文件夹作为源的 Azure Blob 存储
  • 用于将数据工厂连接到 Azure Blob 存储的链接服务

步骤 1:单击按钮以开始

选择下面的按钮以进行试用! (如果已单击上述按钮,则无需再次执行此操作。)

Try your first data factory demo

你将重定向到下图中显示的配置页来部署模板。 之后,只需创建新的资源组。 (可以将所有其他值保留默认状态。)然后单击“查看 + 创建”,单击“创建”以部署资源。

注意

部署模板的用户需要将角色分配给托管标识。 这需要通过所有者、用户访问管理员或托管标识操作员角色授予的权限。

上述所有资源都将在新资源组中创建,以便在试用演示后轻松清理它们。

A screenshot of the deployment template creation dialog.

步骤 2:查看已部署的资源

  1. 部署完成后,选择“转到资源组”。 A screenshot of the deployment complete page in the Azure portal after successfully deploying the template.

  2. 在资源组中,你将看到部署创建的新数据工厂、Azure Blob 存储帐户和托管标识。 A screenshot of the contents of the resource group created for the demo.

  3. 选择资源组中的数据工厂以查看它。 然后选择“启动工作室”按钮以继续操作。 A screenshot of the Azure portal on the newly created data factory page, highlighting the location of the Open Azure Data Factory Studio button.

  4. 在“作者”选项卡 Author tab 上进行选择,然后选择模板创建的管道。 然后选择“打开”检查源数据。

    Screenshot of the Azure Data Factory Studio showing the pipeline created by the template.

  5. 在你将看到的源数据集中,选择“浏览”,记下已上传到输入文件夹中的 moviesDB2.csv 文件。

    Screenshot of the source dataset highlighting the Browse button where the user can see the input file created for the demo.

    Screenshot of the contents of the input folder showing the moviesDB2.csv file used in the demo.

步骤 3:触发演示管道以运行

  1. 选择“添加触发器”,然后选择“立即触发”。 Screenshot of the Trigger Now button for the pipeline in the demo.
  2. 在“管道运行”下的右窗格中,选择“确定”。

监视管道

  1. 选择“监视”选项卡 Monitor tab

  2. 可以在“监视”选项卡中查看管道运行的概况,例如运行开始时间、状态等。

    Screenshot of the data factory monitoring tab.

  3. 在本快速入门中,管道只有一个活动类型:复制。 单击管道名称,可以看到复制活动的运行结果的详细信息。

    Screenshot of the run results of a copy activity in the data factory monitoring tab.

  4. 单击详细信息会显示详细的复制过程。 结果显示,读取和写入数据的大小相同,1 个文件已读取和写入,这也证明所有数据已成功复制到目标。

    Screenshot of the detailed copy activity run results.

清理资源

可以通过两种方式中的任何一种清理在本快速入门中创建的所有资源。 可以删除整个 Azure 资源组,其中包括资源组中创建的所有资源。 或者,如果要使某些资源保持不变,请浏览到资源组,并仅删除所需的特定资源,从而保留其他资源。 例如,如果使用此模板创建数据工厂供其他教程使用,则可以删除其他资源,但只保留数据工厂。

在本快速入门中,你创建了一个 Azure 数据工厂,其中具有包含复制活动的管道。 若要详细了解 Azure 数据工厂,请继续阅读以下文章和 Learn 模块。