你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
AdventureWorks 模板文档
本文档介绍如何设置和使用 Microsoft 的 AdventureWorks 管道模板,以使用 Azure Synapse Analytics 和零售数据库模板快速开始探索 AdventureWorks 数据集。
概述
AdventureWorks 是一家虚构的运动器材零售商,用于演示 Microsoft 应用程序。 在本文中,AdventureWorks 将用作示例,演示如何使用 Synapse 管道将零售数据映射到零售数据库模板,以便在 Azure Synapse 中做进一步的分析。
先决条件
- Azure 订阅。 如果还没有 Azure 订阅,可以在开始前创建一个免费 Azure 帐户。
- Azure Synapse 工作区。 创建 Azure Synapse 工作区(如果没有)。
查找模板
按照以下步骤查找模板。
导航到你的 Synapse 工作区。 在主页中,依次选择“知识中心”和“浏览库”。 此时会打开 Synapse 库。 可以搜索要安装在工作区中的数据集、脚本、管道等。
选择“管道”,然后使用关键字“AdventureWorks”筛选结果。
选择“AdventureWorks”模板,然后选择“继续” 。
完成这些步骤后,会打开模板概述页。
配置模板
在模板中只需完成极少量的配置。 在模板概述页中,可以查看管道初始启动配置的预览,然后选择“打开管道”以在自己的工作区中创建资源。 你将收到一条通知,指出已创建模板中的所有 31 个资源。可以先检查这些资源,然后再将其提交或发布。 你将看到模板的以下组件:
- 17 个管道:计划这些管道的目的是确保将数据正确加载到目标表中。其中包括每个源表的一个管道,加上计划管道。
- 14 个数据流:这些数据流包含用于从源系统加载数据并使数据进入目标数据库的逻辑。
如果将 AdventureWorks 数据集加载到其他数据库中,则可以更新数据流源以指向该数据集。 否则,请按照以下步骤创建源数据库和目标数据库,以匹配模板中定义的架构。
数据集和源/目标模型
可以从此 GitHub 站点下载 Excel 格式的 AdventureWorks 数据集。 此外,可以访问源数据库和目标数据库的架构定义。 通过 Synapse 中的数据库设计器,使用前面下载的 Excel 中的架构重新创建源数据库和目标数据库。 有关数据库设计器的详细信息,请参阅此文档。
创建数据库后,通过编辑工作区数据库源和接收器设置中的下拉列表内容,确保数据流指向正确的表。 可以通过将示例数据集中提供的 CSV 文件放入表指定的正确文件夹,将数据加载到源模型中。 完成该操作后,只需运行管道即可。
排查管道问题
如果管道无法成功运行,需要检查几个主要方面来确定出错的原因。
- 数据集架构。 确保 CSV 文件的数据设置准确。 如果包含了行标题,请确保检查数据库表上的行标题选项。
- 数据流源。 如果使用的列或表名称与示例架构中提供的名称不同,则需要逐步执行数据流,以验证是否正确映射列。
- 数据流接收器。 目标数据库上的架构和数据格式配置需要与数据流模板相匹配。 与前面一样,如果进行了任何更改,则需要对齐这些项。