使用 Apache Spark 转换 Azure Synapse Link for Dataverse 数据

项目
03/16/2023

您可以使用 Azure Synapse Link 将 Microsoft Dataverse 数据连接到 Azure Synapse Analytics，以探索数据并加快获得见解的速度。本文演示如何使用 Synapse 工作区中可用的 Apache Spark 引擎转换 Dataverse 数据。

备注

Azure Synapse Link for Microsoft Dataverse 以前称为“导出到 Data Lake”。此服务已更名，从 2021 年 5 月起生效，它会继续将数据导出到 Azure Data Lake 以及 Azure Synapse Analytics。

先决条件

本节介绍在使用 Azure Synapse Link for Dataverse 服务后使用 Apache Spark 转换 Dataverse 数据所需的先决条件。

Azure Synapse Link for Dataverse。 本指南假设您已经使用 Azure Synapse Link for Dataverse 从 Dataverse 导出了数据。
存储帐户访问。 您必须被授予存储帐户的以下角色之一：存储 Blob 数据读取者、存储 Blob 数据参与者或存储 Blob 数据负责人。
Synapse 管理员。 您必须在 Synapse Studio 中被授予 Synapse 管理员角色访问权限。

使用 Apache Spark 笔记本转换数据

在 Power Apps 中，从列表中选择所需的 Azure Synapse Link，然后选择转到 Azure Synapse 工作区。
展开数据库，选择 Dataverse 容器。您导出的表将显示在左侧边栏的表目录下。
右键单击所需的表，然后选择新笔记本 > 加载至 DataFrame。
通过从下拉菜单中选择一个池，将笔记本附加到 Apache Spark 池。如果您没有 Apache Spark 池，请选择管理池以创建一个池。
添加代码单元格以转换数据。通过选择每个单元格左侧的播放按钮来运行单个单元格，或者通过从顶部栏中选择全部运行来连续运行所有单元格。

另请参阅

博客：公布 Azure Synapse Link for Dataverse

Azure HDInsight 中的 Apache Spark 是什么

备注

您能告诉我们您的文档语言首选项吗？进行简短调查。（请注意，此调查是英文版调查）

此调查大约需要七分钟。不会收集个人数据（隐私声明）。

反馈

即将发布：在整个 2024 年，我们将逐步淘汰作为内容反馈机制的“GitHub 问题”，并将其取代为新的反馈系统。有关详细信息，请参阅：https://aka.ms/ContentUserFeedback。

提交和查看相关反馈

此产品此页面

查看所有页面反馈