什么是语义链接?

语义链接是一项功能,可用于在 Microsoft Fabric 中的语义模型和 Synapse 数据科学之间建立连接。 仅在 Microsoft Fabric 中支持使用语义链接。

对于 Spark 3.4 及以上版本,使用 Fabric 时,语义链接在默认运行时中可用,无需安装。 如果使用的是 Spark 3.3 或更低版本,或者想要更新到最新版本的语义链接,则可以运行以下命令:

%pip install -U semantic-link

语义链接的主要目标是促进数据连接,实现语义信息的传播,并与数据科学家使用的已建立的工具无缝集成,例如笔记本。 语义链接可帮助你以标准化方式保留有关数据语义的域知识,从而加快数据分析和减少错误。

数据流从包含数据和语义信息的语义模型开始。 语义链接弥合了 Power BI 与数据科学体验之间的差距。

关系图显示了从 Power BI 到 Synapse 数据科学中的笔记本及返回 Power BI 的数据流。

借助语义链接,可以在数据科学体验中使用 Power BI 中的语义模型来执行诸如使用机器学习技术进行深入统计分析和预测建模等任务。 数据科学工作的输出可以存储在使用 Apache Spark 的 OneLake 中,并使用 Direct Lake 引入到 Power BI 中。

Power BI 连接

语义模型充当单个表格对象模型,为语义定义(例如 Power BI 度量值)提供可靠的来源。 若要连接到语义模型,请执行以下操作:

  • 语义链接通过 SemPy Python 库提供与 Python pandas 生态系统的数据连接,使数据科学家可以轻松处理数据。
  • 语义链接让更熟悉 Apache Spark 生态系统的数据科学家可以通过 Spark 原生连接器访问语义模型。 此实现支持各种语言,包括 PySpark、Spark SQL、R 和 Scala。

语义信息的应用程序

数据中的语义信息包括 Power BI 数据类别,例如地址和邮政编码、表之间的关系和分层信息。 这些数据类别包括语义链接传播到数据科学环境中的元数据,以实现新的体验和维护数据世系。 语义链接的一些示例应用程序包括:

语义链接是一种功能强大的工具,使业务分析师能够在全面的数据科学环境中有效使用数据。 语义链接简化了数据科学家与业务分析师之间的无缝协作,无需重新实现嵌入 Power BI 度量的业务逻辑。 此方法可确保双方都能高效高效地工作,最大限度地发挥数据驱动见解的潜力。

FabricDataFrame 数据结构

FabricDataFrame 是语义链接的核心数据结构。 它将 pandas 数据帧分成子类并添加元数据,例如语义信息和世系。 FabricDataFrame 是语义链接用于将语义信息从语义模型传播到数据科学环境的主要数据结构。

关系图显示了从连接器到语义模型到 FabricDataFrame 再到语义函数的数据流。

FabricDataFrame 支持所有 pandas 操作等。 它公开语义函数和添加度量值方法,使你能够在数据科学工作中使用 Power BI 度量值。