使用数据分析工具

数据分析工具提供了全新的直观方法来清理、转换和了解 Power Query 编辑器中的数据。 其中包括:

  • 列质量

  • 列分发

  • 列配置文件

若要启用数据分析工具,请转到功能区中的视图选项卡。 在 Power Query Desktop 中,在数据预览组中启用所需的选项,如下图所示。

数据分析工具。

在 Power Query Online 中,选择数据视图,然后在下拉列表中启用所需的选项。

<替换文本>

启用选项后,Power Query 编辑器中会显示如下图所示的内容。

已启用数据分析工具。

注意

默认情况下,Power Query 对数据的前 1,000 行执行此数据分析。 若要使它对整个数据集进行操作,请在编辑器窗口左下角选择基于前 1000 行的列分析消息,以将列分析更改为基于整个数据集的列分析

列质量

列质量特征将行中的值标记为五类:

  • 有效,显示为绿色。

  • 错误,显示为红色。

  • ,显示为深灰色。

  • 未知,显示为绿色虚线。 指示当列中存在错误时,其余数据的质量未知。

  • 意外错误,显示为红色虚线。

这些指示器作为小条形图的一部分直接显示在列的名称下面,如下图所示。

条形图的增强视图,并且表中的每列上方都有数据质量指标和标签。

每个列质量类别中的记录数也显示为百分比。

将鼠标悬停在任何列上,将显示整个列中值质量的数值分布。 此外,选择省略号按钮 (...) 会打开一些快速操作按钮,可用于对值执行操作。

名称列的分布,其中 701 个名称有效(100%),零错误和零空单元格,并显示快速操作命令。

列分发

此功能在列名称下方提供了一组视觉效果,显示了每个列中值的频率和分布。 这些采用可视化效果的数据从频率最高的值开始按降序排序。

列分布。

将鼠标悬停在任何列中的分布数据上,可以获取有关列中整体数据的信息(具有非重复计数和唯一值)。 还可以选择省略号按钮,从可用操作的菜单中选择。

“列分布”选项。

列配置文件

使用此功能可以更深入地了解列中的数据。 除了列分布图外,还包含列统计信息图。 此信息显示在数据预览部分下面,如下图所示。

列配置文件。

按值筛选

您可以与右侧的值分布图进行交互,并通过将鼠标悬停在图表的各个部分上来选择任何条形图。

将鼠标悬停在值分布条形图中的条形上,其中显示了该条形的单个数据。

右键单击可显示该值的一组可用转换。

显示具有值分布条形图中单个条形的可用转换的快捷键菜单。

复制数据

在列统计信息部分和值分布部分的右上角,可以选择省略号按钮 (...) 以显示复制快捷菜单。 选择它可将任一部分中显示的数据复制到剪贴板。

复制列统计信息。

按值分组

选择值分布图右上角的省略号按钮 (...) 时,除了选择复制之外,还可以选择分组依据。 此功能将图表中的值按一组可用选项分组。

按值分布分组。

下图显示了按文本长度分组的一列产品名称。 在图表中对值进行分组后,可以像按值筛选中所述,与图表中的单个值进行交互。

新条形图,其中显示表“Names”列中存储名称的文本长度分布。