快速入门:运行查询并将其可视化
本快速入门介绍如何查询人员表,以查找名为 Mary 的按出生年份分组的女性人数,并直观显示结果。
该表包含 id、firstName、middleName、lastName、gender、birthDate、ssn 和 salary 列。
本文介绍如何使用 Databricks SQL UI 和 BI 工具(Power BI 和 Tableau Online)来执行相同的查询。
要求
在完成以下部分中的步骤之前,你的 Databricks SQL 管理员必须完成 Databricks SQL 管理员快速入门。
使用 Databricks SQL UI 查询表并创建可视化效果
使用边栏
可使用边栏来访问所有 Azure Databricks 资产。 边栏的内容取决于所选的角色:数据科学与工程、机器学习或 SQL。
默认情况下,侧边处于折叠状态,只有图标可见。 将光标移到边栏上方可展开到完整视图。
若要更改角色,请单击 Databricks 徽标下方的图标
,并选择一个角色。
若要固定某个角色,使其在你下次登录时显示,请单击该角色旁边的
。 再次单击它可以删除固定。使用边栏底部的“菜单选项”将边栏模式设置为“自动”(默认行为)、“展开”或“折叠” 。
切换到另一工作区
如果在同一帐户中有对多个工作区的访问权限,则可以快速切换。
- 在 Azure Databricks 工作区的左下角,单击
。 - 在“工作区”下,选择要切换到的工作区。
步骤 1:登录到 Databricks SQL
登录 Databricks SQL 时,登陆页面如下所示:

如果显示了 Databricks 数据科学和工程或 Databricks 机器学习环境,请&切换到“Databricks SQL”。
步骤 2:查询人员表
在管理员快速入门:设置用户以查询表中,管理员创建了一个名为 people10 的表。 在本部分中,将对此表运行查询,以获得名为 Mary 的所有人员的生日和出生年份。
单击边栏中的
“创建”,然后选择“查询”。此时将显示 SQL 编辑器。
在“新建查询”下面的框中,单击
图标,然后选择“入门级仓库”。第一次创建查询时,可用 SQL 仓库的列表按字母顺序显示。 下次创建查询时,将选择上次使用的仓库。
在仓库下面的框中,单击
图标;如果未选中,请选择“默认”数据库。
粘贴查询名为
Mary的女性人数的SELECT语句:SELECT year(birthDate) as birthYear, count(*) AS total FROM default.people10m WHERE firstName = 'Mary' AND gender = 'F' GROUP BY birthYear ORDER BY birthYear按 Ctrl/Cmd + Enter 或单击“执行”按钮 。
“限制 1000”复选框已默认选中,以确保查询最多返回 1000 行。 如果需要更多行,可取消选中此复选框,并在查询中指定
LIMIT子句。 查询结果将显示在“表”选项卡中。
步骤 3:创建可视化效果
单击“+添加可视化效果”选项卡。
这会显示可视化效果编辑器。

在“X 列”下拉列表中,选择“出生年” 。
在“Y 列”下拉列表中,选择“总计” 。
单击“X 轴”选项卡。
在“名称”字段中,输入
Birth Year。单击“Y 轴”选项卡。
在“名称”字段中,输入
Number of Marys by Birth Year。单击“保存” 。
保存的图表显示在 SQL 编辑器中。

步骤 4:创建仪表板
单击边栏中的
“创建”,然后选择“仪表板”。输入
People。单击“保存” 。
单击右下角的“添加小组件”按钮。
选择“Mary”。
单击“添加到仪表板”。
单击“完成编辑”。

后续步骤
- 通过执行以下操作之一,查看一些示例仪表板,从这些仪表板中,你可以获得丰富的可视化效果和可用的布局:
- 单击“仪表板”页面底部的“查看库” 。
- 转到
https://<databricks-instance>/sql/dashboards/samples,将<databricks-instance>替换为 Azure Databrickshttps://<databricks-instance>/sql/dashboards/samples(例如adb-1234567890123456.7.azuredatabricks.net)。
- 使用常用 BI 工具查询表并创建可视化效果。
使用连接到 Databricks SQL 的 BI 工具查询表并创建可视化效果
本部分介绍如何收集 Databricks SQL 信息,将 Power BI Desktop 和 Tableau Online 连接到 Databricks SQL,以及在每个 BI 工具中查询人员表和直观呈现数据。
本节内容:
Databricks SQL
本部分介绍如何收集仓库连接信息并生成用于向 Databricks SQL 进行身份验证的令牌。
步骤 1:获取 SQL 仓库连接详细信息
单击边栏中的
SQL 仓库。在“仓库”列表中的筛选器框中键入
Starter。单击“入门级仓库”链接。
单击“连接详细信息”选项卡。

单击
以复制“服务器主机名”和“HTTP 路径”。
步骤 2:获取个人访问令牌
可使用个人访问令牌向 Databricks SQL 进行身份验证。
- 单击边栏底部的
“设置”,然后选择“用户设置”。 - 单击“个人访问令牌”选项卡。
- 单击“+ 生成新令牌”。
- 可以选择输入注释并修改令牌生存期。
- 单击“生成” 。
- 单击
以复制令牌,然后单击“确定”。
Power BI
步骤 1:配置从 Power BI 到 Databricks SQL 的连接
选择“获取数据”>“更多…”>“Azure”,然后选择“Azure Databricks”连接器。>

单击“连接” 。
输入在步骤 1:获取 SQL 仓库连接详细信息中复制的“服务器主机名”和“HTTP 路径”。

单击 “确定” 。
在身份验证提示符下,选择“个人访问令牌”选项卡。输入你在步骤 2:获取个人访问令牌中复制的个人访问令牌。
单击“连接” 。
如果 SQL 仓库未运行,它将启动,但可能需要几分钟才能可用。
在 Power BI 导航器中,选择
default.people10m表。单击“加载”。
步骤 2:对数据进行定型
返回名字为 Mary 的女性的记录,并计算每年的 Mary 数量。
- 删除除
firstName、gender和birthDate之外的所有列。 - 使用
firstName = Mary和gender = F筛选数据。 - 将
birthDate的类型更改为Date并删除除年份以外的所有日期组件。 - 按年份分组,以计算每年的 Mary 数量。

步骤 3:直观呈现数据

Tableau Online
步骤 1:配置从 Tableau Online 到 Databricks SQL 的连接
在 Tableau Online 中,打开工作簿或新建工作簿。
选择“数据”>“新建数据源”。

在“连接到数据”对话框中,选择“连接器”>“Databricks”。

在“Databricks 连接”对话框中,输入在步骤 1:获取 SQL 仓库连接详细信息中复制的“服务器主机名”和“HTTP 路径”。

使用
token作为用户名并使用token中的令牌作为密码进行身份验证。单击“登录”。
如果 SQL 仓库未运行,它将启动,但可能需要几分钟才能可用。
在“架构”字段中,输入
default。 按 Enter。在“选择架构”下拉列表中,选择 。
在“表”字段中,输入
people10m。 按 Enter。将
people10表拖动至画布。
步骤 2:对数据进行定型
返回名字为 Mary 的女性的记录,并计算每年的 Mary 数量。
- 删除除
firstName、gender和birthDate之外的所有列。 - 使用
firstName = Mary和gender = F筛选数据。 - 将
birthDate的类型更改为Date并删除除年份以外的所有日期组件。 - 按年份分组,以计算每年的 Mary 数量。

步骤 3:直观呈现数据
以条形图的形式显示:
