管理员快速入门:Databricks SQL 的先导任务
有关无需配置的 Databricks SQL 功能的简要概述,请参阅快速入门:通过从仪表板示例库导入仪表板来了解 Databricks SQL。 在开始将 Databricks SQL 用于组织自己的数据之前,管理员必须完成一些先导任务。 本文将指导你完成这些任务。
要求
- Azure Databricks 帐户必须使用高级计划。
- 启动工作区。 可使用现有工作区,也可创建新的工作区。 若要了解如何创建工作区,请查看快速入门:使用 Azure 门户在 Azure Databricks 上运行 Spark 作业。
- 必须是 Azure Databricks 工作区管理员。
使用边栏
可使用边栏来访问所有 Azure Databricks 资产。 边栏的内容取决于所选的角色:数据科学与工程、机器学习或 SQL。
默认情况下,侧边处于折叠状态,只有图标可见。 将光标移到边栏上方可展开到完整视图。
若要更改角色,请单击 Databricks 徽标下方的图标
,并选择一个角色。
若要固定某个角色,使其在你下次登录时显示,请单击该角色旁边的
。 再次单击它可以删除固定。使用边栏底部的“菜单选项”将边栏模式设置为“自动”(默认行为)、“展开”或“折叠” 。
步骤 1:配置数据访问
如果将表存储在云存储中,则必须为 Databricks SQL 提供实例配置文件,以便它可以访问数据。 然后,你可以在下一步中使用标准 SQL 语句来配置对单个数据库、表和视图的精细访问。
注意
如果使用 Azure Databricks 托管表,则无需配置对云存储的访问。
正确配置数据访问后,管理员可以使用数据资源管理器(边栏中的“数据”)浏览外部表。
步骤 2.5:授予权限
Databricks SQL 安全模型基于 SQL 数据库中完善的安全模型,允许使用标准 SQL 语句(如 GRANT 和 REVOKE)设置精细访问。
在 Databricks SQL 中,你可以使用表访问控制来设置基于 SQL 标准的精细权限。 通过表访问控制,管理员和对象所有者可以定义一种表达力强、与云无关的精细安全模型,可为数据湖提供端到端安全性以及可审核性。
对于此步骤,Databricks 强烈建议使用与标识提供程序同步的组来设置权限。 默认情况下,只有管理员可以查看所有数据(基于在第 1 步:配置数据访问中完成的配置)。 可以在数据资源管理器(边栏中的“数据”)中授予权限,也可以在 SQL 编辑器中使用 SQL 命令授予权限。 以下说明使用数据资源管理器。
单击边栏中的“数据”。
数据资源管理器随即打开,并在默认目录(称为
hive_metastore)中显示默认数据库(称为default)中的表。若要选择其他数据库,请单击“默认”,然后选择数据库。
若要在其他目录中选择数据库,请单击 hive_metastore,选择其他目录,然后单击“选择数据库”以选择数据库 。
若要管理整个数据库的权限,请单击“权限”。 若要管理表或视图的权限,请单击其名称,然后单击“权限”。
若要授予权限,请单击“授予”。
- 输入用户或组。
- 选择一个或多个要授予的权限,或选择“全部”授予所有权限。
- 单击 “确定” 。
若要撤销某个权限,请从列表中选择它,然后单击“撤销”。
现在,你已授予用户和组查看数据并与之交互的权限,请继续执行步骤 3:配置 SQL 仓库。
步骤 3:配置 SQL 仓库
SQL 仓库(以前称为 SQL 终结点)是一种计算资源,支持对 Azure Databricks 环境中的数据对象运行 SQL 命令。 为了帮助你入门,创建了一个名为“初学者仓库”的小型 SQL 仓库。 为了处理更复杂的工作负载,可轻松地增大其大小(以减少延迟)或增加底层群集的数量(以处理更多并发用户)。 为了降低成本,初学者仓库配置为在空闲 120 分钟后终止。
要配置初学者仓库或创建其他 SQL 仓库,请单击边栏中的“SQL 仓库”。 若要了解详细信息,请参阅什么是Databricks SQL 仓库?。