管理员快速入门:Databricks SQL 的先导任务

有关无需配置的 Databricks SQL 功能的简要概述,请参阅快速入门:通过从仪表板示例库导入仪表板来了解 Databricks SQL。 在开始将 Databricks SQL 用于组织自己的数据之前,管理员必须完成一些先导任务。 本文将指导你完成这些任务。

要求

使用边栏

可使用边栏来访问所有 Azure Databricks 资产。 边栏的内容取决于所选的角色:数据科学与工程、机器学习或 SQL。

  • 默认情况下,侧边处于折叠状态,只有图标可见。 将光标移到边栏上方可展开到完整视图。

  • 若要更改角色,请单击 Databricks 徽标下方的图标Databricks logo,并选择一个角色。

    更改角色

  • 若要固定某个角色,使其在你下次登录时显示,请单击该角色旁边的pin persona。 再次单击它可以删除固定。

  • 使用边栏底部的“菜单选项”将边栏模式设置为“自动”(默认行为)、“展开”或“折叠” 。

步骤 1:配置数据访问

如果将表存储在云存储中,则必须为 Databricks SQL 提供实例配置文件,以便它可以访问数据。 然后,你可以在下一步中使用标准 SQL 语句来配置对单个数据库、表和视图的精细访问。

完成配置数据访问的说明,然后继续执行步骤 2:授予权限

注意

如果使用 Azure Databricks 托管表,则无需配置对云存储的访问。

正确配置数据访问后,管理员可以使用数据资源管理器(边栏中的“数据”)浏览外部表。

步骤 2.5:授予权限

Databricks SQL 安全模型基于 SQL 数据库中完善的安全模型,允许使用标准 SQL 语句(如 GRANT 和 REVOKE)设置精细访问。

在 Databricks SQL 中,你可以使用表访问控制来设置基于 SQL 标准的精细权限。 通过表访问控制,管理员和对象所有者可以定义一种表达力强、与云无关的精细安全模型,可为数据湖提供端到端安全性以及可审核性。

对于此步骤,Databricks 强烈建议使用与标识提供程序同步的组来设置权限。 默认情况下,只有管理员可以查看所有数据(基于在第 1 步:配置数据访问中完成的配置)。 可以在数据资源管理器(边栏中的“数据”)中授予权限,也可以在 SQL 编辑器中使用 SQL 命令授予权限。 以下说明使用数据资源管理器。

  1. 单击边栏中的“数据”。

  2. 数据资源管理器随即打开,并在默认目录(称为 hive_metastore)中显示默认数据库(称为 default)中的表。

    若要选择其他数据库,请单击“默认”,然后选择数据库。

    若要在其他目录中选择数据库,请单击 hive_metastore,选择其他目录,然后单击“选择数据库”以选择数据库 。

  3. 若要管理整个数据库的权限,请单击“权限”。 若要管理表或视图的权限,请单击其名称,然后单击“权限”。

  4. 若要授予权限,请单击“授予”。

    1. 输入用户或组。
    2. 选择一个或多个要授予的权限,或选择“全部”授予所有权限。
    3. 单击 “确定”
  5. 若要撤销某个权限,请从列表中选择它,然后单击“撤销”。

现在,你已授予用户和组查看数据并与之交互的权限,请继续执行步骤 3:配置 SQL 仓库

步骤 3:配置 SQL 仓库

SQL 仓库(以前称为 SQL 终结点)是一种计算资源,支持对 Azure Databricks 环境中的数据对象运行 SQL 命令。 为了帮助你入门,创建了一个名为“初学者仓库”的小型 SQL 仓库。 为了处理更复杂的工作负载,可轻松地增大其大小(以减少延迟)或增加底层群集的数量(以处理更多并发用户)。 为了降低成本,初学者仓库配置为在空闲 120 分钟后终止。

要配置初学者仓库或创建其他 SQL 仓库,请单击边栏中的“SQL 仓库”。 若要了解详细信息,请参阅什么是Databricks SQL 仓库?

后续步骤