通过 PowerShell 部署工作区

本文介绍了如何使用 Powershell 创建 Azure Databricks 工作区。

如果选择在本地使用 PowerShell,则本文要求安装 Az PowerShell 模块,并使用 Connect-AzAccount cmdlet 连接到 Azure 帐户。 有关安装 Az PowerShell 模块的详细信息,请参阅安装 Azure PowerShell

要以用户身份连接到 Azure 帐户,请参阅使用 Azure Databricks 用户帐户登录 PowerShell。 要以服务主体身份连接到 Azure 帐户,请参阅使用 Microsoft Entra ID 服务主体进行 PowerShell 登录

注意

如果要在持有美国政府合规性认证(如 FedRAMP High)的 Azure 商业云中创建 Azure Databricks 工作区,请联系你的 Microsoft 或 Azure Databricks 帐户团队来获得这种体验的访问权限。

如果这是你第一次使用 Azure Databricks,则必须注册 Microsoft.Databricks 资源提供程序。

  Register-AzResourceProvider -ProviderNamespace Microsoft.Databricks

使用 Azure Cloud Shell

Azure 托管 Azure Cloud Shell(一个可通过浏览器使用的交互式 shell 环境)。 可以将 Bash 或 PowerShell 与 Cloud Shell 配合使用来使用 Azure 服务。 可以使用 Azure Cloud Shell 预安装的命令来运行本文中的代码,而不必在本地环境中安装任何内容。

若要启动 Azure Cloud Shell,请执行以下操作:

  • 选择代码块右上角的“试用”。 选择“试用”不会自动将代码复制到 Cloud Shell。
  • 转到 https://shell.azure.com 或选择“启动 Cloud Shell”按钮可在浏览器中打开 Cloud Shell。
  • 选择 Azure 门户右上角菜单栏上的 Cloud Shell 按钮。

若要在 Azure Cloud Shell 中运行本文中的代码,请执行以下操作:

  • 启动 Cloud Shell。
  • 选择代码块上的“复制”按钮以复制代码。
  • 在 Windows 和 Linux 上选择 Ctrl+Shift+V 将代码粘贴到 Cloud Shell 会话中,或在 macOS 上选择 Cmd+Shift+V 将代码粘贴到 Cloud Shell 会话中。
  • 选择 Enter 运行此代码。

如果有多个 Azure 订阅,请选择应当计费的资源所在的相应订阅。 使用 Set-AzContext cmdlet 选择特定的订阅 ID。

Set-AzContext -SubscriptionId 00000000-0000-0000-0000-000000000000

创建资源组

使用 New-AzResourceGroup cmdlet 创建 Azure 资源组。 资源组是在其中以组的形式部署和管理 Azure 资源的逻辑容器。

以下示例在“美国西部 2”区域创建名为“myresourcegroup”的资源组。

New-AzResourceGroup -Name myresourcegroup -Location westus2

创建 Azure Databricks 工作区

在本部分,使用 PowerShell 创建 Azure Databricks 工作区。

New-AzDatabricksWorkspace -Name mydatabricksws -ResourceGroupName myresourcegroup -Location westus2 -ManagedResourceGroupName databricks-group -Sku standard

提供以下值:

属性 描述
名称 提供 Databricks 工作区的名称
ResourceGroupName 指定现有资源组名称
位置 选择“美国西部 2”。 有关其他可用区域,请参阅各区域推出的 Azure 服务
ManagedResourceGroupName 指定是要创建新的受管理资源组还是使用现有受管理资源组。
SKU 在“标准”、“高级”和“试用”之间进行选择。 有关这些层的详细信息,请参阅 Databricks 定价

创建工作区需要几分钟时间。 完成此过程后,你的用户帐户将自动添加为工作区的管理员用户。

注意

当工作区部署失败时,仍然会在失败状态下创建工作区。 删除失败的工作区,并创建一个解决部署错误的新工作区。 删除失败的工作区时,托管资源组和任何成功部署的资源也将被删除。

确定 Databricks 工作区的预配状态

若要确定 Databricks 工作区是否已成功预配,可以使用 Get-AzDatabricksWorkspace cmdlet。

Get-AzDatabricksWorkspace -Name mydatabricksws -ResourceGroupName myresourcegroup |
  Select-Object -Property Name, SkuName, Location, ProvisioningState
Name            SkuName   Location  ProvisioningState
----            -------   --------  -----------------
mydatabricksws  standard  westus2   Succeeded