开始 SQL Server 大数据群集 部署

适用于: SQL Server 2019 (15.x)

重要

Microsoft SQL Server 2019 大数据群集附加产品将停用。 对 SQL Server 2019 大数据群集的支持将于 2025 年 2 月 28 日结束。 具有软件保障的 SQL Server 2019 的所有现有用户都将在平台上获得完全支持,在此之前,该软件将继续通过 SQL Server 累积更新进行维护。 有关详细信息,请参阅公告博客文章Microsoft SQL Server 平台上的大数据选项

本文概述了如何部署 SQL Server 大数据群集。 本文向你介绍概念并提供用于理解部署方案的框架。 具体部署步骤因客户端和服务器的平台选择而异。 有关 SQL Server 大数据群集 的简介,请参阅 SQL Server 2019 大数据群集

有关 SQL Server 方案,请参阅:

快速简介

观看此 9 分钟的视频,大致了解如何部署大数据群集:

提示

要快速获得一个部署了 Kubernetes 和大数据群集的环境以协助增强其功能,请使用脚本部分中指向的示例脚本之一。 部署后,可使用以下部分中的客户端工具来管理群集。

客户端工具

大数据群集需要一组特定的客户端工具。 将大数据群集部署到 Kubernetes 之前,应安装部署所需的工具。 对于不同方案,需要使用特定的工具。 每篇文章都应说明用于执行特定任务的必需工具。 有关工具和安装链接的完整列表,请参阅安装 SQL Server 2019 大数据工具

Kubernetes

大数据群集被部署为在 Kubernetes 中进行管理的一系列相关容器。 可通过多种方式托管 Kubernetes。 即使已有现有的 Kubernetes 环境,也应查看大数据群集的相关要求。

  • Azure Kubernetes 服务 (AKS) :AKS 支持在 Azure 中部署托管的 Kubernetes 群集。 用户仅管理和维护代理节点。 使用 AKS,无需为群集预配硬件。 还可轻松使用 python 脚本部署笔记本创建 AKS 群集和部署大数据群集,只需一步即可完成。 有关为大数据群集部署配置 AKS 的详细信息,请参阅为 SQL Server 2019 大数据群集 配置 Azure Kubernetes 服务

  • Azure Red Hat OpenShift (ARO) :ARO 允许在 Azure 中部署托管的 Red Hat OpenShift 群集。 用户仅管理和维护代理节点。 使用 ARO,无需为群集预配自己的硬件。 还可轻松使用 python 脚本来创建 ARO 群集和部署大数据群集,只需一步即可完成。 此部署模型在 SQL Server 2019 CU5 中引入。

  • 多台计算机:还可以将 Kubernetes 部署到多台 Linux 计算机,这些计算机可以是物理服务器或虚拟机。 可使用 Kubeadm 工具创建 Kubernetes 群集。 可使用 bash 脚本自动执行此类部署。 如果已有想要用于大数据群集的现有基础结构,此方法会很有效。 有关将 kubeadm 部署用于大数据群集的详细信息,请参阅在多台计算机上为 SQL Server 2019 大数据群集 部署配置 Kubernetes

  • Red Hat OpenShift:部署到自己的 Red Hat OpenShift 群集。 相关信息请参阅在 OpenShift 本地和 Azure Red Hat OpenShift 上部署 SQL Server 大数据群集。 此部署模型在 SQL Server 2019 CU5 中引入。

部署大数据群集

配置 Kubernetes 后,可使用 azdata bdc create 命令部署大数据群集。 部署时,可采用多种不同的方法。

  • 若要部署到开发测试环境,则可选择使用 azdata 提供的默认配置之一 。

  • 若要自定义部署,可以创建并使用自己的部署配置文件

  • 对于完全无人参与的安装,可以传递环境变量中的所有其他设置。 有关详细信息,请参阅无人参与的部署

部署脚本

通过部署脚本,只需一个步骤即可部署 Kubernetes 和大数据群集。 部署脚本还经常为大数据群集设置提供默认值。 可以通过创建自己的版本来自定义任何部署脚本,以便以不同的方式配置大数据群集部署。

以下部署脚本当前可用:

部署笔记本

还可以通过运行 Azure Data Studio 笔记本部署大数据群集。 有关如何在 AKS 上使用笔记本进行部署的详细信息,请参阅以下文章:

后续步骤

成功部署大数据群集后,连接到该群集并考虑加载示例数据以便与多个演练配合使用。