Parallel Data Warehouse 组件 - Analytics Platform System

本文介绍 Analytics Platform System 的设备软件和非设备软件组件。

Parallel Data Warehouse software

设备软件 - 查询处理和用户数据存储

控制节点

MPP 引擎
MPP 引擎是大规模并行处理 (MPP) 系统的大脑。 此选项执行以下操作:

  • 在计算节点上创建并行查询计划和协调并行查询执行。

  • 存储并协调所有数据库的元数据和配置数据。

  • 管理 SQL Server PDW 数据库身份验证和授权。

  • 跟踪硬件和软件状态。

数据移动服务 (DMS)

数据移动服务 (DMS) 属于 PDW 的“独门秘籍”。 此选项执行以下操作:

  • 将数据传入 SQL Server PDW 节点和从其中传出。

  • 处理需要在节点之间传输数据的查询操作。

  • 通过优化数据传输速度来提高查询性能。

管理控制台

管理控制台是一个 Web 应用程序,它提供设备状态、健康状况和性能信息。

配置管理器

Configuration Manager (dwconfig.exe) 是设备管理员用来配置 Analytics Platform System 的工具。

控制节点数据库

SQL Server 管理控制节点上的所有数据库。

  • Shell 数据库管理所有分布式用户数据库的元数据。

  • TempDB 包含设备中所有用户临时表的元数据。

  • Master 是控制节点上 SQL Server 的主表。

计算节点

计算节点是并行数据处理和存储单元。 它们具有直连式的存储,并使用 SQL Server 管理用户数据。

数据移动服务 (DMS)

数据移动服务 (DMS) 在每个计算节点上运行,执行以下操作:

  • 作为处理并行查询的一部分,DMS 将数据传输到其他计算机节点和控制节点,并从这些位置传出。

  • DMS 在每个计算节点上运行,可并行接收数据加载。 数据直接从加载服务器并行加载到计算节点

  • DMS 将数据从每个计算节点直接传输到备份服务器。

  • DMS 使用 PolyBase 将数据传入外部 Hadoop 群集或 Azure 存储 Blob 并从中传出。

计算节点数据库

每个计算节点运行 SQL Server 实例来处理查询和管理用户数据。

设备结构

设备结构为设备提供操作系统、服务和网络基础结构。

域控制器

Active Directory (AD) 域服务 (DS)
Analytics Platform System 在 Analytics Platform System 节点之间执行身份验证,并管理 SQL Server PDW Windows 身份验证登录名的身份验证。

DNS 服务
Windows 域名服务 (DNS) 为 Analytics Platform System 设备将域名解析为 IP 地址。

Windows 部署服务

Windows 部署服务 (WDS) 将 Windows Server 操作系统部署到设备上。 它部署在设备中的每个主机和虚拟机上。

DHCP 服务创建 IP 地址,以便设备域中的主机可以加入设备网络,而无需预先配置 IP 地址。

Virtual Machine Manager

Analytics Platform System 使用虚拟化来实现高可用性。 Virtual Machine Manager 托管 System Center,用于在物理主机上部署操作系统。

通过 Windows Server Update Services (WSUS) 在所有主机和虚拟机上应用或删除 Windows 更新。

Windows Server

设备中的所有主机和虚拟机都运行 Windows Server 操作系统。

故障转移群集

Windows 故障转移群集提供在主机发生故障时重启被动主机上的进程的功能。

存储空间

Windows 存储空间将用户数据作为一小部分计算节点的存储池进行管理。 如果计算节点故障,则仍可通过组中的另一个计算节点访问数据。

Hyper-V

Microsoft Hyper-V 服务器提供简单可靠的虚拟化解决方案。 Analytics Platform System 使用虚拟化来平衡 CPU 资源,并为 PDW 节点和设备结构组件提供高可用性。

非关系数据

PolyBase 技术将 SQL Server PDW 数据与外部 Hadoop 数据集成。 Hadoop 数据可以存储在以下任何 Hadoop 数据源上:

  • Hortonworks Hadoop 分发

  • Hadoop 的 Cloudera 分发

  • HDInsight 数据存储在 Azure 存储 Blob 中

查询工具

通过修改 Transact-SQL 编写查询,以适应查询的 MPP 性质。 所有查询都提交到控制节点,该节点生成并行查询计划以跨计算节点运行查询。

SQL Server Data Tools (SSDT)

SQL Server Data Tools 在 Visual Studio 内部运行,我们建议使用此 GUI 工具将查询提交到 SQL Server PDW。 它类似于 SQL Server Management Studio,允许你浏览对象资源管理器。

如果还没有 Visual Studio,可以免费下载所需的工具。

sqlcmd 命令行查询工具

sqlcmd 是用于运行 Transact-SQL 语句和系统命令的 SQL Server 命令行工具。 它与 SQL Server PDW 结合使用,我们推荐使用此命令行工具来查询 SQL Server PDW。 使用 sqlcmd,可以从命令行、批处理文件或 Windows PowerShell 以交互方式运行 Transact-SQL 语句。

Integration Services

可以使用 Integration Services 查询 SQL Server PDW。

链接服务器

通过使用 SQL Server 链接服务器连接,可以使用 SQL Server 将 Transact-SQL 语句提交到 SQL Server PDW。

商业智能工具

Analysis Services

SQL Server PDW 是 Analysis Services 数据库和 Excel PowerPivot 模型的有效数据源。 使用 OLE DB 提供程序,可以将 Analysis Services 多维数据集配置为使用多维联机分析处理 (MOLAP) 或关系联机分析处理 (ROLAP) 存储。

报表生成器

对于使用 SQL Server Report Builder 为 Reporting Services 开发的报告,可以使用 SQL Server PDW 作为 SQL Server 数据源。 还可以为报表模型将 SQL Server PDW 用作 SQL Server 源。 通过使用报表管理器或报表服务器 API,可以从 SQL Server PDW 数据库生成模型。

Power Pivot for Excel

可以使用 PowerPivot for Excel 连接到 SQL Server PDW,这是一款免费下载的工具,可大大扩展 Excel 的数据分析功能。

加载工具

Integration Services

安装特定于分析平台系统 (PDW) 的目标适配器,就可以使用 SQL Server Integration Services 将数据加载到分析平台系统 (PDW)。

dwloader 命令行加载器

dwloader 是一种命令行加载工具,可将数据从加载服务器并行加载到 SQL Server PDW 计算节点。

PolyBase for Hadoop 集成

使用 PolyBase 技术,可以将非关系数据从 Hadoop 群集加载到 SQL Server PDW 中的关系表。 Hadoop 数据可以位于外部 Hadoop 群集或 Azure Blob 存储中。

数据库备份和还原

SQL Server PDW 使用 Transact-SQL 数据库备份和还原命令来并行地向备份服务器和自备份服务器备存和还原用户数据库。 SQL Server PDW 将备份写入 Windows 文件共享中的目录,然后同样自 Windows 文件共享还原数据。

有关详细信息,请参阅计划备份和加载硬件以及备份和还原概述

远程表副本

借助远程表复制功能,可以将表从 SQL Server PDW 数据库复制到远程(非设备)SMP SQL Server 数据库。 这为 SQL Server PDW 启用中心和分支方案。

监视

Analytics Platform System 有多种方法来监视设备活动

管理控制台

使用管理控制台可以查看有关设备健康状况的当前状态。 这在控制节点上作为 Web 应用程序运行,可通过 https 进行访问。

有关详细信息,请参阅使用管理控制台监视设备 (Analytics Platform System)

系统视图

管理控制台基于系统视图查询。 可以单独查询系统视图以获取所需的特定信息片段。

有关详细信息,请参阅使用系统视图监视设备 (Analytics Platform System)

System Center Operations Manager

有适用于 SQL Server PDW 的 System Center Operations Manager (SCOM) 管理包。

要为 SCOM 配置设备,请参阅使用 System Center Operations Manager监视设备 (Analytics Platform System)