你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

将数据仓库迁移到 Azure Synapse Analytics 中的专用 SQL 池

以下部分概述了将现有数据仓库解决方案迁移到 Azure Synapse Analytics 专用的 SQL 池 (之前称为 SQL 数据仓库) 所涉及的内容。

概述

开始迁移之前,应验证 Azure Synapse Analytics 是否是最适合你的工作负载的解决方案。 Azure Synapse Analytics 是一种分布式系统,用于对大型数据执行分析。 迁移到 Azure Synapse Analytics 需要一些设计更改,这些更改不难理解,但可能需要一些时间才能实现。 如果业务要求企业级的数据仓库,那么花费一些时间来实现这些优点是值得的。 但是,如果不需要 Azure Synapse Analytics 的功能,则使用 SQL ServerAzure SQL 数据库更加经济高效。

如果存在以下情况,请考虑使用 Azure Synapse Analytics:

  • 具有 1 TB 或数 TB 的数据。
  • 计划对巨量数据运行分析。
  • 需要能够缩放计算和存储。
  • 想要在不需要计算资源时通过将其暂停来节省成本。

对于存在以下情况的运营联机事务处理 (OLTP) 工作负载,请考虑使用其他选项,而不是 Azure Synapse Analytics:

  • 高频率读取和写入。
  • 大量的单一实例选择。
  • 大量的单行插入。
  • 逐行处理需求。
  • 不兼容的格式(如 JSON 和 XML)。

预迁移

决定将现有解决方案迁移到 Azure Synapse Analytics 后,需要在开始前对迁移进行规划。 规划的主要目的是确保数据、表架构以及代码与 Azure Synapse Analytics 兼容。 当前系统与 Azure Synapse Analytics 之间存在一些需要解决的兼容性差异问题。 此外,将大量数据迁移到 Azure 需要时间。 仔细规划可加快将数据迁移到 Azure 的过程。

规划的另一个重要目的是调整设计,以确保解决方案充分利用 Azure Synapse Analytics 可提供的高查询性能。 由于为了实现缩放性而设计数据仓库时会引入独特的设计模式,因此传统的方法不一定最合适。 虽然在迁移后可以进行某些设计调整,但是在过程中尽早进行更改可以为以后的操作节省时间。

Migrate

执行成功的迁移需要迁移表架构、代码和数据。 有关这些主题的更详细指导,请参阅以下文章:

更多资源

有关从 Netezza 或 Teradata 迁移到 Azure Synapse Analytics 的特定详细信息,请从有关迁移的七文章系列的第一步开始:

实际操作中的迁移资产

若要获得完成此迁移方案的更多帮助,请参阅以下资源。 这些资源是为支持实际迁移项目而开发的。

标题/链接 说明
数据工作负载评估模型和工具 此工具为给定工作负载提供建议的“最适合”目标平台、云就绪性和应用程序/数据库修正级别。 它提供简单的一键式计算和报表生成功能,通过提供统一的自动化目标平台决策过程,帮助加速大规模评估。
处理在将数据加载到 Azure Synapse Analytics 时遇到的数据编码问题 这篇博客文章旨在提供有关在使用 PolyBase 将数据加载到专用的 SQL 池 (之前称为 SQL 数据仓库) 时可能遇到的一些数据编码问题的见解。 此文还提供了一些选项,可用于解决此类问题并成功加载数据。
在 Azure Synapse Analytics 专用 SQL 池中获取表大小 架构师必须执行的一项关键任务是获取有关迁移后的新环境的指标。 例如,收集从本地到云的加载时间并收集 PolyBase 加载时间。 其中最重要的一项任务是确定专用 SQL 池 (之前称为 SQL 数据仓库) 中的存储大小情况(与客户当前平台相比)。

数据 SQL 工程团队开发了这些资源。 此团队的核心章程是解锁和加速到 Microsoft 的 Azure 数据平台的数据平台迁移项目的复杂现代化进程。

视频

观看 Walgreens 如何迁移其零售库存系统,在创纪录的时间内将大约 100TB 的数据从 Netezza 迁移到 Azure Synapse Analytics。

提示

有关 Synapse 迁移的详细信息,请参阅 Azure Synapse Analytics 迁移指南