你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Azure VMware 解决方案工作负载的基础结构和预配注意事项

本文讨论Azure VMware 解决方案产品/服务的基础结构设计领域,它指的是基础层。 此层支持高效可靠地运行 VMware vSphere 工作负载所需的计算、存储和网络功能。 本文还介绍如何使用 VMware 软件定义的数据中心 (SDDC) 堆栈实现复原能力、安全性、可伸缩性、自动化和灾难恢复。 VMware SDDC 堆栈包括:

  • VMware ESXi
  • VMware vCenter Server
  • VMware NSX-T 数据中心
  • VMware vSAN
  • VMware HCX (可选)
  • VMware SRM (可选)

计算业务目标

影响:可靠性、性能效率、卓越运营

可用性目标(如服务级别协议 (SLA) Azure VMware 解决方案应用程序)应针对平台定义并就地定义。

使用恢复目标(如恢复时间目标 (RTO) )来确定Azure VMware 解决方案不可用的时间。 使用恢复点目标 (RPO) 来确定灾难期间可接受的数据丢失量。

设计解决方案时,请考虑以下几点:

  • 关键路径依赖项。 并非解决方案的所有组件都同样重要。 明确区分可能会关闭系统的依赖项和可能导致体验降级的依赖项。 设计应强化关键组件的复原能力,以最大程度地降低中断的影响。

  • 按需横向扩展和缩减。 环境应该能够根据负载进行扩展和收缩。 通过自动化处理这些操作。 用户输入应保持在最低水平,以避免由人为引起的典型错误。

建议
  • 建立适合你的平台的 SLA。
  • 定义 RTO 和 RPO 目标。
  • 设计具有复原能力的关键组件。
  • 使用自动化进行横向缩减和横向扩展。

考虑工作负载资源和缩放要求

影响:性能效率、卓越运营

在部署工作负载之前,需要大致了解支持Azure VMware 解决方案所需的组件。 若要实现此理解,需要仔细考虑工作负载的特征、资源和缩放要求。 这些因素构成整个群集设计。 此外,请确保Azure VMware 解决方案是基础结构部署的正确选择。 在某些情况下,将工作负载迁移到基础结构即服务 (IaaS) 或平台即服务, (Azure 中的 PaaS) 解决方案比迁移到 Azure VMware 解决方案 更具成本效益和性能。

建议
  • 在迁移到 Azure VMware 解决方案 之前评估 Azure 本机解决方案。
  • 使用Azure VMware 解决方案部署规划指南清单并阅读Azure VMware 解决方案文档
  • 设置条件以确定要移动到Azure VMware 解决方案哪些工作负荷以及要迁移到 Azure 本机解决方案的工作负荷。 考虑成本、重新分配 IP 容量的能力以及这些条件中的使用模式。

使用粗预配和精简预配

影响:性能效率

在 SDDC 中预配基础结构时,主要关注主机,这些主机是虚拟机的基础计算和存储 (VM) 。 在 Azure VMware 解决方案 中,可以为 VM 的虚拟磁盘选择精简预配或厚预配。 所做的选择取决于特定的存储要求、性能注意事项和预期的 VM 增长。 精简预配通过按需分配存储来优化存储使用情况。 此方法可最大程度地减少未使用的空间。 相比之下,从一开始,粗预配将使用你为每个 VM 分配和保留的全部存储空间。

建议
  • 如果存储效率是重中之重,并且你希望最大程度地减少未使用的存储消耗,请使用精简预配。
  • 如果应用程序需要一致且高性能的存储访问,请考虑进行大量预配。

规划容量和资源使用情况

影响:性能效率

在 Azure VMware 解决方案 中部署应用程序之前,确保正确调整大小和容量至关重要。 具体而言,请考虑可伸缩性要求、增长预测和性能注意事项。

建议
  • 在迁移到 Azure 之前,请使用 Azure Migrate 来深入了解资源使用情况和调整大小的建议。
  • 分析特定时间范围内的资源利用率模式,以帮助建立基线使用情况、确定高峰期和预测资源高峰。
  • 创建一个依赖项映射,其中概述了关键路径上的组件。 主动维护映射,并定期检查它以更改解决方案。

选择区域

影响:性能效率、安全性

若要确保用户靠近解决方案,请仔细考虑要选择的区域。 让用户在物理上靠近对等互连位置可以最大程度地减少延迟,并帮助你满足要求。 例如,如果使用 VMware HCX,则要求往返延迟必须小于 150 毫秒。

在区域选择期间考虑法规要求也很重要。 法规要求和数据驻留限制可能因区域而异。 使用 Azure 异地复制存储时,可以利用配对区域。 在此概念下,每个 Azure 区域都与同一地理位置中的另一个区域配对。 出于税务和执法管辖目的,复制的数据与其对位于同一地理位置。

建议
  • 选择靠近用户或其他 Azure 服务的区域,以帮助最大程度地减少延迟。
  • 了解基于行业或区域的法规合规性的云共享责任模型。
  • 使用 Azure 数据服务时,请确保数据保留在正确的地缘政治区域中。

使用可缩放的设计

影响:可靠性、性能效率

为应用程序调整大小时,请调整 VM 的大小,以在峰值性能下处理工作负荷。 在中断期间,应用程序还应能够在功能降低或性能下降的情况下运行。 若要为故障事件做好准备,请针对复原能力进行设计。 设计系统以响应中断并提供可靠性,即使在区域性、区域性、服务或组件故障影响关键应用程序功能时也是如此。 垂直缩放是 VM 将资源添加到单个主机的功能。 垂直缩放需要选取正确的 SKU,关闭主机电源,并从具有可用资源的 VMware ESXi 主机添加资源。

与垂直缩放相关的停机时间可能会中断业务,因此请考虑在工作负载设计中横向缩放。 水平缩放是跨多个 VM 动态跨工作负载的功能。 水平缩放通常涉及使用 VMware vSphere 功能,例如资源分配设置、VM 模板、克隆或动态资源分配技术。 例如,如果要在三个单独的 VM 之间分配流量,请将这些 VM 放置在三个单独的主机上以实现高可用性。

群集与创建主机的逻辑分组有关,以提供高级管理和可用性功能。 预配主机后,可以在Azure VMware 解决方案环境中创建和配置 VMware vSphere 群集,以管理 VM 并提供计算功能。

建议
  • 使用用于 Azure VMware 解决方案 的自定义 GitHub 自动缩放加载项定义用于Azure VMware 解决方案群集节点中的横向缩减或横向扩展操作的性能指标。

  • 使用放置策略相关性规则来帮助确保资源可用性。 配置相关性规则可让管理员控制 VM 放置。 然后,可以根据特定的要求、性能注意事项、可用性需求或许可约束来分发 VM。

实现高可用性

影响:可靠性、性能效率

在 Azure VMware 解决方案 内部署具有高可用性或聚类分析的 VM 时,建议创建反相关性规则,使 VM 分开并位于不同的主机上。 拉伸群集主要涉及跨容错域或可用性区域计算资源分布。 要考虑的另一个方面是连接到工作负载的延迟。 某些工作负载对延迟可能不敏感。

建议
  • 使用拉伸群集实现高可用性。
  • 通过确保应用程序、数据库和存储层位于同一可用性区域中,将应用程序和服务层并置。
  • 请仔细选择用于部署Azure VMware 解决方案群集的 Azure 区域。 请考虑用户或其他资源的邻近程度、网络连接选项和延迟要求。

使用相关性规则

影响:可靠性

如果一个主机遇到问题或故障,反关联规则会强制跨多个主机进行分发。 此分发有助于限制故障的影响,并维护应用程序和服务的可用性。

建议
  • 当 VM 之间需要低延迟通信路径时,请使用放置策略相关性规则使 VM 保持在同一主机上。
  • 当支持应用程序的 VM 需要容错时,或者想要通过资源分布来优化主机性能时,请使用放置策略 VM-VM 相关性。
  • 对于在 Azure VMware 解决方案 内部署具有高可用性或聚类分析的 VM,请创建放置策略 VM-VM 反关联规则,使这些 VM 分开并位于不同的主机上。

部署 VMware vSAN

影响:可靠性、性能效率

若要设计架构完善的存储Azure VMware 解决方案,需要规划足够的数据保护和冗余。

Azure VMware 解决方案虚拟存储区域网络 (vSAN) 使用Azure VMware 解决方案群集中 VMware ESXi 主机的本地存储资源来创建分布式共享存储基础结构。 vSAN 预配必须充分满足当前和未来的存储需求。 可以使用存储区域网络 (SAN) 存储策略来定义 VM 使用的存储的特征和行为。 可以使用策略根据工作负载的特定要求配置数据保护、性能和空间效率设置。 Azure VMware 解决方案 中的默认存储策略是冗余的。 因此,如果计算机需要将数据复制到额外的 vSAN 节点,请创建另一个策略,以确保数据满足增强的冗余要求。

建议
  • 根据所需的复原能力,确定容错 (FTT) 级别或故障容忍度。
  • (RAID) 配置选择独立磁盘的冗余阵列,以帮助确保数据可用性并防止主机和磁盘故障。

使用 Azure NetApp 文件

影响:可靠性、性能效率

如果计划超出私有云中的存储,Azure VMware 解决方案 中的Azure NetApp 文件是另一种扩展磁盘分配并提供高性能、低延迟、可缩放存储平台的解决方案。 Azure NetApp 文件根据工作负载需求动态调整存储容量和性能层。 因此,Azure VMware 解决方案环境可以随着存储需求的增长而扩展。

确保与Azure VMware 解决方案交互的 Azure 服务(例如Azure NetApp 文件)位于部署Azure VMware 解决方案所在的同一区域中。 如果应用程序的全部或部分延迟高度敏感,则可能要求组件并置。 在这种情况下,多区域和多区域策略的适用性有限。 但归置可以减少延迟,因此应用程序响应速度更快。 例如,使用基于Azure NetApp 文件的数据存储,其中并置对磁盘扩展至关重要。

建议
  • 请考虑使用Azure NetApp 文件或第三方解决方案作为Azure VMware 解决方案的额外数据存储。
  • 进行应用程序评估,以帮助确定Azure VMware 解决方案节点和外部存储解决方案(如Azure NetApp 文件)的最佳组合。
建议
  • 制定一个过程来帮助确保在节点替换过程中不会丢失任何数据。

建立基线性能

影响:卓越运营

建立性能基线可让你深入了解Azure VMware 解决方案的功能,并帮助你识别性能约束。

建议
  • 在迁移到Azure VMware 解决方案私有云之前,请使用工具对现有环境进行基准测试。 可用于建立基线性能的一些常见实用工具包括 VMware vRealize OperationsPerfmoniostat
  • 在估计私有云容量Azure VMware 解决方案时,请使用基于性能的评估

使用调试和故障排除工具

影响:卓越运营

在 SDDC 中通过系统方法识别、故障排除和修复问题可以加快解决速度。 运营团队必须能够定义工作负荷遇到的问题或症状以及问题的范围。 他们还需要能够收集信息,包括错误消息、日志以及触发问题的任何特定条件或操作。

有关基础结构监视的详细内容,请参阅Azure VMware 解决方案工作负荷的监视注意事项

建议

后续步骤

检查基础Azure VMware 解决方案平台后,请调查应用程序平台,其中包括数据库、VM、操作系统和配置。

使用评估工具评估设计选项。