Azure Stack HCI 遥测和诊断扩展

适用于:Azure Stack HCI 版本 23H2 和 22H2

本文简要概述了用于 Azure Stack HCI 群集的遥测和诊断扩展及其优势和可用选项。

关于扩展

遥测和诊断 Arc 扩展 (在Azure 门户) 中显示为 AzureEdgeTelemetryAndDiagnostics,支持从 Azure Stack HCI 系统收集遥测和诊断信息。 此信息可帮助 Microsoft 获取对系统行为的宝贵见解。

使用遥测和诊断扩展可以监视和评估 Azure Stack HCI 的性能、功能与整体运行状况。 Microsoft 还可以使用此扩展中的诊断信息来排查和解决系统中的任何潜在问题。

有关详细信息,请参阅 Azure Stack HCI 上的 Azure Arc 扩展管理

好处

遥测和诊断扩展的部分优点包括:

  • 提高合规性:启用遥测和诊断数据,以便在数据上传期间符合区域服务和数据驻留要求。

  • 简化日志收集,加快问题解决速度:让你轻松收集诊断日志。 Microsoft 支持部门和工程团队使用这些日志快速解决任何系统问题。

  • 减轻更新造成的影响:允许对 Azure Stack HCI 系统进行非破坏性更新,并且不需要重启主机服务器。

  • 资源消耗控制:确保占用的 CPU 不超过 5%。 通过 Azure Arc 扩展框架强制控制该过程。

遥测和诊断设置

即使已安装并运行遥测扩展,你仍可控制是否向 Microsoft 发送遥测数据。

若要访问发送遥测数据的选项,请执行以下步骤:

  1. 在 Azure 门户中,转到你的 Azure Stack HCI 群集资源。 在左侧窗格中转到“设置”,然后选择“扩展”。

    扩展设置屏幕的屏幕截图。

  2. 选择以下选项之一来共享遥测数据:

    • 关闭: 选择此选项不向 Microsoft 发送系统数据。

    • 基本: 选择此选项可向 Microsoft 发送保持群集最新、安全且正常运行所需的最低系统数据。

    • 增强: 选择此选项可发送更多系统数据,以帮助 Microsoft 识别和修复操作问题以及改进产品。 强烈建议启用增强诊断。

      增强型数据共享的一些优势包括:

      • 将系统数据保留最多一个月。
      • 自动捕获错误和诊断信息以更快解决问题。 无需操作员干预。

诊断数据收集

若要识别并修复 Azure Stack HCI 解决方案的问题,可以收集诊断日志并将其发送给 Microsoft。 若要手动收集诊断日志并将其发送到 Microsoft,请使用任何 Azure Stack HCI 服务器节点中的 Send-DiagnosticData cmdlet。 建议在提交支持案例之前使用此 cmdlet 上传诊断数据。

有关详细信息,请参阅 收集诊断日志

Microsoft 根据其 标准隐私惯例收集数据。 新的遥测代理不会替代现有控制设置。

如果撤销了对数据收集的同意,撤销前收集的任何数据都不受影响。 Microsoft 将继续根据数据收集时制定的条款处理和使用收集的数据。

以下是数据收集时需要考虑的事项:

  • 了解 Microsoft 如何处理和使用你的数据。 查看 Microsoft 的隐私惯例和政策。

  • 了解同意数据收集和撤销同意的含义。 为确保完全理解,请咨询法律或隐私专业人士。

数据隐私注意事项

Azure Stack HCI 将系统数据路由回受保护的云存储位置。 只有具有有效业务需求的 Microsoft 人员才能访问系统数据。 除非客户自行要求,或者符合 Microsoft 隐私声明中所述的受限目的,否则 Microsoft 不会与第三方共享客户个人数据。 数据共享决策由 Microsoft 内部团队(包括隐私、法律和数据管理利益干系人)做出。

请勿在资源或文件名中包含任何机密信息或个人信息。 例如,VM 名称、卷名称、配置文件名、存储文件名(VHD 名称)或群集资源名称。

错误处理。

以下部分讨论错误代码、消息,并针对你在使用遥测和诊断扩展时可能遇到的任何问题提供建议的解决方法:

错误代码 1

错误消息:发生了未经处理的异常。

原因:如果发生未经处理的异常,会显示错误消息。 可以在扩展日志中找到完整的错误消息及其堆栈跟踪。

建议的解决方法:检查常规错误消息,并联系Microsoft 支持部门。 从以下路径收集日志,并将这些日志提供给Microsoft 支持部门:C:\ProgramData\GuestConfig\extension_logs\Microsoft.AzureStack.Observability.TelemetrAndDiagnostics\ObservabilityExtension.log

错误代码 9

错误消息:驱动器上的可用磁盘空间不足。 若要继续安装扩展,请删除部分文件以释放空间。

原因:该扩展作为安装前步骤进行验证,并且至少需要 20 GB 的空间用于系统驱动器上的 GMA 缓存。 如果驱动器空间不足,扩展会针对此问题引发错误消息。

建议的解决方法:释放磁盘空间以允许扩展继续。

错误代码 12

错误消息:如果 Get-AzureStackHCIGet-ClusterNode cmdlet 都无法检索必要信息,则扩展无法创建租户 JSON 配置文件。

原因:扩展使用 Get-AzureStackHCIGet-ClusterNode cmdlet 识别参数并检索创建租户 JSON 所需的信息。 如果这些 cmdlet 不存在,扩展会引发错误消息,指示没有这些 cmdlet 就无法继续工作。

建议的解决方法:验证 Azure Stack HCI 注册。

后续步骤

了解 Azure Stack HCI 上的 Azure Arc 扩展管理