你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

群集运行状况策略

定义用于评估群集或群集节点运行状况的运行状况策略。

属性

名称 类型 必选
ConsiderWarningAsError boolean
MaxPercentUnhealthyNodes integer
MaxPercentUnhealthyApplications integer
ApplicationTypeHealthPolicyMap ApplicationTypeHealthPolicyMapItem 的数组
NodeTypeHealthPolicyMap NodeTypeHealthPolicyMapItem 的数组

ConsiderWarningAsError

类型:布尔值
必需:否
默认

指示是否将警告的严重性视为与错误相同。


MaxPercentUnhealthyNodes

类型:整数
必需:否
默认

报告错误之前允许的最大不正常节点百分比。 例如,若要允许 10% 的节点处于不正常状态,此值为 10。

该百分比表示在将群集视为出错之前可处于不正常状态的节点的最大容许百分比。 如果未超过该百分比,但至少存在一个不正常的节点,则将运行状况评估为警告。 该百分比的计算方式是将不正常的节点数除以群集中的节点总数。 计算结果调高为整数,以便容忍少量节点上出现一次失败。 默认百分比为零。

在大型群集中,始终会有一些要关闭或需要修复的节点,因此应配置此百分比以便容忍这种情况。


MaxPercentUnhealthyApplications

类型:整数
必需:否
默认

报告错误之前允许的最大不正常应用程序百分比。 例如,若要允许 10% 的应用程序处于不正常状态,此值为 10。

该百分比表示在将群集视为出错之前可处于不正常状态的应用程序的最大容许百分比。 如果未超过该百分比,但至少存在一个不正常的应用程序,则将运行状况评估为 Warning。 该百分比的计算方式是将不正常的应用程序数除以群集中的应用程序实例总数,不包括 ApplicationTypeHealthPolicyMap 中包含的应用程序类型的应用程序。 计算结果调高为整数,以便容忍少量应用程序出现一次失败。 默认百分比为零。


ApplicationTypeHealthPolicyMap

类型ApplicationTypeHealthPolicyMapItem 的数组
必需:否

定义包含特定应用程序类型的最大不正常应用程序百分比的映射。 每个项以键的形式指定应用程序类型名称,以值的形式指定一个整数,该整数表示用于评估指定应用程序类型的应用程序的 MaxPercentUnhealthyApplications 百分比。

群集运行状况评估期间,可使用应用程序类型运行状况策略,描述特殊应用程序类型。 映射中包含的应用程序类型根据映射中指定的百分比,而不是群集运行状况策略中定义的全局 MaxPercentUnhealthyApplications 进行评估。 映射中指定的应用程序类型不会计入全局应用程序池。 例如,如果某种类型的应用程序至关重要,群集管理员可以将条目添加到该应用程序类型的映射,并将其分配值为 0%(即,不容忍任何失败)。 可以使用设置为 20% 容忍数千个应用程序实例外的一些故障 MaxPercentUnhealthyApplications 计算所有其他应用程序。 仅当群集清单启用应用程序类型运行状况评估的配置条目用于 HealthManager/EnableApplicationTypeHealthEvaluation 使用应用程序类型运行状况策略映射。


NodeTypeHealthPolicyMap

类型NodeTypeHealthPolicyMapItem 的数组
必需:否

定义具有特定节点类型的最大不正常节点百分比的映射。 每个条目将节点类型名称指定为键,将指定为值,表示用于计算指定节点类型的节点的 MaxPercentUnhealthyNodes 百分比的整数。

节点类型运行状况策略映射可以在群集运行状况评估期间用于描述特殊的节点类型。 它们根据与映射中的节点类型名称关联的百分比进行评估。 设置此项不会影响用于 MaxPercentUnhealthyNodes 的全局节点池。 仅当群集清单使用 HealthManager/EnableNodeTypeHealthEvaluation 的配置条目启用节点类型运行状况评估时,才使用节点类型运行状况策略映射。

例如,如果群集具有许多不同类型的节点,且在节点类型“SpecialNodeType”上托管着重要工作,不应容忍任何节点关闭。 可以将全局 MaxPercentUnhealthyNodes 指定为 20%,以容忍所有节点的某些故障,但对于节点类型“SpecialNodeType”,通过将 NodeTypeHealthPolicyMapItem 中的键值对中的值设置为 0,将 MaxPercentUnhealthyNodes 设置为 0。 键是节点类型名称。 这样,只要“SpecialNodeType”类型的节点没有处于错误状态,即使全局池中的一些节点处于“错误”状态,但低于全局不正常百分比,群集将评估为“警告”。 警告运行状况状态不会影响群集升级或错误运行状况状态触发的其他监视。 但是,即使在 Error 中为 SpecialNodeType 类型的一个节点,也会使群集运行不正常, (错误而不是警告/正常) ,这会触发回滚或暂停群集升级,具体取决于升级配置。

相反,将全局 MaxPercentUnhealthyNodes 设置为 0,并将 SpecialNodeType 的最大不正常节点百分比设置为 100,如果一个类型为 SpecialNodeType 的节点处于错误状态,则群集仍会处于错误状态,因为在这种情况下全局限制更为严格。