Microsoft.CognitiveServices/accounts 支持的指标

下表列出了可用于 Microsoft.CognitiveServices/accounts 资源类型的指标。

表标题

指标 - 在Azure 门户中显示的指标显示名称。
Rest API 中的名称 - REST API 中引用的指标名称。
单位 - 度量单位。
聚合 - 默认 聚合 类型。 有效值:Average、Minimum、Maximum、Total、Count。
尺寸 - 可用于指标的维度
时间粒度 - 指标采样的间隔。 例如, PT1M 指示每分钟、每 30 分钟、 PT30MPT1H 每小时等对指标进行采样。
DS 导出 - 指标是否可通过诊断设置导出到 Azure Monitor 日志。 有关导出指标的信息,请参阅 在 Azure Monitor 中创建诊断设置

有关指标保留期的信息,请参阅 Azure Monitor 指标概述

有关支持的日志列表,请参阅 支持的日志类别 - Microsoft.CognitiveServices/accounts

类别 指标 REST API 中的名称 计价单位 聚合 维度 时间粒度 DS 导出
功能出现 操作特征出现次数

每个操作特征的出现次数。
ActionFeatureIdOccurrences 计数 总计 FeatureId, Mode, RunId PT1M
每个事件的功能数 每个事件的操作特征数

每个事件的平均操作特征数量。
ActionFeaturesPerEvent 计数 平均值 Mode, RunId PT1M
操作 操作出现次数

每个操作的出现次数。
ActionIdOccurrences 计数 总计 ActionId, Mode, RunId PT1M
每个事件的命名空间数 每个事件的操作命名空间数

每个事件的平均操作命名空间数量。
ActionNamespacesPerEvent 计数 平均值 Mode, RunId PT1M
操作 每个事件的操作数量

每个事件的操作数量。
ActionsPerEvent 计数 平均值 Mode, RunId PT1M
Azure OpenAI - 用法 活动令牌

令牌总数减去一段时间内的缓存令牌。 适用于 PTU 和 PTU 托管的部署。 使用此指标了解 PTU 基于 TPS 或 TPM 的利用率,并比较方案的目标 TPS 或 TPM 基准。 若要细分 API 请求,可以添加筛选器或按以下维度应用拆分:ModelDeploymentName、ModelName 和 ModelVersion。
ActiveTokens 计数 最小值、最大值、平均值、总计 Region, ModelDeploymentName, ModelName, ModelVersion PT1M
SpeechServices - 用法 转录的音频秒数

转录的秒数
AudioSecondsTranscribed 计数 总计 ApiName, FeatureName, UsageChannel, Region PT1M
SpeechServices - 用法 转换的音频秒数

转换的秒数
AudioSecondsTranslated 计数 总计 ApiName, FeatureName, UsageChannel, Region PT1M
Azure OpenAI - HTTP 请求 提示令牌缓存匹配率

命中缓存的提示令牌的百分比,适用于 PTU 管理的令牌。
AzureOpenAIContextTokensCacheMatchRate 百分比 最小值、最大值、平均值 Region, ModelDeploymentName, ModelName, ModelVersion PT1M
Azure OpenAI - 用法 预配管理的利用率

受支持管理的部署的利用率百分比,以消耗的 PTU (/部署的 PTU) x 100 计算。 当利用率大于或等于 100% 时,将限制调用并返回错误代码 429。 若要细分此指标,可以添加筛选器或按以下维度应用拆分:ModelDeploymentName、ModelName、ModelVersion 和 StreamType (流式处理请求与非流式处理请求)
AzureOpenAIProvisionedManagedUtilization 百分比 最小值、最大值、平均值 Region, StreamType, ModelDeploymentName, ModelName, ModelVersion PT1M
Azure OpenAI - 用法 预配管理的利用率 V2

受支持管理的部署的利用率百分比,计算方式为消耗的 PTU (/部署的 PTU) x 100。 当利用率大于或等于 100%时,将限制调用并返回错误代码 429。 若要细分此指标,可以添加筛选器或按以下维度应用拆分:ModelDeploymentName、ModelName、ModelVersion 和 StreamType (流式处理与非流式处理请求)
AzureOpenAIProvisionedManagedUtilizationV2 百分比 最小值、最大值、平均值 Region, StreamType, ModelDeploymentName, ModelName, ModelVersion PT1M
Azure OpenAI - HTTP 请求 Azure OpenAI 请求

一段时间内对 Azure OpenAI API 的调用数。 适用于 PTU、PTU-Managed 和即用即付部署。 若要细分 API 请求,可以添加筛选器或按以下维度应用拆分:ModelDeploymentName、ModelName、ModelVersion、StatusCode (success、clienterrors、服务器错误) 、StreamType (流式处理与非流式处理请求) 和操作。
AzureOpenAIRequests 计数 总计 ApiName, OperationName, Region, StreamType, ModelDeploymentName, ModelName, ModelVersion, StatusCode PT1M
Azure OpenAI - HTTP 请求 响应时间

建议的延迟 (流式处理请求的响应能力) 度量值。 适用于 PTU 和 PTU 托管的部署。 计算为用户发送提示后显示第一个响应所花费的时间,由 API 网关测量。 此数字随着提示大小增加和/或缓存命中大小减小而增加。 若要细分响应指标的时间,可以添加筛选器或按以下维度应用拆分:ModelDeploymentName、ModelName 和 ModelVersion。

注意:此指标是一个近似值,因为测量的延迟在很大程度上取决于多个因素,包括并发调用和整体工作负载模式。 此外,它不考虑客户端和 API 终结点之间可能存在的任何客户端延迟。 有关最佳延迟跟踪,请参阅自己的日志记录。
AzureOpenAITimeToResponse 毫秒 最小值、最大值、平均值 ApiName, OperationName, Region, StreamType, ModelDeploymentName, ModelName, ModelVersion, StatusCode PT1M
基线估算器整体奖励

基线估算器总奖励。
BaselineEstimatorOverallReward 计数 平均值 Mode, RunId PT1M
基线估算器槽奖励

按槽列出的基线估算器奖励。
BaselineEstimatorSlotReward 计数 平均值 SlotId, SlotIndex, Mode, RunId PT1M
基线随机估算器总奖励

基线随机估算器总奖励。
BaselineRandomEstimatorOverallReward 计数 平均值 Mode, RunId PT1M
基线随机估算器槽奖励

按槽列出的基线随机估算器奖励。
BaselineRandomEstimatorSlotReward 计数 平均值 SlotId, SlotIndex, Mode, RunId PT1M
估计 基线随机事件计数

基线随机事件计数的估算值。
BaselineRandomEventCount 计数 总计 Mode, RunId PT1M
估计 基线随机奖励

基线随机奖励的估算值。
BaselineRandomReward 计数 总计 Mode, RunId PT1M
认知服务 - HTTP 请求 阻止的调用数

超过速率或配额限制的调用数。 请勿将 用于 Azure OpenAI 服务。
BlockedCalls 计数 总计 ApiName, OperationName, Region, RatelimitKey PT1M
使用情况 推理计数

Carnegie Frontdoor 服务的推理计数
CarnegieInferenceCount 计数 总计 Region, Modality, Category, Language, SeverityLevel, UseCustomList PT1M
使用情况 训练的字符数(已弃用)

训练的字符总数。
CharactersTrained 计数 总计 ApiName, OperationName, Region PT1M
使用情况 转换的字符数(已弃用)

传入的文本请求中的字符总数。
CharactersTranslated 计数 总计 ApiName, OperationName, Region PT1M
认知服务 - HTTP 请求 客户端错误数

引发客户端错误(HTTP 响应代码 4xx)的调用数。 请勿将 用于 Azure OpenAI 服务。
ClientErrors 计数 总计 ApiName, OperationName, Region, RatelimitKey PT1M
使用情况 计算机视觉事务

计算机视觉事务数
ComputerVisionTransactions 计数 总计 ApiName, FeatureName, UsageChannel, Region PT1M
ContentSafety - 用法 用于图像审查的调用计数

用于图像审查的调用数。
ContentSafetyImageAnalyzeRequestCount 计数 总计 ApiVersion PT1M
ContentSafety - 用法 用于文本审查的调用计数

用于文本审查的调用数。
ContentSafetyTextAnalyzeRequestCount 计数 总计 ApiVersion PT1M
功能出现 上下文特征出现次数

每个上下文特征的出现次数。
ContextFeatureIdOccurrences 计数 总计 FeatureId, Mode, RunId PT1M
每个事件的功能数 每个事件的上下文特征数

每个事件的上下文特征数量。
ContextFeaturesPerEvent 计数 平均值 Mode, RunId PT1M
每个事件的命名空间数 每个事件的上下文命名空间数

每个事件的上下文命名空间数量。
ContextNamespacesPerEvent 计数 平均值 Mode, RunId PT1M
使用情况 自定义视觉训练时间

自定义视觉训练时间
CustomVisionTrainingTime 总计 ApiName, FeatureName, UsageChannel, Region PT1M
使用情况 自定义视觉事务

自定义视觉预测事务数
CustomVisionTransactions 计数 总计 ApiName, FeatureName, UsageChannel, Region PT1M
认知服务 - HTTP 请求 数据输入

传入数据的大小(字节)。 请勿将 用于 Azure OpenAI 服务。
DataIn 字节 总计 ApiName, OperationName, Region PT1M
认知服务 - HTTP 请求 数据输出

传出数据的大小(字节)。 请勿将 用于 Azure OpenAI 服务。
DataOut 字节 总计 ApiName, OperationName, Region PT1M
使用情况 转换的文档字符数

文档翻译请求中的字符数。
DocumentCharactersTranslated 计数 总计 ApiName, FeatureName, UsageChannel, Region PT1M
使用情况 转换的文档自定义字符数

自定义文档翻译请求中的字符数。
DocumentCustomCharactersTranslated 计数 总计 ApiName, FeatureName, UsageChannel, Region PT1M
使用情况 训练的人脸图像

训练的图像数。 每个事务训练 1,000 个图像。
FaceImagesTrained 计数 总计 ApiName, FeatureName, UsageChannel, Region PT1M
使用情况 存储的人脸

存储的人脸数,每日按比例计算。 每日报告存储的人脸数。
FacesStored 计数 总计 ApiName, FeatureName, UsageChannel, Region PT1M
使用情况 人脸事务

对人脸服务进行 API 调用的数量
FaceTransactions 计数 总计 ApiName, FeatureName, UsageChannel, Region PT1M
FeatureCardinality 按操作列出的特征基数

基于操作的特征基数。
FeatureCardinality_Action 计数 平均值 FeatureId, Mode, RunId PT1M
FeatureCardinality 按上下文列出的特征基数

基于上下文的特征基数。
FeatureCardinality_Context 计数 平均值 FeatureId, Mode, RunId PT1M
FeatureCardinality 按槽列出的特征基数

基于槽的特征基数。
FeatureCardinality_Slot 计数 平均值 FeatureId, Mode, RunId PT1M
Azure OpenAI - 用法 已处理的 FineTuned 训练小时数

在 OpenAI FineTuned 模型中处理的训练小时数
FineTunedTrainingHours 计数 总计 ApiName, ModelDeploymentName, FeatureName, UsageChannel, Region PT1M
Azure OpenAI - 用法 生成的完成令牌

从 OpenAI 模型 (输出) 生成的令牌数。 适用于 PTU、PTU-Managed 和即用即付部署。 若要细分此指标,可以添加筛选器或按以下维度应用拆分:ModelDeploymentName 和 ModelName。
GeneratedTokens 计数 总计 ApiName, ModelDeploymentName, FeatureName, UsageChannel, Region, ModelVersion PT1M
使用情况 存储的图像

存储的自定义视觉图像数。
ImagesStored 计数 总计 ApiName, FeatureName, UsageChannel, Region PT1M
认知服务 - HTTP 请求 延迟

延迟(毫秒)。 请勿将 用于 Azure OpenAI 服务。
Latency 毫秒 平均值 ApiName, OperationName, Region, RatelimitKey PT1M
使用情况 已了解的事件数

已了解的事件数。
LearnedEvents 计数 总计 IsMatchBaseline, Mode, RunId PT1M
使用情况 LUIS 语音请求

LUIS 语音转意向理解请求数
LUISSpeechRequests 计数 总计 ApiName, FeatureName, UsageChannel, Region PT1M
使用情况 LUIS 文本请求

LUIS 文本请求数
LUISTextRequests 计数 总计 ApiName, FeatureName, UsageChannel, Region PT1M
使用情况 匹配的奖励数

匹配的奖励数。
MatchedRewards 计数 总计 Mode, RunId PT1M
使用情况 未激活的事件数

跳过的事件数量。
NonActivatedEvents 计数 总计 Mode, RunId PT1M


每个事件的槽数。
NumberOfSlots 计数 平均值 Mode, RunId PT1M
SpeechServices - 用法 说话人配置文件数

注册的说话人配置文件数。 每小时按比例计算。
NumberofSpeakerProfiles 计数 总计 ApiName, FeatureName, UsageChannel, Region PT1M
使用情况 观察到的奖励数

观察到的奖励数。
ObservedRewards 计数 总计 Mode, RunId PT1M
使用情况 已翻译的文档同步字符

同步) 请求 (文档翻译中的字符数。
OneDocumentCharactersTranslated 计数 总计 ApiName, FeatureName, UsageChannel, Region PT1M
联机估算器总奖励

联机估算器总奖励。
OnlineEstimatorOverallReward 计数 平均值 Mode, RunId PT1M
联机估算器槽奖励

按槽列出的联机估算器奖励。
OnlineEstimatorSlotReward 计数 平均值 SlotId, SlotIndex, Mode, RunId PT1M
估计 联机事件计数

联机事件计数的估算值。
OnlineEventCount 计数 总计 Mode, RunId PT1M
估计 联机奖励

联机奖励的估算值。
OnlineReward 计数 总计 Mode, RunId PT1M
使用情况 已处理的字符数

沉浸式阅读器处理的字符数。
ProcessedCharacters 计数 总计 ApiName, FeatureName, UsageChannel, Region PT1M
使用情况 处理的运行状况文本记录

处理的运行状况文本记录数
ProcessedHealthTextRecords 计数 总计 ApiName, FeatureName, UsageChannel, Region PT1M
使用情况 已处理的图像

处理的图像数
ProcessedImages 计数 总计 ApiName, FeatureName, UsageChannel, Region PT1M
使用情况 处理的页面

处理的页面数
ProcessedPages 计数 总计 ApiName, FeatureName, UsageChannel, Region PT1M
Azure OpenAI - 用法 已处理的提示令牌

在 OpenAI 模型上 (输入) 处理的提示标记数。 适用于 PTU、PTU-Managed 和即用即付部署。 若要细分此指标,可以添加筛选器或按以下维度应用拆分:ModelDeploymentName 和 ModelName。
ProcessedPromptTokens 计数 总计 ApiName, ModelDeploymentName, FeatureName, UsageChannel, Region, ModelVersion PT1M
使用情况 已处理的文本记录数

文本记录的计数。
ProcessedTextRecords 计数 总计 ApiName, FeatureName, UsageChannel, Region PT1M
使用情况 QA 文本记录

处理的文本记录数
QuestionAnsweringTextRecords 计数 总计 ApiName, FeatureName, UsageChannel, Region PT1M
ContentSafety - 风险&安全 潜在滥用用户计数

在一段时间内检测到的潜在滥用用户数。 可以按以下维度添加筛选器或应用拆分:ModelDeploymentName。
RAIAbusiveUsersCount 计数 总计 Region, ModelDeploymentName PT1M
ContentSafety - 风险&安全 检测到有害卷

在一段时间内应用的内容筛选器) ,对 Azure OpenAI API 进行并检测为有害 (块模型和批注模式的调用数。 可以添加筛选器或按以下维度应用拆分:ModelDeploymentName、ModelName 和 TextType。
RAIHarmfulRequests 计数 总计 Region, ModelDeploymentName, ModelName, ModelVersion, ApiName, TextType, Category, Severity PT1M
ContentSafety - 风险&安全 阻止的卷

在一段时间内对 Azure OpenAI API 进行并被应用的内容筛选器拒绝的调用数。 可以添加筛选器或按以下维度应用拆分:ModelDeploymentName、ModelName 和 TextType。
RAIRejectedRequests 计数 总计 Region, ModelDeploymentName, ModelName, ModelVersion, ApiName, TextType, Category PT1M
ContentSafety - 风险&安全 安全检查发送的总卷数

对 Azure OpenAI API 进行并在一段时间内应用的内容筛选器检测到的调用数。 可以添加筛选器或按以下维度应用拆分:ModelDeploymentName、ModelName。
RAITotalRequests 计数 总计 Region, ModelDeploymentName, ModelName, ModelVersion, ApiName PT1M
认知服务 - HTTP 请求 Ratelimit

ratelimit 键的当前速率限制。 请勿将 用于 Azure OpenAI 服务。
Ratelimit 计数 总计 Region, RatelimitKey PT1M
奖励 每个事件的平均奖励

每个事件的平均奖励。
Reward 计数 平均值 BaselineAction, ChosenActionId, MatchesBaseline, NonDefaultReward, Mode, RunId PT1M
认知服务 - HTTP 请求 服务器错误数

引发服务内部错误(HTTP 响应代码 5xx)的调用数。 请勿将 用于 Azure OpenAI 服务。
ServerErrors 计数 总计 ApiName, OperationName, Region, RatelimitKey PT1M
功能出现 槽特征出现次数

每个槽特征的出现次数。
SlotFeatureIdOccurrences 计数 总计 FeatureId, Mode, RunId PT1M
每个事件的功能数 每个事件的槽特征数

每个事件的平均槽特征数量。
SlotFeaturesPerEvent 计数 平均值 Mode, RunId PT1M
槽出现次数

每个槽的出现次数。
SlotIdOccurrences 计数 总计 SlotId, SlotIndex, Mode, RunId PT1M
每个事件的命名空间数 每个事件的槽命名空间数

每个事件的平均槽命名空间数量。
SlotNamespacesPerEvent 计数 平均值 Mode, RunId PT1M
奖励 槽奖励

每个槽的奖励。
SlotReward 计数 平均值 BaselineActionId, ChosenActionId, MatchesBaseline, NonDefaultReward, SlotId, SlotIndex, Mode, RunId PT1M
SpeechServices - 用法 说话人辨识事务

说话人辨识事务数
SpeakerRecognitionTransactions 计数 总计 ApiName, FeatureName, UsageChannel, Region PT1M
SpeechServices - 用法 语音模型托管时间

语音模型托管时间数
SpeechModelHostingHours 计数 总计 ApiName, FeatureName, UsageChannel, Region PT1M
使用情况 语音会话持续时间(已弃用)

语音会话的总持续时间(以秒计)。
SpeechSessionDuration 总计 ApiName, OperationName, Region PT1M
认知服务 - HTTP 请求 成功调用数

成功调用数。 请勿将 用于 Azure OpenAI 服务。
SuccessfulCalls 计数 总计 ApiName, OperationName, Region, RatelimitKey PT1M
认知服务 - SLI AvailabilityRate

使用以下公式计算可用性百分比:(调用总数 - 服务器错误数)/调用总数。 服务器错误包括任何 >=500 的 HTTP 响应。 请勿将 用于 Azure OpenAI 服务。
SuccessRate 百分比 最小值、最大值、平均值 ApiName, OperationName, Region, RatelimitKey PT1M
SpeechServices - 用法 Synthesized Characters

字符数。
SynthesizedCharacters 计数 总计 ApiName, FeatureName, UsageChannel, Region PT1M
使用情况 转换的文本字符数

传入的文本翻译请求中的字符数。
TextCharactersTranslated 计数 总计 ApiName, FeatureName, UsageChannel, Region PT1M
使用情况 转换的文本自定义字符数

传入的自定义文本翻译请求中的字符数。
TextCustomCharactersTranslated 计数 总计 ApiName, FeatureName, UsageChannel, Region PT1M
使用情况 训练的文本字符数

使用文本翻译训练的字符数。
TextTrainedCharacters 计数 总计 ApiName, FeatureName, UsageChannel, Region PT1M
Azure OpenAI - 用法 已处理的推理令牌

在 OpenAI 模型上处理的推理令牌数。 计算为输入) (提示标记以及输出) (生成的令牌。 适用于 PTU、PTU-Managed 和即用即付部署。 若要细分此指标,可以添加筛选器或按以下维度应用拆分:ModelDeploymentName 和 ModelName。
TokenTransaction 计数 总计 ApiName, ModelDeploymentName, FeatureName, UsageChannel, Region, ModelVersion PT1M
认知服务 - HTTP 请求 总调用数

调用总数。 请勿将 用于 Azure OpenAI 服务。
TotalCalls 计数 总计 ApiName, OperationName, Region, RatelimitKey PT1M
认知服务 - HTTP 请求 错误总数

引发错误响应(HTTP 响应代码 4xx 或 5xx)的调用总数。 请勿将 用于 Azure OpenAI 服务。
TotalErrors 计数 总计 ApiName, OperationName, Region, RatelimitKey PT1M
使用情况 Total Events

事件数量。
TotalEvents 计数 总计 Mode, RunId PT1M
认知服务 - HTTP 请求 令牌调用总数

令牌调用的总数。
TotalTokenCalls 计数 总计 ApiName, OperationName, Region PT1M
使用情况 总事务(已弃用)

事务总数。
TotalTransactions 计数 总计 <无> PT1M
估计 用户基线事件计数

用户定义的基线事件计数的估算值。
UserBaselineEventCount 计数 总计 Mode, RunId PT1M
估计 用户基线奖励

用户定义的基线奖励的估算值。
UserBaselineReward 计数 总计 Mode, RunId PT1M
SpeechServices - 用法 语音模型托管小时

小时数。
VoiceModelHostingHours 计数 总计 ApiName, FeatureName, UsageChannel, Region PT1M
SpeechServices - 用法 语音模型训练分钟

分钟数。
VoiceModelTrainingMinutes 计数 总计 ApiName, FeatureName, UsageChannel, Region PT1M