Microsoft.CognitiveServices/accounts 支持的指标

项目
03/29/2024

下表列出了可用于 Microsoft.CognitiveServices/accounts 资源类型的指标。

表标题

指标 - 在Azure 门户中显示的指标显示名称。
Rest API 中的名称 - REST API 中引用的指标名称。
单位 - 度量单位。
聚合 - 默认聚合类型。有效值：Average、Minimum、Maximum、Total、Count。
尺寸 - 可用于指标的维度。
时间粒度 - 指标采样的间隔。例如， PT1M 指示每分钟、每 30 分钟、 PT30MPT1H 每小时等对指标进行采样。
DS 导出 - 指标是否可通过诊断设置导出到 Azure Monitor 日志。有关导出指标的信息，请参阅在 Azure Monitor 中创建诊断设置。

有关指标保留期的信息，请参阅 Azure Monitor 指标概述。

有关支持的日志列表，请参阅支持的日志类别 - Microsoft.CognitiveServices/accounts

类别	指标	REST API 中的名称	计价单位	聚合	维度	时间粒度	DS 导出
功能出现	操作特征出现次数每个操作特征的出现次数。	`ActionFeatureIdOccurrences`	计数	总计	`FeatureId`, `Mode`, `RunId`	PT1M	是
每个事件的功能数	每个事件的操作特征数每个事件的平均操作特征数量。	`ActionFeaturesPerEvent`	计数	平均值	`Mode`, `RunId`	PT1M	是
操作	操作出现次数每个操作的出现次数。	`ActionIdOccurrences`	计数	总计	`ActionId`, `Mode`, `RunId`	PT1M	是
每个事件的命名空间数	每个事件的操作命名空间数每个事件的平均操作命名空间数量。	`ActionNamespacesPerEvent`	计数	平均值	`Mode`, `RunId`	PT1M	是
操作	每个事件的操作数量每个事件的操作数量。	`ActionsPerEvent`	计数	平均值	`Mode`, `RunId`	PT1M	是
Azure OpenAI - 用法	活动令牌令牌总数减去一段时间内的缓存令牌。适用于 PTU 和 PTU 托管的部署。使用此指标了解 PTU 基于 TPS 或 TPM 的利用率，并比较方案的目标 TPS 或 TPM 基准。若要细分 API 请求，可以添加筛选器或按以下维度应用拆分：ModelDeploymentName、ModelName 和 ModelVersion。	`ActiveTokens`	计数	最小值、最大值、平均值、总计	`Region`, `ModelDeploymentName`, `ModelName`, `ModelVersion`	PT1M	是
SpeechServices - 用法	转录的音频秒数转录的秒数	`AudioSecondsTranscribed`	计数	总计	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	是
SpeechServices - 用法	转换的音频秒数转换的秒数	`AudioSecondsTranslated`	计数	总计	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	是
Azure OpenAI - HTTP 请求	提示令牌缓存匹配率命中缓存的提示令牌的百分比，适用于 PTU 管理的令牌。	`AzureOpenAIContextTokensCacheMatchRate`	百分比	最小值、最大值、平均值	`Region`, `ModelDeploymentName`, `ModelName`, `ModelVersion`	PT1M	否
Azure OpenAI - 用法	预配管理的利用率受支持管理的部署的利用率百分比，以消耗的 PTU (/部署的 PTU) x 100 计算。当利用率大于或等于 100% 时，将限制调用并返回错误代码 429。若要细分此指标，可以添加筛选器或按以下维度应用拆分：ModelDeploymentName、ModelName、ModelVersion 和 StreamType (流式处理请求与非流式处理请求)	`AzureOpenAIProvisionedManagedUtilization`	百分比	最小值、最大值、平均值	`Region`, `StreamType`, `ModelDeploymentName`, `ModelName`, `ModelVersion`	PT1M	否
Azure OpenAI - 用法	预配管理的利用率 V2 受支持管理的部署的利用率百分比，计算方式为消耗的 PTU (/部署的 PTU) x 100。当利用率大于或等于 100%时，将限制调用并返回错误代码 429。若要细分此指标，可以添加筛选器或按以下维度应用拆分：ModelDeploymentName、ModelName、ModelVersion 和 StreamType (流式处理与非流式处理请求)	`AzureOpenAIProvisionedManagedUtilizationV2`	百分比	最小值、最大值、平均值	`Region`, `StreamType`, `ModelDeploymentName`, `ModelName`, `ModelVersion`	PT1M	否
Azure OpenAI - HTTP 请求	Azure OpenAI 请求一段时间内对 Azure OpenAI API 的调用数。适用于 PTU、PTU-Managed 和即用即付部署。若要细分 API 请求，可以添加筛选器或按以下维度应用拆分：ModelDeploymentName、ModelName、ModelVersion、StatusCode (success、clienterrors、服务器错误) 、StreamType (流式处理与非流式处理请求) 和操作。	`AzureOpenAIRequests`	计数	总计	`ApiName`, `OperationName`, `Region`, `StreamType`, `ModelDeploymentName`, `ModelName`, `ModelVersion`, `StatusCode`	PT1M	是
Azure OpenAI - HTTP 请求	响应时间建议的延迟 (流式处理请求的响应能力) 度量值。适用于 PTU 和 PTU 托管的部署。计算为用户发送提示后显示第一个响应所花费的时间，由 API 网关测量。此数字随着提示大小增加和/或缓存命中大小减小而增加。若要细分响应指标的时间，可以添加筛选器或按以下维度应用拆分：ModelDeploymentName、ModelName 和 ModelVersion。注意：此指标是一个近似值，因为测量的延迟在很大程度上取决于多个因素，包括并发调用和整体工作负载模式。此外，它不考虑客户端和 API 终结点之间可能存在的任何客户端延迟。有关最佳延迟跟踪，请参阅自己的日志记录。	`AzureOpenAITimeToResponse`	毫秒	最小值、最大值、平均值	`ApiName`, `OperationName`, `Region`, `StreamType`, `ModelDeploymentName`, `ModelName`, `ModelVersion`, `StatusCode`	PT1M	是
槽	基线估算器整体奖励基线估算器总奖励。	`BaselineEstimatorOverallReward`	计数	平均值	`Mode`, `RunId`	PT1M	是
槽	基线估算器槽奖励按槽列出的基线估算器奖励。	`BaselineEstimatorSlotReward`	计数	平均值	`SlotId`, `SlotIndex`, `Mode`, `RunId`	PT1M	是
槽	基线随机估算器总奖励基线随机估算器总奖励。	`BaselineRandomEstimatorOverallReward`	计数	平均值	`Mode`, `RunId`	PT1M	是
槽	基线随机估算器槽奖励按槽列出的基线随机估算器奖励。	`BaselineRandomEstimatorSlotReward`	计数	平均值	`SlotId`, `SlotIndex`, `Mode`, `RunId`	PT1M	是
估计	基线随机事件计数基线随机事件计数的估算值。	`BaselineRandomEventCount`	计数	总计	`Mode`, `RunId`	PT1M	是
估计	基线随机奖励基线随机奖励的估算值。	`BaselineRandomReward`	计数	总计	`Mode`, `RunId`	PT1M	是
认知服务 - HTTP 请求	阻止的调用数超过速率或配额限制的调用数。请勿将用于 Azure OpenAI 服务。	`BlockedCalls`	计数	总计	`ApiName`, `OperationName`, `Region`, `RatelimitKey`	PT1M	是
使用情况	推理计数 Carnegie Frontdoor 服务的推理计数	`CarnegieInferenceCount`	计数	总计	`Region`, `Modality`, `Category`, `Language`, `SeverityLevel`, `UseCustomList`	PT1M	是
使用情况	训练的字符数(已弃用) 训练的字符总数。	`CharactersTrained`	计数	总计	`ApiName`, `OperationName`, `Region`	PT1M	是
使用情况	转换的字符数(已弃用) 传入的文本请求中的字符总数。	`CharactersTranslated`	计数	总计	`ApiName`, `OperationName`, `Region`	PT1M	是
认知服务 - HTTP 请求	客户端错误数引发客户端错误（HTTP 响应代码 4xx）的调用数。请勿将用于 Azure OpenAI 服务。	`ClientErrors`	计数	总计	`ApiName`, `OperationName`, `Region`, `RatelimitKey`	PT1M	是
使用情况	计算机视觉事务计算机视觉事务数	`ComputerVisionTransactions`	计数	总计	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	是
ContentSafety - 用法	用于图像审查的调用计数用于图像审查的调用数。	`ContentSafetyImageAnalyzeRequestCount`	计数	总计	`ApiVersion`	PT1M	是
ContentSafety - 用法	用于文本审查的调用计数用于文本审查的调用数。	`ContentSafetyTextAnalyzeRequestCount`	计数	总计	`ApiVersion`	PT1M	是
功能出现	上下文特征出现次数每个上下文特征的出现次数。	`ContextFeatureIdOccurrences`	计数	总计	`FeatureId`, `Mode`, `RunId`	PT1M	是
每个事件的功能数	每个事件的上下文特征数每个事件的上下文特征数量。	`ContextFeaturesPerEvent`	计数	平均值	`Mode`, `RunId`	PT1M	是
每个事件的命名空间数	每个事件的上下文命名空间数每个事件的上下文命名空间数量。	`ContextNamespacesPerEvent`	计数	平均值	`Mode`, `RunId`	PT1M	是
使用情况	自定义视觉训练时间自定义视觉训练时间	`CustomVisionTrainingTime`	秒	总计	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	是
使用情况	自定义视觉事务自定义视觉预测事务数	`CustomVisionTransactions`	计数	总计	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	是
认知服务 - HTTP 请求	数据输入传入数据的大小（字节）。请勿将用于 Azure OpenAI 服务。	`DataIn`	字节	总计	`ApiName`, `OperationName`, `Region`	PT1M	是
认知服务 - HTTP 请求	数据输出传出数据的大小（字节）。请勿将用于 Azure OpenAI 服务。	`DataOut`	字节	总计	`ApiName`, `OperationName`, `Region`	PT1M	是
使用情况	转换的文档字符数文档翻译请求中的字符数。	`DocumentCharactersTranslated`	计数	总计	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	是
使用情况	转换的文档自定义字符数自定义文档翻译请求中的字符数。	`DocumentCustomCharactersTranslated`	计数	总计	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	是
使用情况	训练的人脸图像训练的图像数。每个事务训练 1,000 个图像。	`FaceImagesTrained`	计数	总计	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	是
使用情况	存储的人脸存储的人脸数，每日按比例计算。每日报告存储的人脸数。	`FacesStored`	计数	总计	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	是
使用情况	人脸事务对人脸服务进行 API 调用的数量	`FaceTransactions`	计数	总计	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	是
FeatureCardinality	按操作列出的特征基数基于操作的特征基数。	`FeatureCardinality_Action`	计数	平均值	`FeatureId`, `Mode`, `RunId`	PT1M	是
FeatureCardinality	按上下文列出的特征基数基于上下文的特征基数。	`FeatureCardinality_Context`	计数	平均值	`FeatureId`, `Mode`, `RunId`	PT1M	是
FeatureCardinality	按槽列出的特征基数基于槽的特征基数。	`FeatureCardinality_Slot`	计数	平均值	`FeatureId`, `Mode`, `RunId`	PT1M	是
Azure OpenAI - 用法	已处理的 FineTuned 训练小时数在 OpenAI FineTuned 模型中处理的训练小时数	`FineTunedTrainingHours`	计数	总计	`ApiName`, `ModelDeploymentName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	是
Azure OpenAI - 用法	生成的完成令牌从 OpenAI 模型 (输出) 生成的令牌数。适用于 PTU、PTU-Managed 和即用即付部署。若要细分此指标，可以添加筛选器或按以下维度应用拆分：ModelDeploymentName 和 ModelName。	`GeneratedTokens`	计数	总计	`ApiName`, `ModelDeploymentName`, `FeatureName`, `UsageChannel`, `Region`, `ModelVersion`	PT1M	是
使用情况	存储的图像存储的自定义视觉图像数。	`ImagesStored`	计数	总计	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	是
认知服务 - HTTP 请求	延迟延迟（毫秒）。请勿将用于 Azure OpenAI 服务。	`Latency`	毫秒	平均值	`ApiName`, `OperationName`, `Region`, `RatelimitKey`	PT1M	是
使用情况	已了解的事件数已了解的事件数。	`LearnedEvents`	计数	总计	`IsMatchBaseline`, `Mode`, `RunId`	PT1M	是
使用情况	LUIS 语音请求 LUIS 语音转意向理解请求数	`LUISSpeechRequests`	计数	总计	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	是
使用情况	LUIS 文本请求 LUIS 文本请求数	`LUISTextRequests`	计数	总计	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	是
使用情况	匹配的奖励数匹配的奖励数。	`MatchedRewards`	计数	总计	`Mode`, `RunId`	PT1M	是
使用情况	未激活的事件数跳过的事件数量。	`NonActivatedEvents`	计数	总计	`Mode`, `RunId`	PT1M	是
槽	槽每个事件的槽数。	`NumberOfSlots`	计数	平均值	`Mode`, `RunId`	PT1M	是
SpeechServices - 用法	说话人配置文件数注册的说话人配置文件数。每小时按比例计算。	`NumberofSpeakerProfiles`	计数	总计	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	是
使用情况	观察到的奖励数观察到的奖励数。	`ObservedRewards`	计数	总计	`Mode`, `RunId`	PT1M	是
使用情况	已翻译的文档同步字符同步) 请求 (文档翻译中的字符数。	`OneDocumentCharactersTranslated`	计数	总计	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	是
槽	联机估算器总奖励联机估算器总奖励。	`OnlineEstimatorOverallReward`	计数	平均值	`Mode`, `RunId`	PT1M	是
槽	联机估算器槽奖励按槽列出的联机估算器奖励。	`OnlineEstimatorSlotReward`	计数	平均值	`SlotId`, `SlotIndex`, `Mode`, `RunId`	PT1M	是
估计	联机事件计数联机事件计数的估算值。	`OnlineEventCount`	计数	总计	`Mode`, `RunId`	PT1M	是
估计	联机奖励联机奖励的估算值。	`OnlineReward`	计数	总计	`Mode`, `RunId`	PT1M	是
使用情况	已处理的字符数沉浸式阅读器处理的字符数。	`ProcessedCharacters`	计数	总计	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	是
使用情况	处理的运行状况文本记录处理的运行状况文本记录数	`ProcessedHealthTextRecords`	计数	总计	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	是
使用情况	已处理的图像处理的图像数	`ProcessedImages`	计数	总计	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	是
使用情况	处理的页面处理的页面数	`ProcessedPages`	计数	总计	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	是
Azure OpenAI - 用法	已处理的提示令牌在 OpenAI 模型上 (输入) 处理的提示标记数。适用于 PTU、PTU-Managed 和即用即付部署。若要细分此指标，可以添加筛选器或按以下维度应用拆分：ModelDeploymentName 和 ModelName。	`ProcessedPromptTokens`	计数	总计	`ApiName`, `ModelDeploymentName`, `FeatureName`, `UsageChannel`, `Region`, `ModelVersion`	PT1M	是
使用情况	已处理的文本记录数文本记录的计数。	`ProcessedTextRecords`	计数	总计	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	是
使用情况	QA 文本记录处理的文本记录数	`QuestionAnsweringTextRecords`	计数	总计	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	是
ContentSafety - 风险&安全	潜在滥用用户计数在一段时间内检测到的潜在滥用用户数。可以按以下维度添加筛选器或应用拆分：ModelDeploymentName。	`RAIAbusiveUsersCount`	计数	总计	`Region`, `ModelDeploymentName`	PT1M	是
ContentSafety - 风险&安全	检测到有害卷在一段时间内应用的内容筛选器) ，对 Azure OpenAI API 进行并检测为有害 (块模型和批注模式的调用数。可以添加筛选器或按以下维度应用拆分：ModelDeploymentName、ModelName 和 TextType。	`RAIHarmfulRequests`	计数	总计	`Region`, `ModelDeploymentName`, `ModelName`, `ModelVersion`, `ApiName`, `TextType`, `Category`, `Severity`	PT1M	是
ContentSafety - 风险&安全	阻止的卷在一段时间内对 Azure OpenAI API 进行并被应用的内容筛选器拒绝的调用数。可以添加筛选器或按以下维度应用拆分：ModelDeploymentName、ModelName 和 TextType。	`RAIRejectedRequests`	计数	总计	`Region`, `ModelDeploymentName`, `ModelName`, `ModelVersion`, `ApiName`, `TextType`, `Category`	PT1M	是
ContentSafety - 风险&安全	安全检查发送的总卷数对 Azure OpenAI API 进行并在一段时间内应用的内容筛选器检测到的调用数。可以添加筛选器或按以下维度应用拆分：ModelDeploymentName、ModelName。	`RAITotalRequests`	计数	总计	`Region`, `ModelDeploymentName`, `ModelName`, `ModelVersion`, `ApiName`	PT1M	是
认知服务 - HTTP 请求	Ratelimit ratelimit 键的当前速率限制。请勿将用于 Azure OpenAI 服务。	`Ratelimit`	计数	总计	`Region`, `RatelimitKey`	PT1M	是
奖励	每个事件的平均奖励每个事件的平均奖励。	`Reward`	计数	平均值	`BaselineAction`, `ChosenActionId`, `MatchesBaseline`, `NonDefaultReward`, `Mode`, `RunId`	PT1M	是
认知服务 - HTTP 请求	服务器错误数引发服务内部错误（HTTP 响应代码 5xx）的调用数。请勿将用于 Azure OpenAI 服务。	`ServerErrors`	计数	总计	`ApiName`, `OperationName`, `Region`, `RatelimitKey`	PT1M	是
功能出现	槽特征出现次数每个槽特征的出现次数。	`SlotFeatureIdOccurrences`	计数	总计	`FeatureId`, `Mode`, `RunId`	PT1M	是
每个事件的功能数	每个事件的槽特征数每个事件的平均槽特征数量。	`SlotFeaturesPerEvent`	计数	平均值	`Mode`, `RunId`	PT1M	是
槽	槽出现次数每个槽的出现次数。	`SlotIdOccurrences`	计数	总计	`SlotId`, `SlotIndex`, `Mode`, `RunId`	PT1M	是
每个事件的命名空间数	每个事件的槽命名空间数每个事件的平均槽命名空间数量。	`SlotNamespacesPerEvent`	计数	平均值	`Mode`, `RunId`	PT1M	是
奖励	槽奖励每个槽的奖励。	`SlotReward`	计数	平均值	`BaselineActionId`, `ChosenActionId`, `MatchesBaseline`, `NonDefaultReward`, `SlotId`, `SlotIndex`, `Mode`, `RunId`	PT1M	是
SpeechServices - 用法	说话人辨识事务说话人辨识事务数	`SpeakerRecognitionTransactions`	计数	总计	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	是
SpeechServices - 用法	语音模型托管时间语音模型托管时间数	`SpeechModelHostingHours`	计数	总计	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	是
使用情况	语音会话持续时间(已弃用) 语音会话的总持续时间（以秒计）。	`SpeechSessionDuration`	秒	总计	`ApiName`, `OperationName`, `Region`	PT1M	是
认知服务 - HTTP 请求	成功调用数成功调用数。请勿将用于 Azure OpenAI 服务。	`SuccessfulCalls`	计数	总计	`ApiName`, `OperationName`, `Region`, `RatelimitKey`	PT1M	是
认知服务 - SLI	AvailabilityRate 使用以下公式计算可用性百分比：(调用总数 - 服务器错误数)/调用总数。服务器错误包括任何 >=500 的 HTTP 响应。请勿将用于 Azure OpenAI 服务。	`SuccessRate`	百分比	最小值、最大值、平均值	`ApiName`, `OperationName`, `Region`, `RatelimitKey`	PT1M	否
SpeechServices - 用法	Synthesized Characters 字符数。	`SynthesizedCharacters`	计数	总计	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	是
使用情况	转换的文本字符数传入的文本翻译请求中的字符数。	`TextCharactersTranslated`	计数	总计	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	是
使用情况	转换的文本自定义字符数传入的自定义文本翻译请求中的字符数。	`TextCustomCharactersTranslated`	计数	总计	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	是
使用情况	训练的文本字符数使用文本翻译训练的字符数。	`TextTrainedCharacters`	计数	总计	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	是
Azure OpenAI - 用法	已处理的推理令牌在 OpenAI 模型上处理的推理令牌数。计算为输入) (提示标记以及输出) (生成的令牌。适用于 PTU、PTU-Managed 和即用即付部署。若要细分此指标，可以添加筛选器或按以下维度应用拆分：ModelDeploymentName 和 ModelName。	`TokenTransaction`	计数	总计	`ApiName`, `ModelDeploymentName`, `FeatureName`, `UsageChannel`, `Region`, `ModelVersion`	PT1M	是
认知服务 - HTTP 请求	总调用数调用总数。请勿将用于 Azure OpenAI 服务。	`TotalCalls`	计数	总计	`ApiName`, `OperationName`, `Region`, `RatelimitKey`	PT1M	是
认知服务 - HTTP 请求	错误总数引发错误响应（HTTP 响应代码 4xx 或 5xx）的调用总数。请勿将用于 Azure OpenAI 服务。	`TotalErrors`	计数	总计	`ApiName`, `OperationName`, `Region`, `RatelimitKey`	PT1M	是
使用情况	Total Events 事件数量。	`TotalEvents`	计数	总计	`Mode`, `RunId`	PT1M	是
认知服务 - HTTP 请求	令牌调用总数令牌调用的总数。	`TotalTokenCalls`	计数	总计	`ApiName`, `OperationName`, `Region`	PT1M	是
使用情况	总事务(已弃用) 事务总数。	`TotalTransactions`	计数	总计	<无>	PT1M	是
估计	用户基线事件计数用户定义的基线事件计数的估算值。	`UserBaselineEventCount`	计数	总计	`Mode`, `RunId`	PT1M	是
估计	用户基线奖励用户定义的基线奖励的估算值。	`UserBaselineReward`	计数	总计	`Mode`, `RunId`	PT1M	是
SpeechServices - 用法	语音模型托管小时小时数。	`VoiceModelHostingHours`	计数	总计	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	是
SpeechServices - 用法	语音模型训练分钟分钟数。	`VoiceModelTrainingMinutes`	计数	总计	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	是

Microsoft.CognitiveServices/accounts 支持的指标

反馈

反馈

其他资源