你当前正在访问 Microsoft Azure Global Edition 技术文档网站。如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站，请访问 https://docs.azure.cn。

Text Independent - Identify Single Speaker

参考

Service:: Speaker Recognition

API Version:: 2021-09-05

识别单个说话人配置文件
在候选人配置文件列表中标识在输入音频中讲话的人。

的限制：

最小音频输入长度为 1 秒
最大音频输入长度为 120 秒
最小候选演讲者计数为 1
最大候选演讲者计数为 50
最小有效语音长度 (不包括静音和其他非语音帧) 为 4 秒 ，可以通过将“ignoreMinLength”设置为 true 来禁用此限制。
信噪比 (信噪比) 为 2dB

POST {endpoint}/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds={profileIds}

With optional parameters:

POST {endpoint}/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds={profileIds}&ignoreMinLength={ignoreMinLength}

URI 参数

名称	在	必需	类型	说明
endpoint	path	True	string	支持的认知服务终结点 (协议和主机名，例如： https://westus.api.cognitive.microsoft.com) 。
api-version	query	True	string	指定用于此请求的操作的版本。
profileIds	query	True	string[]	逗号分隔的配置文件 ID。支持的最大数目为 50 个 ID。
ignoreMinLength	query		boolean	如果为 true，则跳过识别所需的最小语音量。默认值为 false。

请求头

Media Types: "audio/wav; codecs=audio/pcm"

名称	必需	类型	说明
Ocp-Apim-Subscription-Key	True	string

请求正文

Media Types: "audio/wav; codecs=audio/pcm"

名称	类型	说明
audioData	object	二进制音频文件。支持的格式为音频/wav;codecs=audio/pcm。支持高达 5MB 的音频。

响应

名称	类型	说明
200 OK	IdentifiedSingleSpeakerInfo	确定
Other Status Codes	SpeakerErrorInfo	失败 Headers x-ms-error-code: string

名称

类型

说明

200 OK

IdentifiedSingleSpeakerInfo

确定

Other Status Codes

SpeakerErrorInfo

失败

Headers

x-ms-error-code: string

安全性

Ocp-Apim-Subscription-Key

Type: apiKey
In: header

示例

Successful Query

Sample Request

HTTP

POST https://westus.api.cognitive.microsoft.com/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds=3669fa29-1bf3-45ad-beea-6b348d058d7e,111f427c-3791-468f-b709-fcef7660fff9,0e196cd9-32d5-4883-8631-54a0e7c7cb3d,0e196cd9-32d5-4883-8631-54a0e7c7cb3d,726e57d9-04e0-4214-b482-7f786fa83560,f95189fd-1bf5-4485-9c2e-e5897e0c98ca


"{binary file date}"

Sample Response

Status code:: 200

Content-Type: application/json

Response Body

{
  "identifiedProfile": {
    "profileId": "111f427c-3791-468f-b709-fcef7660fff9",
    "score": 0.63
  },
  "profilesRanking": [
    {
      "profileId": "111f427c-3791-468f-b709-fcef7660fff9",
      "score": 0.63
    },
    {
      "profileId": "3669fa29-1bf3-45ad-beea-6b348d058d7e",
      "score": 0.49
    },
    {
      "profileId": "0e196cd9-32d5-4883-8631-54a0e7c7cb3d",
      "score": 0.4
    },
    {
      "profileId": "726e57d9-04e0-4214-b482-7f786fa83560",
      "score": 0.1
    },
    {
      "profileId": "f95189fd-1bf5-4485-9c2e-e5897e0c98ca",
      "score": 0.03
    }
  ]
}

Status code:: default

Content-Type: application/json
x-ms-error-code: Error Code

Response Body

{
  "error": {
    "code": "Error Code",
    "message": "Erro Messae"
  }
}

定义

名称	说明
Error
IdentifiedSingleSpeakerInfo
IdentifyInfo	识别的说话人信息
SpeakerErrorInfo	扬声器错误消息

Error

名称	类型	说明
code	string
message	string

IdentifiedSingleSpeakerInfo

名称	类型	说明
identifiedProfile	IdentifyInfo	包含已标识配置文件数据的对象。
profilesRanking	IdentifyInfo[]	包含前 5 个配置文件的数据的对象 (包括标识的配置文件) 按分数降序排序。

IdentifyInfo

识别的说话人信息

名称	类型	说明
profileId	string	标识的配置文件的 ID。如果未将候选项标识为正确的说话人，则该值设置为空 GUID。
score	number	一个浮点数，指示输入音频与目标语音打印之间的相似性。此数字必须介于 0 和 1 之间。数字越大，相似性越高。

SpeakerErrorInfo

扬声器错误消息

名称	类型	说明
error	Error

Text Independent - Identify Single Speaker

URI 参数

请求头

请求正文

响应

安全性

Ocp-Apim-Subscription-Key

示例

Successful Query

Sample Request

Sample Response

定义

Error

IdentifiedSingleSpeakerInfo

IdentifyInfo

SpeakerErrorInfo

其他资源