你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
Text Independent - Identify Single Speaker
识别单个说话人配置文件
在候选人配置文件列表中标识在输入音频中讲话的人。
的限制:
最小音频输入长度为 1 秒
最大音频输入长度为 120 秒
最小候选演讲者计数为 1
最大候选演讲者计数为 50
最小有效语音长度 (不包括静音和其他非语音帧) 为 4 秒 ,可以通过将“ignoreMinLength”设置为 true 来禁用此限制。
信噪比 (信噪比) 为 2dB
POST {endpoint}/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds={profileIds}
POST {endpoint}/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds={profileIds}&ignoreMinLength={ignoreMinLength}
URI 参数
名称 | 在 | 必需 | 类型 | 说明 |
---|---|---|---|---|
endpoint
|
path | True |
string |
支持的认知服务终结点 (协议和主机名,例如: https://westus.api.cognitive.microsoft.com) 。 |
api-version
|
query | True |
string |
指定用于此请求的操作的版本。 |
profile
|
query | True |
string[] |
逗号分隔的配置文件 ID。 支持的最大数目为 50 个 ID。 |
ignore
|
query |
boolean |
如果为 true,则跳过识别所需的最小语音量。 默认值为 false。 |
请求头
Media Types: "audio/wav; codecs=audio/pcm"
名称 | 必需 | 类型 | 说明 |
---|---|---|---|
Ocp-Apim-Subscription-Key | True |
string |
请求正文
Media Types: "audio/wav; codecs=audio/pcm"
名称 | 类型 | 说明 |
---|---|---|
audioData |
object |
二进制音频文件。 支持的格式为音频/wav;codecs=audio/pcm。 支持高达 5MB 的音频。 |
响应
名称 | 类型 | 说明 |
---|---|---|
200 OK |
确定 |
|
Other Status Codes |
失败 Headers x-ms-error-code: string |
安全性
Ocp-Apim-Subscription-Key
Type:
apiKey
In:
header
示例
Successful Query
Sample Request
POST https://westus.api.cognitive.microsoft.com/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds=3669fa29-1bf3-45ad-beea-6b348d058d7e,111f427c-3791-468f-b709-fcef7660fff9,0e196cd9-32d5-4883-8631-54a0e7c7cb3d,0e196cd9-32d5-4883-8631-54a0e7c7cb3d,726e57d9-04e0-4214-b482-7f786fa83560,f95189fd-1bf5-4485-9c2e-e5897e0c98ca
"{binary file date}"
Sample Response
Content-Type: application/json
{
"identifiedProfile": {
"profileId": "111f427c-3791-468f-b709-fcef7660fff9",
"score": 0.63
},
"profilesRanking": [
{
"profileId": "111f427c-3791-468f-b709-fcef7660fff9",
"score": 0.63
},
{
"profileId": "3669fa29-1bf3-45ad-beea-6b348d058d7e",
"score": 0.49
},
{
"profileId": "0e196cd9-32d5-4883-8631-54a0e7c7cb3d",
"score": 0.4
},
{
"profileId": "726e57d9-04e0-4214-b482-7f786fa83560",
"score": 0.1
},
{
"profileId": "f95189fd-1bf5-4485-9c2e-e5897e0c98ca",
"score": 0.03
}
]
}
Content-Type: application/json
x-ms-error-code: Error Code
{
"error": {
"code": "Error Code",
"message": "Erro Messae"
}
}
定义
名称 | 说明 |
---|---|
Error | |
Identified |
|
Identify |
识别的说话人信息 |
Speaker |
扬声器错误消息 |
Error
名称 | 类型 | 说明 |
---|---|---|
code |
string |
|
message |
string |
IdentifiedSingleSpeakerInfo
名称 | 类型 | 说明 |
---|---|---|
identifiedProfile |
包含已标识配置文件数据的对象。 |
|
profilesRanking |
包含前 5 个配置文件的数据的对象 (包括标识的配置文件) 按分数降序排序。 |
IdentifyInfo
识别的说话人信息
名称 | 类型 | 说明 |
---|---|---|
profileId |
string |
标识的配置文件的 ID。 如果未将候选项标识为正确的说话人,则该值设置为空 GUID。 |
score |
number |
一个浮点数,指示输入音频与目标语音打印之间的相似性。 此数字必须介于 0 和 1 之间。 数字越大,相似性越高。 |
SpeakerErrorInfo
扬声器错误消息
名称 | 类型 | 说明 |
---|---|---|
error |