你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
Text Independent - Create Enrollment
注册配置文件
向现有配置文件添加注册。
第一个注册必须是可以使用 /phrases/{locale} API 列出的预定义激活短语。
如果达到请求的注册音频的最小数量,则会创建语音打印。
进一步注册将用于改进语音打印。
的限制:
每个请求的最小音频输入长度为 1 秒
每个请求的最大音频输入长度为 120 秒
最小有效语音长度 (不包括静音和其他非语音帧,) 创建声纹为 20 秒 此限制,可以通过将 ignoreMinLength 设置为 true 来禁用。
创建声纹时允许的最大音频输入长度为 300 秒
最小音频信噪比 (SNR) 为 2dB
POST {endpoint}/speaker-recognition/identification/text-independent/profiles/{profileId}/enrollments?api-version=2021-09-05
POST {endpoint}/speaker-recognition/identification/text-independent/profiles/{profileId}/enrollments?api-version=2021-09-05&ignoreMinLength={ignoreMinLength}
URI 参数
名称 | 在 | 必需 | 类型 | 说明 |
---|---|---|---|---|
endpoint
|
path | True |
string |
支持的认知服务终结点 (协议和主机名,例如: https://westus.api.cognitive.microsoft.com) 。 |
profile
|
path | True |
string uuid |
配置文件 ID (guid) 的唯一标识符。 |
api-version
|
query | True |
string |
指定用于此请求的操作的版本。 |
ignore
|
query |
boolean |
如果为 true,将立即为此配置文件创建语音打印,而不考虑提供或存储了多少语音。 默认值为 false。 |
请求头
Media Types: "audio/wav; codecs=audio/pcm"
名称 | 必需 | 类型 | 说明 |
---|---|---|---|
Ocp-Apim-Subscription-Key | True |
string |
请求正文
Media Types: "audio/wav; codecs=audio/pcm"
名称 | 类型 | 说明 |
---|---|---|
audioData |
object |
二进制音频文件。 支持的格式为 audio/wav;codecs=audio/pcm。 支持最大 5MB 的音频。 |
响应
名称 | 类型 | 说明 |
---|---|---|
201 Created |
创建 |
|
Other Status Codes |
失败 Headers x-ms-error-code: string |
安全性
Ocp-Apim-Subscription-Key
Type:
apiKey
In:
header
示例
Successful Query
Sample Request
POST https://westus.api.cognitive.microsoft.com/speaker-recognition/identification/text-independent/profiles/49a36324-fc4b-4387-aa06-090cfbf0064f/enrollments?api-version=2021-09-05
"{binary file date}"
Sample Response
Content-Type: application/json
{
"profileId": "49a36324-fc4b-4387-aa06-090cfbf0064f",
"enrollmentStatus": "Enrolling",
"enrollmentsCount": 1,
"enrollmentsLengthInSec": 1.83,
"enrollmentsSpeechLengthInSec": 1.35,
"remainingEnrollmentsSpeechLengthInSec": 18.65,
"audioLengthInSec": 1.83,
"audioSpeechLengthInSec": 1.35
}
Content-Type: application/json
x-ms-error-code: Error Code
{
"error": {
"code": "Error Code",
"message": "Erro Messae"
}
}
定义
名称 | 说明 |
---|---|
Error | |
Speaker |
扬声器错误消息 |
Ti |
演讲者个人资料注册信息 |
Training |
表示配置文件注册的当前状态的状态。 可用值为:
|
Error
名称 | 类型 | 说明 |
---|---|---|
code |
string |
|
message |
string |
SpeakerErrorInfo
扬声器错误消息
名称 | 类型 | 说明 |
---|---|---|
error |
TiEnrollmentInfo
演讲者个人资料注册信息
名称 | 类型 | 说明 |
---|---|---|
audioLengthInSec |
number |
此注册音频长度(以秒为单位)。 |
audioSpeechLengthInSec |
number |
此注册音频纯语音 (这是删除静音和非语音段后音频的数量,) 长度(以秒为单位)。 |
enrollmentStatus |
表示配置文件注册的当前状态的状态。 可用值为:
|
|
enrollmentsCount |
integer |
此配置文件接受的注册音频数。 |
enrollmentsLengthInSec |
number |
此配置文件接受的注册音频的总长度(以秒为单位)。 |
enrollmentsSpeechLengthInSec |
number |
纯语音 (,即删除所有配置文件注册的静音和非语音段后) 的音频量(以秒为单位)。 |
profileId |
string |
配置文件 ID (guid) 的唯一标识符。 |
remainingEnrollmentsSpeechLengthInSec |
number |
纯语音 (量,即删除静音和非语音段后) 在几秒钟内完成配置文件注册所需的音频量。 |
TrainingStatusType
表示配置文件注册的当前状态的状态。 可用值为:
- 正在注册:配置文件没有语音打印,也没有准备好进行识别请求。
- 培训:正在创建配置文件的语音打印,目前无法用于识别。
- 已注册:配置文件具有语音打印,并已准备好接受识别请求。
名称 | 类型 | 说明 |
---|---|---|
Enrolled |
string |
|
Enrolling |
string |
|
Training |
string |