你当前正在访问 Microsoft Azure Global Edition 技术文档网站。如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站，请访问 https://docs.azure.cn。

Text Independent - Create Enrollment

参考

Service:: Speaker Recognition

API Version:: 2021-09-05

注册配置文件
向现有配置文件添加注册。第一个注册必须是可以使用 /phrases/{locale} API 列出的预定义激活短语。如果达到请求的注册音频的最小数量，则会创建语音打印。进一步注册将用于改进语音打印。

的限制：

每个请求的最小音频输入长度为 1 秒
每个请求的最大音频输入长度为 120 秒
最小有效语音长度 (不包括静音和其他非语音帧，) 创建声纹为 20 秒 此限制，可以通过将 ignoreMinLength 设置为 true 来禁用。
创建声纹时允许的最大音频输入长度为 300 秒
最小音频信噪比 (SNR) 为 2dB

POST {endpoint}/speaker-recognition/identification/text-independent/profiles/{profileId}/enrollments?api-version=2021-09-05

With optional parameters:

POST {endpoint}/speaker-recognition/identification/text-independent/profiles/{profileId}/enrollments?api-version=2021-09-05&ignoreMinLength={ignoreMinLength}

URI 参数

名称	在	必需	类型	说明
endpoint	path	True	string	支持的认知服务终结点 (协议和主机名，例如： https://westus.api.cognitive.microsoft.com) 。
profileId	path	True	string uuid	配置文件 ID (guid) 的唯一标识符。
api-version	query	True	string	指定用于此请求的操作的版本。
ignoreMinLength	query		boolean	如果为 true，将立即为此配置文件创建语音打印，而不考虑提供或存储了多少语音。默认值为 false。

请求头

Media Types: "audio/wav; codecs=audio/pcm"

名称	必需	类型	说明
Ocp-Apim-Subscription-Key	True	string

请求正文

Media Types: "audio/wav; codecs=audio/pcm"

名称	类型	说明
audioData	object	二进制音频文件。支持的格式为 audio/wav;codecs=audio/pcm。支持最大 5MB 的音频。

响应

名称	类型	说明
201 Created	TiEnrollmentInfo	创建
Other Status Codes	SpeakerErrorInfo	失败 Headers x-ms-error-code: string

名称

类型

说明

201 Created

TiEnrollmentInfo

创建

Other Status Codes

SpeakerErrorInfo

失败

Headers

x-ms-error-code: string

安全性

Ocp-Apim-Subscription-Key

Type: apiKey
In: header

示例

Successful Query

Sample Request

HTTP

POST https://westus.api.cognitive.microsoft.com/speaker-recognition/identification/text-independent/profiles/49a36324-fc4b-4387-aa06-090cfbf0064f/enrollments?api-version=2021-09-05


"{binary file date}"

Sample Response

Status code:: 201

Content-Type: application/json

Response Body

{
  "profileId": "49a36324-fc4b-4387-aa06-090cfbf0064f",
  "enrollmentStatus": "Enrolling",
  "enrollmentsCount": 1,
  "enrollmentsLengthInSec": 1.83,
  "enrollmentsSpeechLengthInSec": 1.35,
  "remainingEnrollmentsSpeechLengthInSec": 18.65,
  "audioLengthInSec": 1.83,
  "audioSpeechLengthInSec": 1.35
}

Status code:: default

Content-Type: application/json
x-ms-error-code: Error Code

Response Body

{
  "error": {
    "code": "Error Code",
    "message": "Erro Messae"
  }
}

定义

名称	说明
Error
SpeakerErrorInfo	扬声器错误消息
TiEnrollmentInfo	演讲者个人资料注册信息
TrainingStatusType	表示配置文件注册的当前状态的状态。可用值为：正在注册：配置文件没有语音打印，也没有准备好进行识别请求。培训：正在创建配置文件的语音打印，目前无法用于识别。已注册：配置文件具有语音打印，并已准备好接受识别请求。

Error

名称	类型	说明
code	string
message	string

SpeakerErrorInfo

扬声器错误消息

名称	类型	说明
error	Error

TiEnrollmentInfo

演讲者个人资料注册信息

名称	类型	说明
audioLengthInSec	number	此注册音频长度（以秒为单位）。
audioSpeechLengthInSec	number	此注册音频纯语音 (这是删除静音和非语音段后音频的数量，) 长度（以秒为单位）。
enrollmentStatus	TrainingStatusType	表示配置文件注册的当前状态的状态。可用值为：正在注册：配置文件没有语音打印，也没有准备好进行识别请求。培训：正在创建配置文件的语音打印，目前无法用于识别。已注册：配置文件具有语音打印，并已准备好接受识别请求。
enrollmentsCount	integer	此配置文件接受的注册音频数。
enrollmentsLengthInSec	number	此配置文件接受的注册音频的总长度（以秒为单位）。
enrollmentsSpeechLengthInSec	number	纯语音 (，即删除所有配置文件注册的静音和非语音段后) 的音频量（以秒为单位）。
profileId	string	配置文件 ID (guid) 的唯一标识符。
remainingEnrollmentsSpeechLengthInSec	number	纯语音 (量，即删除静音和非语音段后) 在几秒钟内完成配置文件注册所需的音频量。

TrainingStatusType

表示配置文件注册的当前状态的状态。可用值为：

正在注册：配置文件没有语音打印，也没有准备好进行识别请求。
培训：正在创建配置文件的语音打印，目前无法用于识别。
已注册：配置文件具有语音打印，并已准备好接受识别请求。

名称	类型	说明
Enrolled	string
Enrolling	string
Training	string

Text Independent - Create Enrollment

URI 参数

请求头

请求正文

响应

安全性

Ocp-Apim-Subscription-Key

示例

Successful Query

Sample Request

Sample Response

定义

Error

SpeakerErrorInfo

TiEnrollmentInfo

TrainingStatusType

其他资源