你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Text Dependent - Create Enrollment

注册配置文件
向现有配置文件添加注册。 如果达到请求的注册音频的最小数量,则会创建语音打印。 如果之前创建了语音打印,则会从所有现有注册音频(包括新注册音频)重新创建语音打印。

的限制:

  • 每个请求的最小音频输入长度为 1 秒
  • 每个请求的最大音频输入长度为 10 秒
  • 用于创建声纹的最小注册数为 3
  • 创建声纹的最大注册数为 50
  • 最小音频信噪比 (SNR) 为 2dB

约束:

  • 第一个注册必须与现有通行短语匹配。
  • 第一个注册之后的所有注册都必须使用第一个注册中使用的相同通行短语。
POST {endpoint}/speaker-recognition/verification/text-dependent/profiles/{profileId}/enrollments?api-version=2021-09-05

URI 参数

名称 必需 类型 说明
endpoint
path True

string

支持的认知服务终结点 (协议和主机名,例如: https://westus.api.cognitive.microsoft.com) 。

profileId
path True

string

uuid

配置文件 ID (guid) 的唯一标识符。

api-version
query True

string

指定用于此请求的操作的版本。

请求头

Media Types: "audio/wav; codecs=audio/pcm"

名称 必需 类型 说明
Ocp-Apim-Subscription-Key True

string

请求正文

Media Types: "audio/wav; codecs=audio/pcm"

名称 类型 说明
audioData

object

二进制音频文件。 支持的格式为 audio/wav;codecs=audio/pcm。 支持最大 5MB 的音频。

响应

名称 类型 说明
201 Created

TdEnrollmentInfo

创建

Other Status Codes

SpeakerErrorInfo

失败

Headers

x-ms-error-code: string

安全性

Ocp-Apim-Subscription-Key

Type: apiKey
In: header

示例

Successful Query

Sample Request

POST https://westus.api.cognitive.microsoft.com/speaker-recognition/verification/text-dependent/profiles/49a36324-fc4b-4387-aa06-090cfbf0064f/enrollments?api-version=2021-09-05


"{binary file date}"

Sample Response

Content-Type: application/json
{
  "profileId": "49a36324-fc4b-4387-aa06-090cfbf0064f",
  "enrollmentStatus": "Enrolling",
  "enrollmentsCount": 1,
  "enrollmentsLengthInSec": 1.83,
  "enrollmentsSpeechLengthInSec": 1.35,
  "remainingEnrollmentsCount": 2,
  "passPhrase": "my voice is my passport verify me",
  "audioLengthInSec": 1.83,
  "audioSpeechLengthInSec": 1.35
}
Content-Type: application/json
x-ms-error-code: Error Code
{
  "error": {
    "code": "Error Code",
    "message": "Erro Messae"
  }
}

定义

名称 说明
Error
SpeakerErrorInfo

扬声器错误消息

TdEnrollmentInfo

Text-Dependent 演讲者个人资料注册信息

TrainingStatusType

表示配置文件的当前状态的状态。 可用值为:

  • 正在注册:配置文件没有语音打印,也没有准备好进行识别请求。
  • 培训:正在创建配置文件的语音打印,目前无法用于识别。
  • 已注册:配置文件具有语音打印,并已准备好接受识别请求。

Error

名称 类型 说明
code

string

message

string

SpeakerErrorInfo

扬声器错误消息

名称 类型 说明
error

Error

TdEnrollmentInfo

Text-Dependent 演讲者个人资料注册信息

名称 类型 说明
audioLengthInSec

number

此注册音频长度(以秒为单位)。

audioSpeechLengthInSec

number

此注册音频纯语音 (这是删除静音和非语音段后音频的数量,) 长度(以秒为单位)。

enrollmentStatus

TrainingStatusType

表示配置文件的当前状态的状态。 可用值为:

  • 正在注册:配置文件没有语音打印,也没有准备好进行识别请求。
  • 培训:正在创建配置文件的语音打印,目前无法用于识别。
  • 已注册:配置文件具有语音打印,并已准备好接受识别请求。
enrollmentsCount

integer

此配置文件接受的注册音频数。

enrollmentsLengthInSec

number

此配置文件接受的注册音频的总长度(以秒为单位)。

enrollmentsSpeechLengthInSec

number

纯语音 (,即删除所有配置文件注册的静音和非语音段后) 的音频量(以秒为单位)。

passPhrase

string

与此注册关联的通行短语。

profileId

string

配置文件 ID (guid) 的唯一标识符。

remainingEnrollmentsCount

integer

完成配置文件注册所需的注册音频数。

TrainingStatusType

表示配置文件的当前状态的状态。 可用值为:

  • 正在注册:配置文件没有语音打印,也没有准备好进行识别请求。
  • 培训:正在创建配置文件的语音打印,目前无法用于识别。
  • 已注册:配置文件具有语音打印,并已准备好接受识别请求。
名称 类型 说明
Enrolled

string

Enrolling

string

Training

string