Share via


Text Independent - Create Enrollment

프로필 등록
기존 프로필에 등록을 추가합니다. 첫 번째 등록은 /phrases/{locale} api를 사용하여 나열할 수 있는 미리 정의된 활성화 구여야 합니다. 요청된 등록 오디오의 최소 수에 도달하면 음성 인쇄가 만들어집니다. 추가 등록은 음성 인쇄를 개선하는 데 사용됩니다.

제한 사항:

  • 요청당 최소 오디오 입력 길이는 1초입니다.

  • 요청당 최대 오디오 입력 길이는 120초입니다.

  • 음성 인쇄를 만들기 위한 최소 유효 음성 길이(무음 및 기타 비 음성 프레임 제외)는 20초 입니다. ignoreMinLength를 true로 설정하여 이 제한을 사용하지 않도록 설정할 수 있습니다.

  • 음성 인쇄를 만드는 데 허용되는 최대 총 오디오 입력 길이는 300초입니다.

  • 최소 오디오 SNR(신호 대 노이즈 비율)은 2dB입니다.

POST {endpoint}/speaker-recognition/identification/text-independent/profiles/{profileId}/enrollments?api-version=2021-09-05
POST {endpoint}/speaker-recognition/identification/text-independent/profiles/{profileId}/enrollments?api-version=2021-09-05&ignoreMinLength={ignoreMinLength}

URI 매개 변수

Name In(다음 안에) 필수 형식 Description
endpoint
path True

string

지원되는 Cognitive Services 엔드포인트(프로토콜 및 호스트 이름( 예: https://westus.api.cognitive.microsoft.com).

profileId
path True

string

uuid

프로필 ID(guid)의 고유 식별자입니다.

api-version
query True

string

이 요청에 사용할 작업의 버전을 지정합니다.

ignoreMinLength
query

boolean

true이면 음성이 제공되거나 저장되는 양에 관계없이 이 프로필에 대한 음성 인쇄가 즉시 만들어집니다. 기본값은 false입니다.

요청 헤더

Media Types: "audio/wav; codecs=audio/pcm"

Name 필수 형식 Description
Ocp-Apim-Subscription-Key True

string

요청 본문

Media Types: "audio/wav; codecs=audio/pcm"

Name 형식 Description
audioData

object

이진 오디오 파일. 지원되는 형식은 오디오/물결선입니다. codecs=audio/pcm. 최대 5MB의 오디오를 지원합니다.

응답

Name 형식 Description
201 Created

TiEnrollmentInfo

생성일

Other Status Codes

SpeakerErrorInfo

실패

Headers

x-ms-error-code: string

보안

Ocp-Apim-Subscription-Key

Type: apiKey
In: header

예제

Successful Query

Sample Request

POST https://westus.api.cognitive.microsoft.com/speaker-recognition/identification/text-independent/profiles/49a36324-fc4b-4387-aa06-090cfbf0064f/enrollments?api-version=2021-09-05


"{binary file date}"

Sample Response

Content-Type: application/json
{
  "profileId": "49a36324-fc4b-4387-aa06-090cfbf0064f",
  "enrollmentStatus": "Enrolling",
  "enrollmentsCount": 1,
  "enrollmentsLengthInSec": 1.83,
  "enrollmentsSpeechLengthInSec": 1.35,
  "remainingEnrollmentsSpeechLengthInSec": 18.65,
  "audioLengthInSec": 1.83,
  "audioSpeechLengthInSec": 1.35
}
Content-Type: application/json
x-ms-error-code: Error Code
{
  "error": {
    "code": "Error Code",
    "message": "Erro Messae"
  }
}

정의

Name Description
Error
SpeakerErrorInfo

스피커 오류 메시지

TiEnrollmentInfo

화자 프로필 등록 정보

TrainingStatusType

프로필 등록의 현재 상태를 나타내는 상태입니다. 사용 가능한 값은 다음과 같습니다.

  • 등록: 프로필에 음성 인쇄가 없으며 인식 요청에 사용할 준비가 되지 않았습니다.
  • 교육: 프로필의 음성 인쇄가 생성되고 있으며 현재 인식에 사용할 수 없습니다.
  • 등록됨: 프로필에 음성 인쇄가 있고 인식 요청에 사용할 준비가 되었습니다.

Error

Name 형식 Description
code

string

message

string

SpeakerErrorInfo

스피커 오류 메시지

Name 형식 Description
error

Error

TiEnrollmentInfo

화자 프로필 등록 정보

Name 형식 Description
audioLengthInSec

number

이 등록 오디오 길이(초)입니다.

audioSpeechLengthInSec

number

이 등록 오디오 순수 음성(무음 및 비 음성 세그먼트를 제거한 후의 오디오 양) 길이(초)입니다.

enrollmentStatus

TrainingStatusType

프로필 등록의 현재 상태를 나타내는 상태입니다. 사용 가능한 값은 다음과 같습니다.

  • 등록: 프로필에 음성 인쇄가 없으며 인식 요청에 사용할 준비가 되지 않았습니다.
  • 교육: 프로필의 음성 인쇄가 생성되고 있으며 현재 인식에 사용할 수 없습니다.
  • 등록됨: 프로필에 음성 인쇄가 있고 인식 요청에 사용할 준비가 되었습니다.
enrollmentsCount

integer

이 프로필에 허용되는 등록 오디오 수입니다.

enrollmentsLengthInSec

number

이 프로필에 허용되는 등록 오디오의 총 길이(초)입니다.

enrollmentsSpeechLengthInSec

number

모든 프로필 등록에서 순수 음성(무음 및 비 음성 세그먼트를 제거한 후의 오디오 양)의 합계(초)입니다.

profileId

string

프로필 ID(guid)의 고유 식별자입니다.

remainingEnrollmentsSpeechLengthInSec

number

프로필 등록을 몇 초 만에 완료하는 데 필요한 순수 음성 양(무음 및 비 음성 세그먼트를 제거한 후의 오디오 양)입니다.

TrainingStatusType

프로필 등록의 현재 상태를 나타내는 상태입니다. 사용 가능한 값은 다음과 같습니다.

  • 등록: 프로필에 음성 인쇄가 없으며 인식 요청에 사용할 준비가 되지 않았습니다.
  • 교육: 프로필의 음성 인쇄가 생성되고 있으며 현재 인식에 사용할 수 없습니다.
  • 등록됨: 프로필에 음성 인쇄가 있고 인식 요청에 사용할 준비가 되었습니다.
Name 형식 Description
Enrolled

string

Enrolling

string

Training

string