Text Independent - Create Enrollment

Inscrever Perfil
Adiciona uma inscrição ao perfil existente. A primeira inscrição tem de ser uma expressão de ativação predefinida que pode ser listada com a api /phrases/{locale}. Se for atingido o número mínimo de áudios de inscrição pedidos, é criada uma impressão por voz. Qualquer inscrição adicional será utilizada para melhorar a impressão por voz.

Limitações:

  • O comprimento mínimo de entrada de áudio por pedido é de 1 segundo

  • O comprimento máximo de entrada de áudio por pedido é de 120 segundos

  • O comprimento mínimo total e efetivo da voz (excluindo o silêncio e outros fotogramas que não sejam de voz) para criar um voiceprint é de 20 segundos Esta limitação pode ser desativada ao definir ignoreMinLength como verdadeiro.

  • O comprimento total máximo de entrada de áudio permitido para criar um voiceprint é de 300 segundos

  • A proporção mínima de sinal para ruído (SNR) de áudio é de 2 dB

POST {endpoint}/speaker-recognition/identification/text-independent/profiles/{profileId}/enrollments?api-version=2021-09-05
POST {endpoint}/speaker-recognition/identification/text-independent/profiles/{profileId}/enrollments?api-version=2021-09-05&ignoreMinLength={ignoreMinLength}

Parâmetros do URI

Name Em Necessário Tipo Description
endpoint
path True

string

Pontos finais dos Serviços Cognitivos suportados (protocolo e nome do anfitrião, por exemplo: https://westus.api.cognitive.microsoft.com).

profileId
path True

string

uuid

Identificador exclusivo para id de perfil (guid).

api-version
query True

string

Especifica a versão da operação a utilizar para este pedido.

ignoreMinLength
query

boolean

Se for verdadeiro, será criada imediatamente uma impressão de voz para este perfil, independentemente da quantidade de voz fornecida ou armazenada. A predefinição é falso.

Cabeçalho do Pedido

Media Types: "audio/wav; codecs=audio/pcm"

Name Necessário Tipo Description
Ocp-Apim-Subscription-Key True

string

Corpo do Pedido

Media Types: "audio/wav; codecs=audio/pcm"

Name Tipo Description
audioData

object

Ficheiro de áudio binário. Os formatos suportados são audio/wav; codecs=audio/pcm. Suporta áudio até 5 MB.

Respostas

Name Tipo Description
201 Created

TiEnrollmentInfo

Criado

Other Status Codes

SpeakerErrorInfo

Falha

Headers

x-ms-error-code: string

Segurança

Ocp-Apim-Subscription-Key

Type: apiKey
In: header

Exemplos

Successful Query

Sample Request

POST https://westus.api.cognitive.microsoft.com/speaker-recognition/identification/text-independent/profiles/49a36324-fc4b-4387-aa06-090cfbf0064f/enrollments?api-version=2021-09-05


"{binary file date}"

Sample Response

Content-Type: application/json
{
  "profileId": "49a36324-fc4b-4387-aa06-090cfbf0064f",
  "enrollmentStatus": "Enrolling",
  "enrollmentsCount": 1,
  "enrollmentsLengthInSec": 1.83,
  "enrollmentsSpeechLengthInSec": 1.35,
  "remainingEnrollmentsSpeechLengthInSec": 18.65,
  "audioLengthInSec": 1.83,
  "audioSpeechLengthInSec": 1.35
}
Content-Type: application/json
x-ms-error-code: Error Code
{
  "error": {
    "code": "Error Code",
    "message": "Erro Messae"
  }
}

Definições

Name Description
Error
SpeakerErrorInfo

Mensagem de erro do orador

TiEnrollmentInfo

Informações de inscrição do perfil de orador

TrainingStatusType

Estado que representa o estado atual da inscrição do perfil. Os valores disponíveis são:

  • Inscrição: o perfil não tem impressão por voz e não está pronto para pedidos de reconhecimento.
  • Formação: a impressão por voz do perfil está a ser criada e não pode ser utilizada para reconhecimento neste momento.
  • Inscrito: o perfil tem uma impressão por voz e está pronto para pedidos de reconhecimento.

Error

Name Tipo Description
code

string

message

string

SpeakerErrorInfo

Mensagem de erro do orador

Name Tipo Description
error

Error

TiEnrollmentInfo

Informações de inscrição do perfil de orador

Name Tipo Description
audioLengthInSec

number

Este comprimento de áudio de inscrição em segundos.

audioSpeechLengthInSec

number

Esta voz pura de áudio de inscrição (que é a quantidade de áudio após remover o silêncio e segmentos sem voz) dura em segundos.

enrollmentStatus

TrainingStatusType

Estado que representa o estado atual da inscrição do perfil. Os valores disponíveis são:

  • Inscrição: o perfil não tem impressão por voz e não está pronto para pedidos de reconhecimento.
  • Formação: a impressão por voz do perfil está a ser criada e não pode ser utilizada para reconhecimento neste momento.
  • Inscrito: o perfil tem uma impressão por voz e está pronto para pedidos de reconhecimento.
enrollmentsCount

integer

Número de áudios de inscrição aceites para este perfil.

enrollmentsLengthInSec

number

Duração total dos áudios de inscrição aceites para este perfil em segundos.

enrollmentsSpeechLengthInSec

number

Soma de voz pura (que é a quantidade de áudio após remover segmentos de silêncio e não voz) em todas as inscrições de perfil em segundos.

profileId

string

Identificador exclusivo para id de perfil (guid).

remainingEnrollmentsSpeechLengthInSec

number

Quantidade de voz pura (que é a quantidade de áudio após remover segmentos de silêncio e não voz) necessária para concluir a inscrição de perfis em segundos.

TrainingStatusType

Estado que representa o estado atual da inscrição do perfil. Os valores disponíveis são:

  • Inscrição: o perfil não tem impressão por voz e não está pronto para pedidos de reconhecimento.
  • Formação: a impressão por voz do perfil está a ser criada e não pode ser utilizada para reconhecimento neste momento.
  • Inscrito: o perfil tem uma impressão por voz e está pronto para pedidos de reconhecimento.
Name Tipo Description
Enrolled

string

Enrolling

string

Training

string