Text Independent - Create Enrollment
Inscrever Perfil
Adiciona uma inscrição ao perfil existente.
A primeira inscrição tem de ser uma expressão de ativação predefinida que pode ser listada com a api /phrases/{locale}.
Se for atingido o número mínimo de áudios de inscrição pedidos, é criada uma impressão por voz.
Qualquer inscrição adicional será utilizada para melhorar a impressão por voz.
Limitações:
O comprimento mínimo de entrada de áudio por pedido é de 1 segundo
O comprimento máximo de entrada de áudio por pedido é de 120 segundos
O comprimento mínimo total e efetivo da voz (excluindo o silêncio e outros fotogramas que não sejam de voz) para criar um voiceprint é de 20 segundos Esta limitação pode ser desativada ao definir ignoreMinLength como verdadeiro.
O comprimento total máximo de entrada de áudio permitido para criar um voiceprint é de 300 segundos
A proporção mínima de sinal para ruído (SNR) de áudio é de 2 dB
POST {endpoint}/speaker-recognition/identification/text-independent/profiles/{profileId}/enrollments?api-version=2021-09-05
POST {endpoint}/speaker-recognition/identification/text-independent/profiles/{profileId}/enrollments?api-version=2021-09-05&ignoreMinLength={ignoreMinLength}
Parâmetros do URI
Name | Em | Necessário | Tipo | Description |
---|---|---|---|---|
endpoint
|
path | True |
string |
Pontos finais dos Serviços Cognitivos suportados (protocolo e nome do anfitrião, por exemplo: https://westus.api.cognitive.microsoft.com). |
profile
|
path | True |
string uuid |
Identificador exclusivo para id de perfil (guid). |
api-version
|
query | True |
string |
Especifica a versão da operação a utilizar para este pedido. |
ignore
|
query |
boolean |
Se for verdadeiro, será criada imediatamente uma impressão de voz para este perfil, independentemente da quantidade de voz fornecida ou armazenada. A predefinição é falso. |
Cabeçalho do Pedido
Media Types: "audio/wav; codecs=audio/pcm"
Name | Necessário | Tipo | Description |
---|---|---|---|
Ocp-Apim-Subscription-Key | True |
string |
Corpo do Pedido
Media Types: "audio/wav; codecs=audio/pcm"
Name | Tipo | Description |
---|---|---|
audioData |
object |
Ficheiro de áudio binário. Os formatos suportados são audio/wav; codecs=audio/pcm. Suporta áudio até 5 MB. |
Respostas
Name | Tipo | Description |
---|---|---|
201 Created |
Criado |
|
Other Status Codes |
Falha Headers x-ms-error-code: string |
Segurança
Ocp-Apim-Subscription-Key
Type:
apiKey
In:
header
Exemplos
Successful Query
Sample Request
POST https://westus.api.cognitive.microsoft.com/speaker-recognition/identification/text-independent/profiles/49a36324-fc4b-4387-aa06-090cfbf0064f/enrollments?api-version=2021-09-05
"{binary file date}"
Sample Response
Content-Type: application/json
{
"profileId": "49a36324-fc4b-4387-aa06-090cfbf0064f",
"enrollmentStatus": "Enrolling",
"enrollmentsCount": 1,
"enrollmentsLengthInSec": 1.83,
"enrollmentsSpeechLengthInSec": 1.35,
"remainingEnrollmentsSpeechLengthInSec": 18.65,
"audioLengthInSec": 1.83,
"audioSpeechLengthInSec": 1.35
}
Content-Type: application/json
x-ms-error-code: Error Code
{
"error": {
"code": "Error Code",
"message": "Erro Messae"
}
}
Definições
Name | Description |
---|---|
Error | |
Speaker |
Mensagem de erro do orador |
Ti |
Informações de inscrição do perfil de orador |
Training |
Estado que representa o estado atual da inscrição do perfil. Os valores disponíveis são:
|
Error
Name | Tipo | Description |
---|---|---|
code |
string |
|
message |
string |
SpeakerErrorInfo
Mensagem de erro do orador
Name | Tipo | Description |
---|---|---|
error |
TiEnrollmentInfo
Informações de inscrição do perfil de orador
Name | Tipo | Description |
---|---|---|
audioLengthInSec |
number |
Este comprimento de áudio de inscrição em segundos. |
audioSpeechLengthInSec |
number |
Esta voz pura de áudio de inscrição (que é a quantidade de áudio após remover o silêncio e segmentos sem voz) dura em segundos. |
enrollmentStatus |
Estado que representa o estado atual da inscrição do perfil. Os valores disponíveis são:
|
|
enrollmentsCount |
integer |
Número de áudios de inscrição aceites para este perfil. |
enrollmentsLengthInSec |
number |
Duração total dos áudios de inscrição aceites para este perfil em segundos. |
enrollmentsSpeechLengthInSec |
number |
Soma de voz pura (que é a quantidade de áudio após remover segmentos de silêncio e não voz) em todas as inscrições de perfil em segundos. |
profileId |
string |
Identificador exclusivo para id de perfil (guid). |
remainingEnrollmentsSpeechLengthInSec |
number |
Quantidade de voz pura (que é a quantidade de áudio após remover segmentos de silêncio e não voz) necessária para concluir a inscrição de perfis em segundos. |
TrainingStatusType
Estado que representa o estado atual da inscrição do perfil. Os valores disponíveis são:
- Inscrição: o perfil não tem impressão por voz e não está pronto para pedidos de reconhecimento.
- Formação: a impressão por voz do perfil está a ser criada e não pode ser utilizada para reconhecimento neste momento.
- Inscrito: o perfil tem uma impressão por voz e está pronto para pedidos de reconhecimento.
Name | Tipo | Description |
---|---|---|
Enrolled |
string |
|
Enrolling |
string |
|
Training |
string |