Text Independent - Create Enrollment

Profil d’inscription
Ajoute une inscription à un profil existant. La première inscription doit être une expression d’activation prédéfinie qui peut être répertoriée à l’aide de l’API /phrases/{locale}. Si le nombre minimal d’audios d’inscription demandés est atteint, une impression vocale est créée. Toute inscription supplémentaire sera utilisée pour améliorer l’impression vocale.

Limites :

  • La longueur d’entrée audio minimale par demande est de 1 seconde

  • La longueur maximale d’entrée audio par requête est de 120 secondes

  • La longueur totale effective minimale de la voix (à l’exception du silence et des autres trames non vocales) pour la création d’une empreinte vocale est de 20 secondes Cette limitation peut être désactivée en définissant « ignoreMinLength » sur true.

  • La longueur totale maximale d’entrée audio autorisée pour la création d’une empreinte vocale est de 300 secondes

  • Le rapport signal/bruit (SNR) audio minimal est de 2 dB

POST {endpoint}/speaker-recognition/verification/text-independent/profiles/{profileId}/enrollments?api-version=2021-09-05
POST {endpoint}/speaker-recognition/verification/text-independent/profiles/{profileId}/enrollments?api-version=2021-09-05&ignoreMinLength={ignoreMinLength}

Paramètres URI

Nom Dans Obligatoire Type Description
endpoint
path True

string

Points de terminaison Cognitive Services pris en charge (protocole et nom d’hôte, par exemple : https://westus.api.cognitive.microsoft.com).

profileId
path True

string

uuid

Identificateur unique pour l’ID de profil (GUID).

api-version
query True

string

Spécifie la version de l'opération à utiliser pour cette demande.

ignoreMinLength
query

boolean

Si la valeur est true, une impression vocale est créée immédiatement pour ce profil, quelle que soit la quantité de parole fournie ou stockée. La valeur par défaut est false.

En-tête de la demande

Media Types: "audio/wav; codecs=audio/pcm"

Nom Obligatoire Type Description
Ocp-Apim-Subscription-Key True

string

Corps de la demande

Media Types: "audio/wav; codecs=audio/pcm"

Nom Type Description
audioData

object

Fichier audio binaire. Les formats pris en charge sont audio/wav ; codecs=audio/pcm. Prend en charge l’audio jusqu’à 5 Mo.

Réponses

Nom Type Description
201 Created

TiEnrollmentInfo

Date de création

Other Status Codes

SpeakerErrorInfo

Échec

Headers

x-ms-error-code: string

Sécurité

Ocp-Apim-Subscription-Key

Type: apiKey
In: header

Exemples

Successful Query

Sample Request

POST https://westus.api.cognitive.microsoft.com/speaker-recognition/verification/text-independent/profiles/49a36324-fc4b-4387-aa06-090cfbf0064f/enrollments?api-version=2021-09-05


"{binary file date}"

Sample Response

Content-Type: application/json
{
  "profileId": "49a36324-fc4b-4387-aa06-090cfbf0064f",
  "enrollmentStatus": "Enrolling",
  "enrollmentsCount": 1,
  "enrollmentsLengthInSec": 1.83,
  "enrollmentsSpeechLengthInSec": 1.35,
  "remainingEnrollmentsSpeechLengthInSec": 18.65,
  "audioLengthInSec": 1.83,
  "audioSpeechLengthInSec": 1.35
}
Content-Type: application/json
x-ms-error-code: Error Code
{
  "error": {
    "code": "Error Code",
    "message": "Erro Messae"
  }
}

Définitions

Nom Description
Error
SpeakerErrorInfo

Message d’erreur de l’orateur

TiEnrollmentInfo

Text-Independent informations d’inscription du profil Speaker

TrainingStatusType

État représentant l’état actuel du profil. Les valeurs disponibles sont :

  • Inscription : le profil n’a pas d’impression vocale et n’est pas prêt pour les demandes de reconnaissance.
  • Formation : l’impression vocale du profil est en cours de création et ne peut pas être utilisée pour la reconnaissance pour le moment.
  • Inscrit : le profil a une impression vocale et prêt pour les demandes de reconnaissance.

Error

Nom Type Description
code

string

message

string

SpeakerErrorInfo

Message d’erreur de l’orateur

Nom Type Description
error

Error

TiEnrollmentInfo

Text-Independent informations d’inscription du profil Speaker

Nom Type Description
audioLengthInSec

number

Cette durée audio d’inscription est en secondes.

audioSpeechLengthInSec

number

Cette voix audio pure d’inscription (qui correspond à la quantité d’audio après la suppression des segments de silence et non vocaux) est longue en secondes.

enrollmentStatus

TrainingStatusType

État représentant l’état actuel du profil. Les valeurs disponibles sont :

  • Inscription : le profil n’a pas d’impression vocale et n’est pas prêt pour les demandes de reconnaissance.
  • Formation : l’impression vocale du profil est en cours de création et ne peut pas être utilisée pour la reconnaissance pour le moment.
  • Inscrit : le profil a une impression vocale et prêt pour les demandes de reconnaissance.
enrollmentsCount

integer

Nombre d’audios d’inscription acceptés pour ce profil.

enrollmentsLengthInSec

number

Durée totale des enregistrements audio d’inscription acceptés pour ce profil en secondes.

enrollmentsSpeechLengthInSec

number

Somme de la parole pure (qui correspond à la quantité d’audio après la suppression des segments de silence et non vocaux) sur toutes les inscriptions de profil en quelques secondes.

profileId

string

Identificateur unique pour l’ID de profil (GUID).

remainingEnrollmentsSpeechLengthInSec

number

Quantité de voix pure (qui correspond à la quantité d’audio après la suppression des segments de silence et non vocaux) nécessaire pour terminer l’inscription du profil en quelques secondes.

TrainingStatusType

État représentant l’état actuel du profil. Les valeurs disponibles sont :

  • Inscription : le profil n’a pas d’impression vocale et n’est pas prêt pour les demandes de reconnaissance.
  • Formation : l’impression vocale du profil est en cours de création et ne peut pas être utilisée pour la reconnaissance pour le moment.
  • Inscrit : le profil a une impression vocale et prêt pour les demandes de reconnaissance.
Nom Type Description
Enrolled

string

Enrolling

string

Training

string