Text Dependent - Create Enrollment
Registrera profil
Lägger till en registrering i en befintlig profil.
Om det minsta antalet begärda registreringsljud nås skapas ett röstuttryck.
Om röstuttrycket skapades tidigare återskapas det från alla befintliga registreringsljud, inklusive det nya.
Begränsningar:
- Minsta ljudinmatningslängd per begäran är 1 sekund
- Maximal ljudinmatningslängd per begäran är 10 sekunder
- Minsta antal registreringar för att skapa ett röstavtryck är 3
- Maximalt antal registreringar för att skapa ett röstavtryck är 50
- Minsta ljud signal-till-brus-förhållande (SNR) är 2dB
Begränsningar:
- Den första registreringen måste matcha en befintlig lösenfras.
- Alla registreringar efter den första måste använda samma lösenfras som användes i den första registreringen.
POST {endpoint}/speaker-recognition/verification/text-dependent/profiles/{profileId}/enrollments?api-version=2021-09-05
URI-parametrar
Name | I | Obligatorisk | Typ | Description |
---|---|---|---|---|
endpoint
|
path | True |
string |
Cognitive Services-slutpunkter som stöds (protokoll och värdnamn, till exempel: https://westus.api.cognitive.microsoft.com). |
profile
|
path | True |
string uuid |
Unik identifierare för profil-ID (GUID). |
api-version
|
query | True |
string |
Anger vilken version av åtgärden som ska användas för den här begäran. |
Begärandehuvud
Media Types: "audio/wav; codecs=audio/pcm"
Name | Obligatorisk | Typ | Description |
---|---|---|---|
Ocp-Apim-Subscription-Key | True |
string |
Begärandetext
Media Types: "audio/wav; codecs=audio/pcm"
Name | Typ | Description |
---|---|---|
audioData |
object |
Binär ljudfil. Format som stöds är ljud/wav; codecs=audio/pcm. Stöder ljud upp till 5 MB. |
Svar
Name | Typ | Description |
---|---|---|
201 Created |
Skapad |
|
Other Status Codes |
Fel Headers x-ms-error-code: string |
Säkerhet
Ocp-Apim-Subscription-Key
Type:
apiKey
In:
header
Exempel
Successful Query
Sample Request
POST https://westus.api.cognitive.microsoft.com/speaker-recognition/verification/text-dependent/profiles/49a36324-fc4b-4387-aa06-090cfbf0064f/enrollments?api-version=2021-09-05
"{binary file date}"
Sample Response
Content-Type: application/json
{
"profileId": "49a36324-fc4b-4387-aa06-090cfbf0064f",
"enrollmentStatus": "Enrolling",
"enrollmentsCount": 1,
"enrollmentsLengthInSec": 1.83,
"enrollmentsSpeechLengthInSec": 1.35,
"remainingEnrollmentsCount": 2,
"passPhrase": "my voice is my passport verify me",
"audioLengthInSec": 1.83,
"audioSpeechLengthInSec": 1.35
}
Content-Type: application/json
x-ms-error-code: Error Code
{
"error": {
"code": "Error Code",
"message": "Erro Messae"
}
}
Definitioner
Name | Description |
---|---|
Error | |
Speaker |
Talarfelmeddelande |
Td |
registreringsinformation för Text-Dependent-talarprofil |
Training |
Status som representerar profilens aktuella tillstånd. Tillgängliga värden är:
|
Error
Name | Typ | Description |
---|---|---|
code |
string |
|
message |
string |
SpeakerErrorInfo
Talarfelmeddelande
Name | Typ | Description |
---|---|---|
error |
TdEnrollmentInfo
registreringsinformation för Text-Dependent-talarprofil
Name | Typ | Description |
---|---|---|
audioLengthInSec |
number |
Den här registreringens ljudlängd i sekunder. |
audioSpeechLengthInSec |
number |
Denna registrering ljud ren tal (vilket är mängden ljud efter att ha tagit bort tystnad och icke-tal segment) längd i sekunder. |
enrollmentStatus |
Status som representerar profilens aktuella tillstånd. Tillgängliga värden är:
|
|
enrollmentsCount |
integer |
Antal registreringsljud som godkänts för den här profilen. |
enrollmentsLengthInSec |
number |
Total längd på registreringsljud som godkänts för den här profilen på några sekunder. |
enrollmentsSpeechLengthInSec |
number |
Sammanfattning av rent tal (vilket är mängden ljud efter att ha tagit bort tystnadssegment och icke-talsegment) i alla profilregistreringar på några sekunder. |
passPhrase |
string |
Lösenfras som är associerad med den här registreringen. |
profileId |
string |
Unik identifierare för profil-ID (GUID). |
remainingEnrollmentsCount |
integer |
Antal registreringsljud som krävs för att slutföra profilregistreringen. |
TrainingStatusType
Status som representerar profilens aktuella tillstånd. Tillgängliga värden är:
- Registrering: profilen har inget rösttryck och är inte redo för igenkänningsbegäranden.
- Utbildning: Röstutskrift av profil skapas och kan inte användas för igenkänning just nu.
- Registrerad: profilen har en röstutskrift och redo för igenkänningsbegäranden.
Name | Typ | Description |
---|---|---|
Enrolled |
string |
|
Enrolling |
string |
|
Training |
string |