Text Independent - Create Enrollment
Registrera profil
Lägger till en registrering i en befintlig profil.
Den första registreringen måste vara en fördefinierad aktiveringsfras som kan visas med api:et /phrases/{locale}.
Om det minsta antalet begärda registreringsljud nås skapas ett röstuttryck.
Ytterligare registrering kommer att användas för att förbättra röstutskriften.
Begränsningar:
Minsta ljudinmatningslängd per begäran är 1 sekund
Maximal ljudinmatningslängd per begäran är 120 sekunder
Minsta totala effektiva tallängd (exklusive tystnad och andra icke-talramar) för att skapa ett röstavtryck är 20 sekunder Den här begränsningen kan inaktiveras genom att ange "ignoreMinLength" till true.
Den maximala totala ljudinmatningslängden som tillåts för att skapa ett röstavtryck är 300 sekunder
Minsta ljud signal-till-brus-förhållande (SNR) är 2dB
POST {endpoint}/speaker-recognition/verification/text-independent/profiles/{profileId}/enrollments?api-version=2021-09-05
POST {endpoint}/speaker-recognition/verification/text-independent/profiles/{profileId}/enrollments?api-version=2021-09-05&ignoreMinLength={ignoreMinLength}
URI-parametrar
Name | I | Obligatorisk | Typ | Description |
---|---|---|---|---|
endpoint
|
path | True |
string |
Cognitive Services-slutpunkter som stöds (protokoll och värdnamn, till exempel: https://westus.api.cognitive.microsoft.com). |
profile
|
path | True |
string uuid |
Unik identifierare för profil-ID (GUID). |
api-version
|
query | True |
string |
Anger vilken version av åtgärden som ska användas för den här begäran. |
ignore
|
query |
boolean |
Om det är sant skapas ett röstuttryck omedelbart för den här profilen oavsett hur mycket tal som tillhandahålls eller lagras. Standardvärdet är false. |
Begärandehuvud
Media Types: "audio/wav; codecs=audio/pcm"
Name | Obligatorisk | Typ | Description |
---|---|---|---|
Ocp-Apim-Subscription-Key | True |
string |
Begärandetext
Media Types: "audio/wav; codecs=audio/pcm"
Name | Typ | Description |
---|---|---|
audioData |
object |
Binär ljudfil. Format som stöds är audio/wav; codecs=audio/pcm. Stöder ljud upp till 5 MB. |
Svar
Name | Typ | Description |
---|---|---|
201 Created |
Skapad |
|
Other Status Codes |
Fel Headers x-ms-error-code: string |
Säkerhet
Ocp-Apim-Subscription-Key
Type:
apiKey
In:
header
Exempel
Successful Query
Sample Request
POST https://westus.api.cognitive.microsoft.com/speaker-recognition/verification/text-independent/profiles/49a36324-fc4b-4387-aa06-090cfbf0064f/enrollments?api-version=2021-09-05
"{binary file date}"
Sample Response
Content-Type: application/json
{
"profileId": "49a36324-fc4b-4387-aa06-090cfbf0064f",
"enrollmentStatus": "Enrolling",
"enrollmentsCount": 1,
"enrollmentsLengthInSec": 1.83,
"enrollmentsSpeechLengthInSec": 1.35,
"remainingEnrollmentsSpeechLengthInSec": 18.65,
"audioLengthInSec": 1.83,
"audioSpeechLengthInSec": 1.35
}
Content-Type: application/json
x-ms-error-code: Error Code
{
"error": {
"code": "Error Code",
"message": "Erro Messae"
}
}
Definitioner
Name | Description |
---|---|
Error | |
Speaker |
Talarfelmeddelande |
Ti |
registreringsinformation för Text-Independent-talarprofil |
Training |
Status som representerar profilens aktuella tillstånd. Tillgängliga värden är:
|
Error
Name | Typ | Description |
---|---|---|
code |
string |
|
message |
string |
SpeakerErrorInfo
Talarfelmeddelande
Name | Typ | Description |
---|---|---|
error |
TiEnrollmentInfo
registreringsinformation för Text-Independent-talarprofil
Name | Typ | Description |
---|---|---|
audioLengthInSec |
number |
Den här registreringsljudlängden i sekunder. |
audioSpeechLengthInSec |
number |
Denna registrering ljud ren tal (vilket är mängden ljud efter att ta bort tystnad och icke-tal segment) längd i sekunder. |
enrollmentStatus |
Status som representerar profilens aktuella tillstånd. Tillgängliga värden är:
|
|
enrollmentsCount |
integer |
Antal registreringsljud som godkänts för den här profilen. |
enrollmentsLengthInSec |
number |
Total längd på registreringsljud som godkänts för den här profilen på några sekunder. |
enrollmentsSpeechLengthInSec |
number |
Sammanfattning av rent tal (vilket är mängden ljud efter borttagning av tystnad och icke-talsegment) för alla profilregistreringar på några sekunder. |
profileId |
string |
Unik identifierare för profil-ID (GUID). |
remainingEnrollmentsSpeechLengthInSec |
number |
Mängden rent tal (vilket är mängden ljud efter borttagning av tystnad och icke-talsegment) som behövs för att slutföra profilregistreringen på några sekunder. |
TrainingStatusType
Status som representerar profilens aktuella tillstånd. Tillgängliga värden är:
- Registrering: profilen har inget röstuttryck och är inte redo för igenkänningsförfrågningar.
- Utbildning: Röstutskrift av profilen skapas och kan inte användas för igenkänning för tillfället.
- Registrerad: profilen har en röstutskrift och redo för igenkänningsbegäranden.
Name | Typ | Description |
---|---|---|
Enrolled |
string |
|
Enrolling |
string |
|
Training |
string |