Text Dependent - Create Enrollment

Registrera profil
Lägger till en registrering i en befintlig profil. Om det minsta antalet begärda registreringsljud nås skapas ett röstuttryck. Om röstuttrycket skapades tidigare återskapas det från alla befintliga registreringsljud, inklusive det nya.

Begränsningar:

  • Minsta ljudinmatningslängd per begäran är 1 sekund
  • Maximal ljudinmatningslängd per begäran är 10 sekunder
  • Minsta antal registreringar för att skapa ett röstavtryck är 3
  • Maximalt antal registreringar för att skapa ett röstavtryck är 50
  • Minsta ljud signal-till-brus-förhållande (SNR) är 2dB

Begränsningar:

  • Den första registreringen måste matcha en befintlig lösenfras.
  • Alla registreringar efter den första måste använda samma lösenfras som användes i den första registreringen.
POST {endpoint}/speaker-recognition/verification/text-dependent/profiles/{profileId}/enrollments?api-version=2021-09-05

URI-parametrar

Name I Obligatorisk Typ Description
endpoint
path True

string

Cognitive Services-slutpunkter som stöds (protokoll och värdnamn, till exempel: https://westus.api.cognitive.microsoft.com).

profileId
path True

string

uuid

Unik identifierare för profil-ID (GUID).

api-version
query True

string

Anger vilken version av åtgärden som ska användas för den här begäran.

Begärandehuvud

Media Types: "audio/wav; codecs=audio/pcm"

Name Obligatorisk Typ Description
Ocp-Apim-Subscription-Key True

string

Begärandetext

Media Types: "audio/wav; codecs=audio/pcm"

Name Typ Description
audioData

object

Binär ljudfil. Format som stöds är ljud/wav; codecs=audio/pcm. Stöder ljud upp till 5 MB.

Svar

Name Typ Description
201 Created

TdEnrollmentInfo

Skapad

Other Status Codes

SpeakerErrorInfo

Fel

Headers

x-ms-error-code: string

Säkerhet

Ocp-Apim-Subscription-Key

Type: apiKey
In: header

Exempel

Successful Query

Sample Request

POST https://westus.api.cognitive.microsoft.com/speaker-recognition/verification/text-dependent/profiles/49a36324-fc4b-4387-aa06-090cfbf0064f/enrollments?api-version=2021-09-05


"{binary file date}"

Sample Response

Content-Type: application/json
{
  "profileId": "49a36324-fc4b-4387-aa06-090cfbf0064f",
  "enrollmentStatus": "Enrolling",
  "enrollmentsCount": 1,
  "enrollmentsLengthInSec": 1.83,
  "enrollmentsSpeechLengthInSec": 1.35,
  "remainingEnrollmentsCount": 2,
  "passPhrase": "my voice is my passport verify me",
  "audioLengthInSec": 1.83,
  "audioSpeechLengthInSec": 1.35
}
Content-Type: application/json
x-ms-error-code: Error Code
{
  "error": {
    "code": "Error Code",
    "message": "Erro Messae"
  }
}

Definitioner

Name Description
Error
SpeakerErrorInfo

Talarfelmeddelande

TdEnrollmentInfo

registreringsinformation för Text-Dependent-talarprofil

TrainingStatusType

Status som representerar profilens aktuella tillstånd. Tillgängliga värden är:

  • Registrering: profilen har inget rösttryck och är inte redo för igenkänningsbegäranden.
  • Utbildning: Röstutskrift av profil skapas och kan inte användas för igenkänning just nu.
  • Registrerad: profilen har en röstutskrift och redo för igenkänningsbegäranden.

Error

Name Typ Description
code

string

message

string

SpeakerErrorInfo

Talarfelmeddelande

Name Typ Description
error

Error

TdEnrollmentInfo

registreringsinformation för Text-Dependent-talarprofil

Name Typ Description
audioLengthInSec

number

Den här registreringens ljudlängd i sekunder.

audioSpeechLengthInSec

number

Denna registrering ljud ren tal (vilket är mängden ljud efter att ha tagit bort tystnad och icke-tal segment) längd i sekunder.

enrollmentStatus

TrainingStatusType

Status som representerar profilens aktuella tillstånd. Tillgängliga värden är:

  • Registrering: profilen har inget rösttryck och är inte redo för igenkänningsbegäranden.
  • Utbildning: Röstutskrift av profil skapas och kan inte användas för igenkänning just nu.
  • Registrerad: profilen har en röstutskrift och redo för igenkänningsbegäranden.
enrollmentsCount

integer

Antal registreringsljud som godkänts för den här profilen.

enrollmentsLengthInSec

number

Total längd på registreringsljud som godkänts för den här profilen på några sekunder.

enrollmentsSpeechLengthInSec

number

Sammanfattning av rent tal (vilket är mängden ljud efter att ha tagit bort tystnadssegment och icke-talsegment) i alla profilregistreringar på några sekunder.

passPhrase

string

Lösenfras som är associerad med den här registreringen.

profileId

string

Unik identifierare för profil-ID (GUID).

remainingEnrollmentsCount

integer

Antal registreringsljud som krävs för att slutföra profilregistreringen.

TrainingStatusType

Status som representerar profilens aktuella tillstånd. Tillgängliga värden är:

  • Registrering: profilen har inget rösttryck och är inte redo för igenkänningsbegäranden.
  • Utbildning: Röstutskrift av profil skapas och kan inte användas för igenkänning just nu.
  • Registrerad: profilen har en röstutskrift och redo för igenkänningsbegäranden.
Name Typ Description
Enrolled

string

Enrolling

string

Training

string