Text Independent - Create Enrollment

Registrera profil
Lägger till en registrering i en befintlig profil. Den första registreringen måste vara en fördefinierad aktiveringsfras som kan visas med api:et /phrases/{locale}. Om det minsta antalet begärda registreringsljud nås skapas ett röstuttryck. Ytterligare registrering kommer att användas för att förbättra röstutskriften.

Begränsningar:

  • Minsta ljudinmatningslängd per begäran är 1 sekund

  • Maximal ljudinmatningslängd per begäran är 120 sekunder

  • Minsta totala effektiva tallängd (exklusive tystnad och andra icke-talramar) för att skapa ett röstavtryck är 20 sekunder Den här begränsningen kan inaktiveras genom att ange "ignoreMinLength" till true.

  • Den maximala totala ljudinmatningslängden som tillåts för att skapa ett röstavtryck är 300 sekunder

  • Minsta ljud signal-till-brus-förhållande (SNR) är 2dB

POST {endpoint}/speaker-recognition/verification/text-independent/profiles/{profileId}/enrollments?api-version=2021-09-05
POST {endpoint}/speaker-recognition/verification/text-independent/profiles/{profileId}/enrollments?api-version=2021-09-05&ignoreMinLength={ignoreMinLength}

URI-parametrar

Name I Obligatorisk Typ Description
endpoint
path True

string

Cognitive Services-slutpunkter som stöds (protokoll och värdnamn, till exempel: https://westus.api.cognitive.microsoft.com).

profileId
path True

string

uuid

Unik identifierare för profil-ID (GUID).

api-version
query True

string

Anger vilken version av åtgärden som ska användas för den här begäran.

ignoreMinLength
query

boolean

Om det är sant skapas ett röstuttryck omedelbart för den här profilen oavsett hur mycket tal som tillhandahålls eller lagras. Standardvärdet är false.

Begärandehuvud

Media Types: "audio/wav; codecs=audio/pcm"

Name Obligatorisk Typ Description
Ocp-Apim-Subscription-Key True

string

Begärandetext

Media Types: "audio/wav; codecs=audio/pcm"

Name Typ Description
audioData

object

Binär ljudfil. Format som stöds är audio/wav; codecs=audio/pcm. Stöder ljud upp till 5 MB.

Svar

Name Typ Description
201 Created

TiEnrollmentInfo

Skapad

Other Status Codes

SpeakerErrorInfo

Fel

Headers

x-ms-error-code: string

Säkerhet

Ocp-Apim-Subscription-Key

Type: apiKey
In: header

Exempel

Successful Query

Sample Request

POST https://westus.api.cognitive.microsoft.com/speaker-recognition/verification/text-independent/profiles/49a36324-fc4b-4387-aa06-090cfbf0064f/enrollments?api-version=2021-09-05


"{binary file date}"

Sample Response

Content-Type: application/json
{
  "profileId": "49a36324-fc4b-4387-aa06-090cfbf0064f",
  "enrollmentStatus": "Enrolling",
  "enrollmentsCount": 1,
  "enrollmentsLengthInSec": 1.83,
  "enrollmentsSpeechLengthInSec": 1.35,
  "remainingEnrollmentsSpeechLengthInSec": 18.65,
  "audioLengthInSec": 1.83,
  "audioSpeechLengthInSec": 1.35
}
Content-Type: application/json
x-ms-error-code: Error Code
{
  "error": {
    "code": "Error Code",
    "message": "Erro Messae"
  }
}

Definitioner

Name Description
Error
SpeakerErrorInfo

Talarfelmeddelande

TiEnrollmentInfo

registreringsinformation för Text-Independent-talarprofil

TrainingStatusType

Status som representerar profilens aktuella tillstånd. Tillgängliga värden är:

  • Registrering: profilen har inget röstuttryck och är inte redo för igenkänningsförfrågningar.
  • Utbildning: Röstutskrift av profilen skapas och kan inte användas för igenkänning för tillfället.
  • Registrerad: profilen har en röstutskrift och redo för igenkänningsbegäranden.

Error

Name Typ Description
code

string

message

string

SpeakerErrorInfo

Talarfelmeddelande

Name Typ Description
error

Error

TiEnrollmentInfo

registreringsinformation för Text-Independent-talarprofil

Name Typ Description
audioLengthInSec

number

Den här registreringsljudlängden i sekunder.

audioSpeechLengthInSec

number

Denna registrering ljud ren tal (vilket är mängden ljud efter att ta bort tystnad och icke-tal segment) längd i sekunder.

enrollmentStatus

TrainingStatusType

Status som representerar profilens aktuella tillstånd. Tillgängliga värden är:

  • Registrering: profilen har inget röstuttryck och är inte redo för igenkänningsförfrågningar.
  • Utbildning: Röstutskrift av profilen skapas och kan inte användas för igenkänning för tillfället.
  • Registrerad: profilen har en röstutskrift och redo för igenkänningsbegäranden.
enrollmentsCount

integer

Antal registreringsljud som godkänts för den här profilen.

enrollmentsLengthInSec

number

Total längd på registreringsljud som godkänts för den här profilen på några sekunder.

enrollmentsSpeechLengthInSec

number

Sammanfattning av rent tal (vilket är mängden ljud efter borttagning av tystnad och icke-talsegment) för alla profilregistreringar på några sekunder.

profileId

string

Unik identifierare för profil-ID (GUID).

remainingEnrollmentsSpeechLengthInSec

number

Mängden rent tal (vilket är mängden ljud efter borttagning av tystnad och icke-talsegment) som behövs för att slutföra profilregistreringen på några sekunder.

TrainingStatusType

Status som representerar profilens aktuella tillstånd. Tillgängliga värden är:

  • Registrering: profilen har inget röstuttryck och är inte redo för igenkänningsförfrågningar.
  • Utbildning: Röstutskrift av profilen skapas och kan inte användas för igenkänning för tillfället.
  • Registrerad: profilen har en röstutskrift och redo för igenkänningsbegäranden.
Name Typ Description
Enrolled

string

Enrolling

string

Training

string