Text Independent - Verify Profile

Verifica profilo
Verifica i profili esistenti rispetto all'audio di input.

Limitazioni

  • La lunghezza minima di input audio è di 1 secondo
  • La lunghezza massima dell'input audio è di 120 secondi
  • Lunghezza minima effettiva del riconoscimento vocale (escluso il silenzio e altri fotogrammi non vocali) è di 4 secondi Questa limitazione può essere disabilitata impostando "ignoreMinLength" su true.
  • Rapporto minimo di segnale audio a rumore (SNR) è 2dB
POST {endpoint}/speaker-recognition/verification/text-independent/profiles/{profileId}:verify?api-version=2021-09-05
POST {endpoint}/speaker-recognition/verification/text-independent/profiles/{profileId}:verify?api-version=2021-09-05&ignoreMinLength={ignoreMinLength}

Parametri dell'URI

Nome In Necessario Tipo Descrizione
endpoint
path True

string

Endpoint di Servizi cognitivi supportati (protocollo e nome host, ad esempio: https://westus.api.cognitive.microsoft.com).

profileId
path True

string

uuid

Identificatore univoco per l'ID profilo (guid).

api-version
query True

string

Specifica la versione dell'operazione da usare per questa richiesta.

ignoreMinLength
query

boolean

Se true, verrà creata immediatamente una stampa vocale per questo profilo indipendentemente dalla quantità di voce fornita o archiviata. L'impostazione predefinita è false.

Intestazione della richiesta

Media Types: "audio/wav; codecs=audio/pcm"

Nome Necessario Tipo Descrizione
Ocp-Apim-Subscription-Key True

string

Corpo della richiesta

Media Types: "audio/wav; codecs=audio/pcm"

Nome Tipo Descrizione
audioData

object

File audio binario. I formati supportati sono audio/wav; codecs=audio/pcm. Supporta l'audio fino a 5 MB.

Risposte

Nome Tipo Descrizione
200 OK

RecognitionInfo

OK

Other Status Codes

SpeakerErrorInfo

Operazioni non riuscite

Headers

x-ms-error-code: string

Sicurezza

Ocp-Apim-Subscription-Key

Type: apiKey
In: header

Esempio

Successful Query

Sample Request

POST https://westus.api.cognitive.microsoft.com/speaker-recognition/verification/text-independent/profiles/49a36324-fc4b-4387-aa06-090cfbf0064f:verify?api-version=2021-09-05


"{binary file date}"

Sample Response

Content-Type: application/json
{
  "recognitionResult": "accept",
  "score": 0.63
}
Content-Type: application/json
x-ms-error-code: Error Code
{
  "error": {
    "code": "Error Code",
    "message": "Erro Messae"
  }
}

Definizioni

Nome Descrizione
Error
RecognitionInfo

Risultato del riconoscimento del parlante

ResultType

L'audio appartiene al profilo di destinazione?

SpeakerErrorInfo

Messaggio di errore dell'altoparlante

Error

Nome Tipo Descrizione
code

string

message

string

RecognitionInfo

Risultato del riconoscimento del parlante

Nome Tipo Descrizione
recognitionResult

ResultType

L'audio appartiene al profilo di destinazione?

score

number

Numero float che indica la somiglianza tra l'audio di input e la stampa vocale di destinazione. Questo numero deve essere compreso tra 0 e 1. Un numero maggiore indica una maggiore somiglianza.

ResultType

L'audio appartiene al profilo di destinazione?

Nome Tipo Descrizione
accept

string

reject

string

SpeakerErrorInfo

Messaggio di errore dell'altoparlante

Nome Tipo Descrizione
error

Error