Text Independent - Identify Single Speaker

Identificare il profilo voce singola
Identifica chi parla nell'audio di input in un elenco di profili candidati.

Limitazioni

  • La lunghezza minima dell'input audio è di 1 secondo

  • La lunghezza massima dell'input audio è di 120 secondi

  • Il numero minimo di parlanti candidati è 1

  • Il numero massimo di parlanti candidati è 50

  • La lunghezza minima effettiva della voce (esclusi il silenzio e altri fotogrammi non vocali) è di 4 secondi. Questa limitazione può essere disabilitata impostando "ignoreMinLength" su true.

  • Il rapporto minimo tra segnale audio e rumore (SNR) è 0dB

POST {Endpoint}/speaker/identification/v2.0/text-independent/profiles/identifySingleSpeaker?profileIds={profileIds}
POST {Endpoint}/speaker/identification/v2.0/text-independent/profiles/identifySingleSpeaker?profileIds={profileIds}&ignoreMinLength={ignoreMinLength}

Parametri dell'URI

Name In Required Type Description
Endpoint
path True
  • string

Endpoint di Servizi cognitivi supportati (protocollo e nome host, ad esempio: https://westus.api.cognitive.microsoft.com) .

profileIds
query True
  • string

ID profilo delimitati da virgole. Il numero massimo supportato è 50 ID.

ignoreMinLength
query
  • boolean

Se true, la quantità minima di parlato necessaria per l'identificazione viene ignorata. L'impostazione predefinita è false.

Intestazione della richiesta

Media Types: "audio/wav; codecs=audio/pcm"

Name Required Type Description
Ocp-Apim-Subscription-Key True
  • string

Corpo della richiesta

Media Types: "audio/wav; codecs=audio/pcm"

Name Type Description
audioData
  • object

File audio binario. I formati supportati sono audio/wav; codecs=audio/pcm. Supporta audio fino a 5 MB.

Risposte

Name Type Description
200 OK

OK

400 Bad Request

Bad Request

  • InvalidRequest: lunghezza audio non valida. La lunghezza massima consentita per ogni richiesta di riconoscimento è 120 secondi.
  • InvalidRequest: lunghezza audio non valida. La lunghezza minima consentita per ogni richiesta di riconoscimento è 1 secondo.
  • InvalidRequest: formato audio non valido. Il formato supportato è 16Khz 16bit Mono PCM.
  • InvalidArgument: valore del parametro ignoreMinLength non valido. I valori validi sono "true" e "false".
  • InvalidArgument: valore del parametro profileIds non valido. Deve essere un elenco delimitato da virgole di ID contenenti almeno un ID.
  • InvalidRequest: parametro profileIds mancante. Deve essere un elenco delimitato da virgole di ID contenenti almeno un ID.
  • InvalidRequest: gruppo di profili non valido. I profili devono avere le stesse impostazioni locali.
  • InvalidRequest: il numero massimo di profili consentiti per ogni richiesta è 50.
  • InvalidRequest: il rapporto audio segnale/rumore minimo (SNR) è 0dB
  • InvalidRequest: il profilo non è registrato.
401 Unauthorized

La richiesta non è autorizzata. Assicurarsi che la chiave di sottoscrizione sia inclusa e valida.

500 Internal Server Error

Errore interno del server.

Other Status Codes

UnsupportedMediaType: tipo di supporto non supportato. Solo "audio/wav; codecs=audio/pcm" è accettato.

Other Status Codes

Il limite di velocità è stato superato.

Sicurezza

Ocp-Apim-Subscription-Key

Type: apiKey
In: header

Esempio

Successful Query

Sample Request

POST {Endpoint}/speaker/identification/v2.0/text-independent/profiles/identifySingleSpeaker?profileIds=3669fa29-1bf3-45ad-beea-6b348d058d7e,111f427c-3791-468f-b709-fcef7660fff9,0e196cd9-32d5-4883-8631-54a0e7c7cb3d,0e196cd9-32d5-4883-8631-54a0e7c7cb3d,726e57d9-04e0-4214-b482-7f786fa83560,f95189fd-1bf5-4485-9c2e-e5897e0c98ca
Ocp-Apim-Subscription-Key: {API key}
"{binary file date}"

Sample Response

Content-Type: application/json
{
  "identifiedProfile": {
    "profileId": "111f427c-3791-468f-b709-fcef7660fff9",
    "score": 0.63
  },
  "profilesRanking": [
    {
      "profileId": "111f427c-3791-468f-b709-fcef7660fff9",
      "score": 0.63
    },
    {
      "profileId": "3669fa29-1bf3-45ad-beea-6b348d058d7e",
      "score": 0.49
    },
    {
      "profileId": "0e196cd9-32d5-4883-8631-54a0e7c7cb3d",
      "score": 0.4
    },
    {
      "profileId": "726e57d9-04e0-4214-b482-7f786fa83560",
      "score": 0.1
    },
    {
      "profileId": "f95189fd-1bf5-4485-9c2e-e5897e0c98ca",
      "score": 0.03
    }
  ]
}
Content-Type: application/json
{
  "error": {
    "code": "InvalidRequest",
    "message": "Profile is not enrolled."
  }
}
Content-Type: application/json
{
  "error": {
    "code": "Unauthorized",
    "message": "Request is not authorized. Make sure subscription key is included and valid."
  }
}
Content-Type: application/json
{
  "error": {
    "code": "UnsupportedMediaType",
    "message": "Unsupported media type. Only 'audio/wav; codecs=audio/pcm' is accepted."
  }
}
Content-Type: application/json
{
  "error": {
    "code": "RateLimit",
    "message": "Rate limit is exceeded."
  }
}
Content-Type: application/json
{
  "error": {
    "code": "InternalServerError",
    "message": "Internal Server Error."
  }
}

Definizioni

Error
IdentifiedSingleSpeakerInfo
IdentifyInfo

Informazioni del parlante identificate

Error

Name Type Description
error

IdentifiedSingleSpeakerInfo

Name Type Description
identifiedProfile

Oggetto contenente i dati del profilo identificato.

profilesRanking

Oggetto contenente i dati dei primi 5 profili (incluso il profilo identificato) ordinati in ordine decrescente in base al punteggio.

IdentifyInfo

Informazioni del parlante identificate

Name Type Description
profileId
  • string

ID del profilo identificato. Se non viene identificato alcun candidato come parlante corretto, il valore viene impostato su un GUID vuoto.

score
  • number

Numero float che indica la somiglianza tra audio di input e stampa vocale di destinazione. Questo numero deve essere compreso tra 0 e 1. Un numero più elevato indica una somiglianza maggiore.