Text Independent - Identify Single Speaker

Identifier le profil d’orateur unique
Identifie la personne qui parle dans l’audio d’entrée parmi une liste de profils de candidats.

Limites :

  • La longueur minimale d’entrée audio est de 1 seconde

  • La longueur maximale d’entrée audio est de 120 secondes

  • Le nombre minimal d’orateurs candidats est de 1

  • Le nombre maximal d’orateurs candidats est de 50

  • La longueur minimale effective de la parole (à l’exception du silence et d’autres images non vocales) est de 4 secondes Cette limitation peut être désactivée en définissant « ignoreMinLength » sur true.

  • Le rapport signal/bruit (SNR) audio minimal est de 2 dB

POST {endpoint}/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds={profileIds}
POST {endpoint}/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds={profileIds}&ignoreMinLength={ignoreMinLength}

Paramètres URI

Nom Dans Obligatoire Type Description
endpoint
path True

string

Points de terminaison Cognitive Services pris en charge (protocole et nom d’hôte, par exemple : https://westus.api.cognitive.microsoft.com).

api-version
query True

string

Spécifie la version de l'opération à utiliser pour cette demande.

profileIds
query True

string[]

ID de profil délimité par des virgules. Le nombre maximal pris en charge est de 50 ID.

ignoreMinLength
query

boolean

Si la valeur est true, la quantité minimale de parole nécessaire à l’identification est ignorée. La valeur par défaut est false.

En-tête de la demande

Media Types: "audio/wav; codecs=audio/pcm"

Nom Obligatoire Type Description
Ocp-Apim-Subscription-Key True

string

Corps de la demande

Media Types: "audio/wav; codecs=audio/pcm"

Nom Type Description
audioData

object

Fichier audio binaire. Les formats pris en charge sont audio/wav ; codecs=audio/pcm. Prend en charge l’audio jusqu’à 5 Mo.

Réponses

Nom Type Description
200 OK

IdentifiedSingleSpeakerInfo

Ok

Other Status Codes

SpeakerErrorInfo

Échec

Headers

x-ms-error-code: string

Sécurité

Ocp-Apim-Subscription-Key

Type: apiKey
In: header

Exemples

Successful Query

Sample Request

POST https://westus.api.cognitive.microsoft.com/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds=3669fa29-1bf3-45ad-beea-6b348d058d7e,111f427c-3791-468f-b709-fcef7660fff9,0e196cd9-32d5-4883-8631-54a0e7c7cb3d,0e196cd9-32d5-4883-8631-54a0e7c7cb3d,726e57d9-04e0-4214-b482-7f786fa83560,f95189fd-1bf5-4485-9c2e-e5897e0c98ca


"{binary file date}"

Sample Response

Content-Type: application/json
{
  "identifiedProfile": {
    "profileId": "111f427c-3791-468f-b709-fcef7660fff9",
    "score": 0.63
  },
  "profilesRanking": [
    {
      "profileId": "111f427c-3791-468f-b709-fcef7660fff9",
      "score": 0.63
    },
    {
      "profileId": "3669fa29-1bf3-45ad-beea-6b348d058d7e",
      "score": 0.49
    },
    {
      "profileId": "0e196cd9-32d5-4883-8631-54a0e7c7cb3d",
      "score": 0.4
    },
    {
      "profileId": "726e57d9-04e0-4214-b482-7f786fa83560",
      "score": 0.1
    },
    {
      "profileId": "f95189fd-1bf5-4485-9c2e-e5897e0c98ca",
      "score": 0.03
    }
  ]
}
Content-Type: application/json
x-ms-error-code: Error Code
{
  "error": {
    "code": "Error Code",
    "message": "Erro Messae"
  }
}

Définitions

Nom Description
Error
IdentifiedSingleSpeakerInfo
IdentifyInfo

Informations sur l’orateur identifié

SpeakerErrorInfo

Message d’erreur de l’orateur

Error

Nom Type Description
code

string

message

string

IdentifiedSingleSpeakerInfo

Nom Type Description
identifiedProfile

IdentifyInfo

Objet contenant des données de profil identifié.

profilesRanking

IdentifyInfo[]

Objet contenant les données des 5 premiers profils (y compris le profil identifié) triés dans l’ordre décroissant par score.

IdentifyInfo

Informations sur l’orateur identifié

Nom Type Description
profileId

string

ID de identifié du profil. Si aucun candidat n’est identifié comme le bon orateur, la valeur est définie sur GUID vide.

score

number

Nombre float indiquant la similarité entre l’audio d’entrée et l’impression vocale ciblée. Ce nombre doit être compris entre 0 et 1. Un nombre plus élevé signifie une similarité plus élevée.

SpeakerErrorInfo

Message d’erreur de l’orateur

Nom Type Description
error

Error