Text Independent - Identify Single Speaker

Identificar perfil de alto-falante único
Identifica quem está falando em áudio de entrada entre uma lista de perfis candidatos.

Limitações:

  • O comprimento mínimo de entrada de áudio é de 1 segundo

  • O comprimento máximo de entrada de áudio é de 120 segundos

  • A contagem mínima de palestrantes candidatos é 1

  • A contagem máxima de palestrantes candidatos é de 50

  • O comprimento mínimo efetivo da fala (excluindo o silêncio e outros quadros que não são de fala) é de 4 segundos Essa limitação pode ser desabilitada definindo "ignoreMinLength" como true.

  • A taxa mínima de sinal de áudio para ruído (SNR) é de 2dB

POST {endpoint}/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds={profileIds}
POST {endpoint}/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds={profileIds}&ignoreMinLength={ignoreMinLength}

Parâmetros de URI

Nome Em Obrigatório Tipo Description
endpoint
path True

string

Pontos de extremidade dos Serviços Cognitivos com suporte (protocolo e nome do host, por exemplo: https://westus.api.cognitive.microsoft.com).

api-version
query True

string

Especifica a versão da operação a ser usada para esta solicitação.

profileIds
query True

string[]

IDs de perfil delimitadas por vírgulas. O número máximo com suporte é de 50 IDs.

ignoreMinLength
query

boolean

Se for true, a quantidade mínima de fala necessária para identificação será ignorada. O padrão é false.

Cabeçalho da solicitação

Media Types: "audio/wav; codecs=audio/pcm"

Nome Obrigatório Tipo Description
Ocp-Apim-Subscription-Key True

string

Corpo da solicitação

Media Types: "audio/wav; codecs=audio/pcm"

Nome Tipo Description
audioData

object

Arquivo de áudio binário. Os formatos com suporte são áudio/wav; codecs=audio/pcm. Dá suporte a áudio de até 5 MB.

Respostas

Nome Tipo Description
200 OK

IdentifiedSingleSpeakerInfo

OK

Other Status Codes

SpeakerErrorInfo

Falha

Headers

x-ms-error-code: string

Segurança

Ocp-Apim-Subscription-Key

Type: apiKey
In: header

Exemplos

Successful Query

Sample Request

POST https://westus.api.cognitive.microsoft.com/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds=3669fa29-1bf3-45ad-beea-6b348d058d7e,111f427c-3791-468f-b709-fcef7660fff9,0e196cd9-32d5-4883-8631-54a0e7c7cb3d,0e196cd9-32d5-4883-8631-54a0e7c7cb3d,726e57d9-04e0-4214-b482-7f786fa83560,f95189fd-1bf5-4485-9c2e-e5897e0c98ca


"{binary file date}"

Sample Response

Content-Type: application/json
{
  "identifiedProfile": {
    "profileId": "111f427c-3791-468f-b709-fcef7660fff9",
    "score": 0.63
  },
  "profilesRanking": [
    {
      "profileId": "111f427c-3791-468f-b709-fcef7660fff9",
      "score": 0.63
    },
    {
      "profileId": "3669fa29-1bf3-45ad-beea-6b348d058d7e",
      "score": 0.49
    },
    {
      "profileId": "0e196cd9-32d5-4883-8631-54a0e7c7cb3d",
      "score": 0.4
    },
    {
      "profileId": "726e57d9-04e0-4214-b482-7f786fa83560",
      "score": 0.1
    },
    {
      "profileId": "f95189fd-1bf5-4485-9c2e-e5897e0c98ca",
      "score": 0.03
    }
  ]
}
Content-Type: application/json
x-ms-error-code: Error Code
{
  "error": {
    "code": "Error Code",
    "message": "Erro Messae"
  }
}

Definições

Nome Description
Error
IdentifiedSingleSpeakerInfo
IdentifyInfo

Informações do alto-falante identificadas

SpeakerErrorInfo

Mensagem de erro do locutor

Error

Nome Tipo Description
code

string

message

string

IdentifiedSingleSpeakerInfo

Nome Tipo Description
identifiedProfile

IdentifyInfo

Objeto que contém dados do perfil identificado.

profilesRanking

IdentifyInfo[]

Objeto que contém dados dos cinco principais perfis (incluindo o perfil identificado) classificados em ordem decrescente por pontuação.

IdentifyInfo

Informações do alto-falante identificadas

Nome Tipo Description
profileId

string

ID do identificado do perfil. Se nenhum candidato for identificado como o alto-falante certo, o valor será definido como GUID vazio.

score

number

Um número float que indica a similaridade entre o áudio de entrada e a impressão de voz direcionada. Esse número deve estar entre 0 e 1. Um número maior significa maior semelhança.

SpeakerErrorInfo

Mensagem de erro do locutor

Nome Tipo Description
error

Error