Text Independent - Identify Single Speaker

Identifikasi Profil Pembicara Tunggal
Mengidentifikasi siapakah yang berbicara dalam audio input di antara daftar profil kandidat.

Keterbatasan:

  • Panjang input audio minimum adalah 1 detik

  • Panjang input audio maksimum adalah 120 detik

  • Jumlah pembicara kandidat minimum adalah 1

  • Jumlah pembicara kandidat maksimum adalah 50

  • Panjang ucapan efektif minimum (tidak termasuk keheningan dan bingkai non-ucapan lainnya) adalah 4 detik Batasan ini dapat dinonaktifkan dengan mengatur "ignoreMinLength" ke true.

  • Rasio Sinyal ke kebisingan (SNR) audio minimum adalah 2dB

POST {endpoint}/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds={profileIds}
POST {endpoint}/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds={profileIds}&ignoreMinLength={ignoreMinLength}

Parameter URI

Nama Dalam Diperlukan Jenis Deskripsi
endpoint
path True

string

Titik akhir Cognitive Services yang didukung (protokol dan nama host, misalnya: https://westus.api.cognitive.microsoft.com).

api-version
query True

string

Menentukan versi operasi yang akan digunakan untuk permintaan ini.

profileIds
query True

string[]

ID profil yang dibatasi koma. Jumlah maksimum yang didukung adalah 50 ID.

ignoreMinLength
query

boolean

Jika true, jumlah minimum ucapan yang diperlukan untuk identifikasi dilewati. Defaultnya adalah false.

Header Permintaan

Media Types: "audio/wav; codecs=audio/pcm"

Nama Diperlukan Jenis Deskripsi
Ocp-Apim-Subscription-Key True

string

Isi Permintaan

Media Types: "audio/wav; codecs=audio/pcm"

Nama Jenis Deskripsi
audioData

object

File audio biner. Format yang didukung adalah audio/wav; codecs=audio/pcm. Mendukung audio hingga 5MB.

Respons

Nama Jenis Deskripsi
200 OK

IdentifiedSingleSpeakerInfo

OK

Other Status Codes

SpeakerErrorInfo

Kegagalan

Headers

x-ms-error-code: string

Keamanan

Ocp-Apim-Subscription-Key

Type: apiKey
In: header

Contoh

Successful Query

Sample Request

POST https://westus.api.cognitive.microsoft.com/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds=3669fa29-1bf3-45ad-beea-6b348d058d7e,111f427c-3791-468f-b709-fcef7660fff9,0e196cd9-32d5-4883-8631-54a0e7c7cb3d,0e196cd9-32d5-4883-8631-54a0e7c7cb3d,726e57d9-04e0-4214-b482-7f786fa83560,f95189fd-1bf5-4485-9c2e-e5897e0c98ca


"{binary file date}"

Sample Response

Content-Type: application/json
{
  "identifiedProfile": {
    "profileId": "111f427c-3791-468f-b709-fcef7660fff9",
    "score": 0.63
  },
  "profilesRanking": [
    {
      "profileId": "111f427c-3791-468f-b709-fcef7660fff9",
      "score": 0.63
    },
    {
      "profileId": "3669fa29-1bf3-45ad-beea-6b348d058d7e",
      "score": 0.49
    },
    {
      "profileId": "0e196cd9-32d5-4883-8631-54a0e7c7cb3d",
      "score": 0.4
    },
    {
      "profileId": "726e57d9-04e0-4214-b482-7f786fa83560",
      "score": 0.1
    },
    {
      "profileId": "f95189fd-1bf5-4485-9c2e-e5897e0c98ca",
      "score": 0.03
    }
  ]
}
Content-Type: application/json
x-ms-error-code: Error Code
{
  "error": {
    "code": "Error Code",
    "message": "Erro Messae"
  }
}

Definisi

Nama Deskripsi
Error
IdentifiedSingleSpeakerInfo
IdentifyInfo

Info pembicara yang diidentifikasi

SpeakerErrorInfo

Pesan kesalahan pembicara

Error

Nama Jenis Deskripsi
code

string

message

string

IdentifiedSingleSpeakerInfo

Nama Jenis Deskripsi
identifiedProfile

IdentifyInfo

Objek yang berisi data profil yang diidentifikasi.

profilesRanking

IdentifyInfo[]

Objek yang berisi data dari 5 profil teratas (termasuk profil yang diidentifikasi) diurutkan dalam urutan menuram menurut skor.

IdentifyInfo

Info pembicara yang diidentifikasi

Nama Jenis Deskripsi
profileId

string

ID profil yang diidentifikasi. Jika tidak ada kandidat yang diidentifikasi sebagai pembicara yang tepat, nilai diatur ke GUID kosong.

score

number

Angka float yang menunjukkan kesamaan antara audio input dan cetakan suara yang ditargetkan. Angka ini harus antara 0 dan 1. Angka yang lebih tinggi berarti kesamaan yang lebih tinggi.

SpeakerErrorInfo

Pesan kesalahan pembicara

Nama Jenis Deskripsi
error

Error