Text Independent - Identify Single Speaker

Profiel voor één spreker identificeren
Identificeert wie er in invoeraudio spreekt in een lijst met kandidaatprofielen.

Beperkingen:

  • Minimale lengte voor audio-invoer is 1 seconde

  • Maximale lengte van audio-invoer is 120 seconden

  • Het minimumaantal sprekers voor kandidaten is 1

  • Het maximumaantal sprekers voor kandidaten is 50

  • Minimale effectieve spraaklengte (met uitzondering van stilte en andere niet-spraakframes) is 4 seconden Deze beperking kan worden uitgeschakeld door ignoreMinLength in te stellen op true.

  • De minimale signaal-ruisverhouding (SNR) voor audio is 2dB

POST {endpoint}/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds={profileIds}
POST {endpoint}/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds={profileIds}&ignoreMinLength={ignoreMinLength}

URI-parameters

Name In Vereist Type Description
endpoint
path True

string

Ondersteunde Cognitive Services-eindpunten (protocol en hostnaam, bijvoorbeeld: https://westus.api.cognitive.microsoft.com).

api-version
query True

string

Hiermee geeft u de versie van de bewerking te gebruiken voor deze aanvraag.

profileIds
query True

string[]

Door komma's gescheiden profiel-id's. Maximaal ondersteund aantal is 50 id's.

ignoreMinLength
query

boolean

Indien waar, wordt de minimale hoeveelheid spraak die nodig is voor identificatie overgeslagen. De standaardinstelling is onwaar.

Aanvraagkoptekst

Media Types: "audio/wav; codecs=audio/pcm"

Name Vereist Type Description
Ocp-Apim-Subscription-Key True

string

Aanvraagbody

Media Types: "audio/wav; codecs=audio/pcm"

Name Type Description
audioData

object

Binair audiobestand. Ondersteunde indelingen zijn audio/wav; codecs=audio/pcm. Ondersteunt audio tot 5 MB.

Antwoorden

Name Type Description
200 OK

IdentifiedSingleSpeakerInfo

OK

Other Status Codes

SpeakerErrorInfo

Fout

Headers

x-ms-error-code: string

Beveiliging

Ocp-Apim-Subscription-Key

Type: apiKey
In: header

Voorbeelden

Successful Query

Sample Request

POST https://westus.api.cognitive.microsoft.com/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds=3669fa29-1bf3-45ad-beea-6b348d058d7e,111f427c-3791-468f-b709-fcef7660fff9,0e196cd9-32d5-4883-8631-54a0e7c7cb3d,0e196cd9-32d5-4883-8631-54a0e7c7cb3d,726e57d9-04e0-4214-b482-7f786fa83560,f95189fd-1bf5-4485-9c2e-e5897e0c98ca


"{binary file date}"

Sample Response

Content-Type: application/json
{
  "identifiedProfile": {
    "profileId": "111f427c-3791-468f-b709-fcef7660fff9",
    "score": 0.63
  },
  "profilesRanking": [
    {
      "profileId": "111f427c-3791-468f-b709-fcef7660fff9",
      "score": 0.63
    },
    {
      "profileId": "3669fa29-1bf3-45ad-beea-6b348d058d7e",
      "score": 0.49
    },
    {
      "profileId": "0e196cd9-32d5-4883-8631-54a0e7c7cb3d",
      "score": 0.4
    },
    {
      "profileId": "726e57d9-04e0-4214-b482-7f786fa83560",
      "score": 0.1
    },
    {
      "profileId": "f95189fd-1bf5-4485-9c2e-e5897e0c98ca",
      "score": 0.03
    }
  ]
}
Content-Type: application/json
x-ms-error-code: Error Code
{
  "error": {
    "code": "Error Code",
    "message": "Erro Messae"
  }
}

Definities

Name Description
Error
IdentifiedSingleSpeakerInfo
IdentifyInfo

Geïdentificeerde sprekergegevens

SpeakerErrorInfo

Foutbericht van spreker

Error

Name Type Description
code

string

message

string

IdentifiedSingleSpeakerInfo

Name Type Description
identifiedProfile

IdentifyInfo

Object met gegevens van geïdentificeerd profiel.

profilesRanking

IdentifyInfo[]

Object met gegevens van de top 5 profielen (inclusief geïdentificeerd profiel) gesorteerd in aflopende volgorde op score.

IdentifyInfo

Geïdentificeerde sprekergegevens

Name Type Description
profileId

string

Id van geïdentificeerd profiel. Als er geen kandidaat wordt geïdentificeerd als de juiste spreker, wordt de waarde ingesteld op lege GUID.

score

number

Een zwevend getal dat de overeenkomst aangeeft tussen invoeraudio en gerichte spraakafdruk. Dit getal moet tussen 0 en 1 zijn. Een hoger getal betekent een hogere gelijkenis.

SpeakerErrorInfo

Foutbericht van spreker

Name Type Description
error

Error