Text Independent - Identify Single Speaker
Profiel voor één spreker identificeren
Identificeert wie er in invoeraudio spreekt in een lijst met kandidaatprofielen.
Beperkingen:
Minimale lengte voor audio-invoer is 1 seconde
Maximale lengte van audio-invoer is 120 seconden
Het minimumaantal sprekers voor kandidaten is 1
Het maximumaantal sprekers voor kandidaten is 50
Minimale effectieve spraaklengte (met uitzondering van stilte en andere niet-spraakframes) is 4 seconden Deze beperking kan worden uitgeschakeld door ignoreMinLength in te stellen op true.
De minimale signaal-ruisverhouding (SNR) voor audio is 2dB
POST {endpoint}/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds={profileIds}
POST {endpoint}/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds={profileIds}&ignoreMinLength={ignoreMinLength}
URI-parameters
Name | In | Vereist | Type | Description |
---|---|---|---|---|
endpoint
|
path | True |
string |
Ondersteunde Cognitive Services-eindpunten (protocol en hostnaam, bijvoorbeeld: https://westus.api.cognitive.microsoft.com). |
api-version
|
query | True |
string |
Hiermee geeft u de versie van de bewerking te gebruiken voor deze aanvraag. |
profile
|
query | True |
string[] |
Door komma's gescheiden profiel-id's. Maximaal ondersteund aantal is 50 id's. |
ignore
|
query |
boolean |
Indien waar, wordt de minimale hoeveelheid spraak die nodig is voor identificatie overgeslagen. De standaardinstelling is onwaar. |
Aanvraagkoptekst
Media Types: "audio/wav; codecs=audio/pcm"
Name | Vereist | Type | Description |
---|---|---|---|
Ocp-Apim-Subscription-Key | True |
string |
Aanvraagbody
Media Types: "audio/wav; codecs=audio/pcm"
Name | Type | Description |
---|---|---|
audioData |
object |
Binair audiobestand. Ondersteunde indelingen zijn audio/wav; codecs=audio/pcm. Ondersteunt audio tot 5 MB. |
Antwoorden
Name | Type | Description |
---|---|---|
200 OK |
OK |
|
Other Status Codes |
Fout Headers x-ms-error-code: string |
Beveiliging
Ocp-Apim-Subscription-Key
Type:
apiKey
In:
header
Voorbeelden
Successful Query
Sample Request
POST https://westus.api.cognitive.microsoft.com/speaker-recognition/identification/text-independent/profiles:identifySingleSpeaker?api-version=2021-09-05&profileIds=3669fa29-1bf3-45ad-beea-6b348d058d7e,111f427c-3791-468f-b709-fcef7660fff9,0e196cd9-32d5-4883-8631-54a0e7c7cb3d,0e196cd9-32d5-4883-8631-54a0e7c7cb3d,726e57d9-04e0-4214-b482-7f786fa83560,f95189fd-1bf5-4485-9c2e-e5897e0c98ca
"{binary file date}"
Sample Response
Content-Type: application/json
{
"identifiedProfile": {
"profileId": "111f427c-3791-468f-b709-fcef7660fff9",
"score": 0.63
},
"profilesRanking": [
{
"profileId": "111f427c-3791-468f-b709-fcef7660fff9",
"score": 0.63
},
{
"profileId": "3669fa29-1bf3-45ad-beea-6b348d058d7e",
"score": 0.49
},
{
"profileId": "0e196cd9-32d5-4883-8631-54a0e7c7cb3d",
"score": 0.4
},
{
"profileId": "726e57d9-04e0-4214-b482-7f786fa83560",
"score": 0.1
},
{
"profileId": "f95189fd-1bf5-4485-9c2e-e5897e0c98ca",
"score": 0.03
}
]
}
Content-Type: application/json
x-ms-error-code: Error Code
{
"error": {
"code": "Error Code",
"message": "Erro Messae"
}
}
Definities
Name | Description |
---|---|
Error | |
Identified |
|
Identify |
Geïdentificeerde sprekergegevens |
Speaker |
Foutbericht van spreker |
Error
Name | Type | Description |
---|---|---|
code |
string |
|
message |
string |
IdentifiedSingleSpeakerInfo
Name | Type | Description |
---|---|---|
identifiedProfile |
Object met gegevens van geïdentificeerd profiel. |
|
profilesRanking |
Object met gegevens van de top 5 profielen (inclusief geïdentificeerd profiel) gesorteerd in aflopende volgorde op score. |
IdentifyInfo
Geïdentificeerde sprekergegevens
Name | Type | Description |
---|---|---|
profileId |
string |
Id van geïdentificeerd profiel. Als er geen kandidaat wordt geïdentificeerd als de juiste spreker, wordt de waarde ingesteld op lege GUID. |
score |
number |
Een zwevend getal dat de overeenkomst aangeeft tussen invoeraudio en gerichte spraakafdruk. Dit getal moet tussen 0 en 1 zijn. Een hoger getal betekent een hogere gelijkenis. |
SpeakerErrorInfo
Foutbericht van spreker
Name | Type | Description |
---|---|---|
error |