Rozhraní API pro rozpoznání mluvčíhoSpeaker Recognition API

Vítají vás rozhraní API pro rozpoznávání mluvčího služby Azure Cognitive Services.Welcome to the Azure Cognitive Services Speaker Recognition APIs. Rozhraní API pro rozpoznávání mluvčího jsou cloudová rozhraní API, která poskytují nejpokročilejší algoritmy pro ověření a identifikaci mluvčího.Speaker Recognition APIs are cloud-based APIs that provide the most advanced algorithms for speaker verification and speaker identification. Rozpoznávání mluvčího lze rozdělit do dvou kategorií: ověření mluvčího a identifikace mluvčího.Speaker Recognition can be divided into two categories: speaker verification and speaker identification.

Ověření mluvčíhoSpeaker Verification

Hlas má, stejně jako otisk prstu, jedinečné rysy, které je možné použít k identifikaci osoby.Voice has unique characteristics that can be used to identify a person, just like a fingerprint. Z použití hlasu jako signálu pro řízení přístupu a ověřování se stává nový inovativní nástroj – v podstatě nabízí vyšší úroveň zabezpečení, která zákazníkům zjednodušuje proces ověřování.Using voice as a signal for access control and authentication scenarios has emerged as a new innovative tool –essentially offering a level up in security that simplifies the authentication experience for customers.

Rozhraní API pro ověření mluvčího mohou uživatele automaticky ověřit pomocí hlasu nebo řeči.Speaker Verification APIs can automatically verify and authenticate users using their voice or speech.

RegistraceEnrollment

Registrace ověření mluvčího je závislá na textu. To znamená, že mluvčí si musí zvolit konkrétní frázi, která se použije jak při registraci, tak ve fázi ověřování.Enrollment for speaker verification is text-dependent, which means speakers need to choose a specific pass phrase to use during both enrollment and verification phases.

Při registraci se nahraje hlas mluvčího, jak říká nějakou frázi, a potom se z této fráze extrahuje několik rysů, podle kterých se fráze rozpozná.In enrollment, the speaker's voice is recorded saying a specific phrase, then a number of features are extracted and the chosen phrase is recognized. Společně tyto extrahované rysy a zvolená fráze vytvoří jedinečný hlasový podpis.Together, both extracted features and the chosen phrase form a unique voice signature.

OvěřeníVerification

Při ověřování se vstupní hlas a fráze porovná s hlasovým podpisem a frází registrace. Ověří se tak, zda jde o stejnou osobu a zda používá správnou frázi.In verification, an input voice and phrase are compared against the enrollment's voice signature and phrase –in order to verify whether or not they are from the same person, and if they are saying the correct phrase.

Další podrobnosti o ověření mluvčího najdete na stránce rozhraní API pro ověření mluvčího.For more details about speaker verification, please refer to the API Speaker - Verification.

Identifikace mluvčíhoSpeaker Identification

Rozhraní API pro identifikaci mluvčího mohou ze skupiny potenciálních mluvčích automaticky identifikovat osobu mluvící na zvukovém souboru.Speaker Identification APIs can automatically identify the person speaking in an audio file, given a group of prospective speakers. Vstupní zvuk se spáruje s poskytnutou skupinou mluvčích, a pokud se zjistí shoda, bude výsledkem identita mluvčího.The input audio is paired against the provided group of speakers, and in the case that there is a match found, the speaker’s identity is returned.

Všichni mluvčí by měli nejprve projít registrací, aby se jejich hlas zaregistroval do systému a vytvořil se otisk hlasu.All speakers should go through an enrollment process first to get their voice registered to the system, and have a voice print created.

RegistraceEnrollment

Registrace identifikace mluvčího je na textu nezávislá, což znamená, že neexistují žádná omezení, co může mluvčí říct.Enrollment for speaker identification is text-independent, which means that there are no restrictions on what the speaker says in the audio. Hlas mluvčího se nahraje a pak se z něj extrahuje několik rysů, které vytvoří jedinečný hlasový podpis.The speaker's voice is recorded, and a number of features are extracted to form a unique voice signature.

RozpoznáníRecognition

Během rozpoznání je k dispozici zvuk neznámého mluvčího a potenciální skupina mluvčích.The audio of the unknown speaker, together with the prospective group of speakers, is provided during recognition. Vstupní hlas se porovná se všemi mluvčími, aby se rozpoznalo, komu hlas patří, a pokud se najde shoda, výsledkem bude identita mluvčího.The input voice is compared against all speakers in order to determine whose voice it is, and if there is a match found, the identity of the speaker is returned.

Další podrobnosti o identifikaci mluvčího najdete na stránce rozhraní API pro identifikaci mluvčího.For more details about speaker identification, please refer to the API Speaker - Identification.