Speaker Recognition APISpeaker Recognition API

Bienvenido a Microsoft Speaker Recognition API.Welcome to the Microsoft Speaker Recognition APIs. Las Speaker Recognition API son API basadas en la nube que proporcionan los algoritmos más avanzados para la comprobación e identificación del hablante.Speaker Recognition APIs are cloud-based APIs that provide the most advanced algorithms for speaker verification and speaker identification. Speaker Recognition puede dividirse en dos categorías: verificación del hablante y la identificación del hablante.Speaker Recognition can be divided into two categories: speaker verification and speaker identification.

Verificación del hablanteSpeaker Verification

La voz tiene características únicas que se pueden usar para identificar a una persona, de manera similar a una huella digital.Voice has unique characteristics that can be used to identify a person, just like a fingerprint. La utilización de la voz como señal para el control de acceso y los escenarios de autenticación ha emergido como una nueva herramienta innovadora; que ofrece, en esencia, un nivel de seguridad superior que simplifica la experiencia de autenticación de los clientes.Using voice as a signal for access control and authentication scenarios has emerged as a new innovative tool –essentially offering a level up in security that simplifies the authentication experience for customers.

Las Speaker Verification API pueden comprobar y autenticar automáticamente los usuarios a través de su voz.Speaker Verification APIs can automatically verify and authenticate users using their voice or speech.

InscripciónEnrollment

La inscripción de la comprobación del hablante depende del texto, lo que significa que los hablantes deben elegir una frase de contraseña específica para usar durante las fases de inscripción y comprobación.Enrollment for speaker verification is text-dependent, which means speakers need to choose a specific pass phrase to use during both enrollment and verification phases.

En la inscripción, la voz del hablante se graba diciendo una frase específica y, luego, se extraen diversas características y se reconoce la frase elegida.In enrollment, the speaker's voice is recorded saying a specific phrase, then a number of features are extracted and the chosen phrase is recognized. En conjunto, las características extraídas y la frase elegida conforman una firma de voz única.Together, both extracted features and the chosen phrase form a unique voice signature.

ComprobaciónVerification

#

En la comprobación, se compara una frase y una voz de entrada con la firma de voz y la frase de la inscripción, con el fin de comprobar si pertenecen o no a la misma persona y si se dice la frase correcta.In verification, an input voice and phrase are compared against the enrollment's voice signature and phrase –in order to verify whether or not they are from the same person, and if they are saying the correct phrase.

Para obtener más información sobre la verificación del hablante, consulte la API Speaker - Verification.For more details about speaker verification, please refer to the API Speaker - Verification.

Identificación del hablanteSpeaker Identification

Las Speaker Identification API pueden identificar automáticamente a la persona que habla en un archivo de audio dentro de un grupo de posibles hablantes.Speaker Identification APIs can automatically identify the person speaking in an audio file, given a group of prospective speakers. El audio de entrada se compara con el grupo de hablantes proporcionado y, en caso de que exista una coincidencia, se devuelve la identidad del hablante.The input audio is paired against the provided group of speakers, and in the case that there is a match found, the speaker’s identity is returned.

Todos los hablantes deben someterse primero a un proceso de inscripción para grabar su voz en el sistema y para que se cree una huella de voz.All speakers should go through an enrollment process first to get their voice registered to the system, and have a voice print created.

InscripciónEnrollment

La inscripción para la identificación del hablante depende del texto, lo que significa que no hay restricciones con respecto a lo que el hablante dice en el audio.Enrollment for speaker identification is text-independent, which means that there are no restrictions on what the speaker says in the audio. Se graba la voz del hablante y se extraen diversas características para confirmar una firma de voz única.The speaker's voice is recorded, and a number of features are extracted to form a unique voice signature.

ReconocimientoRecognition

Durante la fase de reconocimiento, se proporciona el audio del hablante desconocido, junto con el grupo de posibles hablantes.The audio of the unknown speaker, together with the prospective group of speakers, is provided during recognition. La voz de entrada se compara con todos los hablantes a fin de determinar a quién pertenece la voz y, en caso de que se encuentre una coincidencia, se devuelve la identidad del hablante.The input voice is compared against all speakers in order to determine whose voice it is, and if there is a match found, the identity of the speaker is returned.

Para obtener más información sobre la identificación del hablante, consulte la API Speaker - Identification.For more details about speaker identification, please refer to the API Speaker - Identification.