Sprekerherkenning-API-previewSpeaker Recognition API - Preview

Speaker Recognition Api's zijn Cloud-Api's die de geavanceerde AI-algoritmen bieden voor de verificatie van de spreker en de identificatie van de spreker.Speaker Recognition APIs are cloud-based APIs that provide the advanced AI algorithms for speaker verification and speaker identification. Speaker Recognition is onderverdeeld in twee categorieën: luidspreker verificatie en identificatie van de spreker.Speaker Recognition is divided into two categories: speaker verification and speaker identification.

SprekercontroleSpeaker Verification

Voice heeft unieke kenmerken die kunnen worden gekoppeld aan een individu.Voice has unique characteristics that can be associated with an individual. Toepassingen kunnen Voice gebruiken als een extra factor voor verificatie, in scenario's zoals call centers en webservices.Applications can use voice as an additional factor for verification, in scenarios like call centers and web services.

Speaker Verification-Api's fungeren als een intelligent hulp programma om gebruikers te helpen bij het controleren van de spraak-en spraak wachtwoordzin.Speaker Verification APIs serve as an intelligent tool to help verify users using both their voice and speech passphrases.

RegistratieEnrollment

Inschrijving voor luidspreker verificatie is tekst afhankelijk, wat inhoudt dat de luid sprekers een specifieke wachtwoordzin moeten kiezen die tijdens de inschrijvings-en verificatie fase moet worden gebruikt.Enrollment for speaker verification is text-dependent, which means speakers need to choose a specific passphrase to use during both enrollment and verification phases.

In de inschrijvings fase van de spreker wordt de stem van de spreker vastgelegd met een specifieke woord groep.In the speaker enrollment phase, the speaker's voice is recorded saying a specific phrase. Spraak functies worden geëxtraheerd om een unieke spraak handtekening te vormen terwijl de gekozen woord groep wordt herkend.Voice features are extracted to form a unique voice signature while the chosen phrase is recognized. De gegevens voor de registratie van de spreker worden samen gebruikt om de spreker te controleren.Together, this speaker enrollment data would be used to verify the speaker. De gegevens voor de registratie van de speaker worden opgeslagen in een beveiligd systeem.The speaker enrollment data are stored in a secured system. De klant bepaalt hoelang deze moet worden bewaard.The Customer controls how long it should be retained. Klanten kunnen inschrijvings gegevens voor individuele sprekers maken, bijwerken en verwijderen via API-aanroepen.Customers can create, update, and remove enrollment data for individual speakers through API calls. Wanneer het abonnement wordt verwijderd, worden alle gegevens over de registratie van de sprekernotities die zijn gekoppeld aan het abonnement, ook verwijderd.When the subscription is deleted, all the speaker enrollment data associated with the subscription will also be deleted.

Klanten moeten ervoor zorgen dat ze de juiste machtigingen hebben ontvangen van de gebruikers voor een luidspreker verificatie.Customers should ensure they have received the appropriate permissions from the users for speaker verification.

VerificatieVerification

In de verificatie fase moet de klant de luidspreker verificatie-API aanroepen met de ID die aan de persoon is gekoppeld om te worden geverifieerd.In the verification phase, the Customer should call the speaker verification API with the ID associated with the individual to be verified. De service extraheert spraak functies en de wachtwoordzin van de invoer spraak opname.The service extracts voice features and the passphrase from the input speech recording. Vervolgens worden de functies vergeleken met de corresponderende elementen van de gegevens van de speaker registratie voor de spreker die de klant wil controleren en vindt deze een overeenkomst.Then it compares the features against the corresponding elements of the speaker enrollment data for the speaker the Customer is seeking to verify and determines any match. Het antwoord retourneert ' Accept ' of ' afwijzen ' met verschillende betrouwbaarheids niveaus.The response returns "accept" or "reject" with different confidence levels. De klant bepaalt vervolgens hoe de resultaten moeten worden gebruikt om te bepalen of deze persoon de Inge schreven spreker is.The Customer then determines how to use the results to help decide whether this person is the enrolled speaker.

Het betrouwbaarheids niveau voor drempel waarden moet worden ingesteld op basis van het scenario en andere verificatie factoren die worden gebruikt.The threshold confidence level should be set based on the scenario and other verification factors that are being used. U wordt aangeraden met het betrouwbaarheids niveau te experimenteren en de juiste instelling voor elke toepassing te overwegen.We recommend you experiment with the confidence level and consider the appropriate setting for each application. De Api's zijn niet bedoeld om te bepalen of de audio afkomstig is van een live persoon of een imitatie of een registratie van een Inge schreven spreker.The APIs are not intended to determine whether the audio is from a live person or an imitation or a recording of an enrolled speaker.

De service behoudt de spraak opname of de uitgepakte spraak functies die tijdens de verificatie fase naar de service worden verzonden.The service does not retain the speech recording or the extracted voice features that are sent to the service during the verification phase.

Raadpleeg de API Spreker - Verificatie voor meer informatie over sprekercontrole.For more details about speaker verification, please refer to the API Speaker - Verification.

SprekeridentificatieSpeaker Identification

Toepassingen kunnen spraak gebruiken om "wie wordt gepraat" te identificeren op basis van een groep Inge schreven luid sprekers.Applications can use voice to identify "who is speaking" given a group of enrolled speakers. Speaker Identification-Api's kunnen worden gebruikt in scenario's als productiviteit voor vergaderingen, personalisatie en Call Center transcriptie.Speaker Identification APIs could be used in scenarios like meeting productivity, personalization, and call center transcription.

RegistratieEnrollment

Registratie voor sprekeridentificatie is tekstonafhankelijk, wat betekent dat er geen beperkingen zijn voor hetgeen de spreker in de audio zegt.Enrollment for speaker identification is text-independent, which means that there are no restrictions on what the speaker says in the audio. Er is geen wachtwoordzin vereist.No passphrase is required.

In de inschrijvings fase wordt de stem van de spreker vastgelegd en worden de spraak functies geëxtraheerd om een unieke spraak handtekening te vormen.In the enrollment phase, the speaker's voice is recorded, and voice features are extracted to form a unique voice signature. De spraak geluiden en-functies die worden geëxtraheerd, worden opgeslagen in een beveiligd systeem.The speech audio and features extracted are stored in a secured system. De klant bepaalt hoelang deze wordt bewaard.The Customer controls how long it is retained. Klanten kunnen deze gegevens over de registratie van de spreker voor individuele sprekers maken, bijwerken en verwijderen via API-aanroepen.Customers can create, update, and remove this speaker enrollment data for individual speakers through API calls. Wanneer het abonnement wordt verwijderd, worden alle gegevens over de registratie van de sprekernotities die zijn gekoppeld aan het abonnement, ook verwijderd.When the subscription is deleted, all the speaker enrollment data associated with the subscription will also be deleted.

Klanten moeten ervoor zorgen dat ze de juiste machtigingen hebben ontvangen van de gebruikers voor het identificeren van de speaker.Customers should ensure they have received the appropriate permissions from the users for speaker identification.

AanduidingIdentification

In de identificatie fase haalt de luidspreker Identification-Service spraak functies uit de invoer spraak opname.In the identification phase, the speaker identification service extracts voice features from the input speech recording. Vervolgens worden de functies vergeleken met de inschrijvings gegevens van de opgegeven lijst met luid sprekers.Then it compares the features against the enrollment data of the specified list of speakers. Als er een overeenkomst wordt gevonden met een Inge schreven spreker, retourneert het antwoord de ID van de spreker met een betrouwbaarheids niveau.When a match is found with an enrolled speaker, the response returns the ID of the speaker with a confidence level. Anders retourneert het antwoord "afwijzen" wanneer geen enkele spreker overeenkomt met een Inge schreven spreker.Otherwise, the response returns "reject" when no speaker is a match to an enrolled speaker.

Het betrouwbaarheids niveau van de drempel waarde moet worden ingesteld op basis van het scenario.The threshold confidence level should be set based on the scenario. U wordt aangeraden met het betrouwbaarheids niveau te experimenteren en de juiste instelling voor elke toepassing te overwegen.We recommend you experiment with the confidence level and consider the appropriate setting for each application. De Api's zijn niet bedoeld om te bepalen of de audio afkomstig is van een live persoon of een imitatie of een registratie van een Inge schreven spreker.The APIs are not intended to determine whether the audio is from a live person or an imitation or a recording of an enrolled speaker.

De service behoudt de spraak opname of de uitgepakte spraak functies die naar de service worden verzonden voor de identificatie fase.The service does not retain the speech recording or the extracted voice features that are sent to the service for the identification phase.

Raadpleeg de API  Spreker - Identificatie voor meer informatie over sprekeridentificatie.For more details about speaker identification, please refer to the API Speaker - Identification.