Konuşmacı Tanıma API 'SI-ÖnizlemeSpeaker Recognition API - Preview

Konuşmacı Tanıma API 'Leri, konuşmacı doğrulama ve konuşmacı tanıma için gelişmiş AI algoritmaları sağlayan bulut tabanlı API 'lerdir.Speaker Recognition APIs are cloud-based APIs that provide the advanced AI algorithms for speaker verification and speaker identification. Konuşmacı Tanıma iki kategoriye ayrılmıştır: konuşmacı doğrulama ve konuşmacı tanımlama.Speaker Recognition is divided into two categories: speaker verification and speaker identification.

Konuşmacı DoğrulamaSpeaker Verification

Seste, bir biresiyle ilişkilendirilebilen benzersiz özellikler vardır.Voice has unique characteristics that can be associated with an individual. Uygulamalar, çağrı merkezleri ve Web Hizmetleri gibi senaryolarda, doğrulama için ek bir faktör olarak sesli kullanım sağlayabilir.Applications can use voice as an additional factor for verification, in scenarios like call centers and web services.

Konuşmacı Doğrulama API 'Leri, kullanıcıların hem ses hem de konuşma parolalarını kullanmasını doğrulamaya yardımcı olmak üzere akıllı bir araç olarak görev yapar.Speaker Verification APIs serve as an intelligent tool to help verify users using both their voice and speech passphrases.

KayıtEnrollment

Konuşmacı doğrulama kaydı metne bağımlıdır, bu da hoparlörlerde hem kayıt hem de doğrulama aşamaları sırasında kullanılacak belirli bir parolayı seçmesi gerektiği anlamına gelir.Enrollment for speaker verification is text-dependent, which means speakers need to choose a specific passphrase to use during both enrollment and verification phases.

Konuşmacı kayıt aşamasında, konuşmacı sesi belirli bir tümceciği belirten şekilde kaydedilir.In the speaker enrollment phase, the speaker's voice is recorded saying a specific phrase. Seçili tümcecik tanındığında, sesli Özellikler benzersiz bir ses imzası oluşturmak için ayıklanır.Voice features are extracted to form a unique voice signature while the chosen phrase is recognized. Bu konuşmacı kaydı verileri birlikte konuşmacı doğrulamak için kullanılır.Together, this speaker enrollment data would be used to verify the speaker. Konuşmacı kayıt verileri, güvenli bir sistemde depolanır.The speaker enrollment data are stored in a secured system. Müşteri ne kadar süreyle tutulacağını denetler.The Customer controls how long it should be retained. Müşteriler, API çağrıları aracılığıyla bireysel Konuşmacılar için kayıt verilerini oluşturabilir, güncelleştirebilir ve kaldırabilir.Customers can create, update, and remove enrollment data for individual speakers through API calls. Abonelik silindiğinde, abonelikle ilişkili tüm konuşmacı kaydı verileri de silinir.When the subscription is deleted, all the speaker enrollment data associated with the subscription will also be deleted.

Müşteriler, konuşmacı doğrulaması için kullanıcılardan uygun izinleri almış olduklarından emin olmalıdır.Customers should ensure they have received the appropriate permissions from the users for speaker verification.

DoğrulamaVerification

Doğrulama aşamasında, müşteri, doğrulanacak kişi ile ilişkili KIMLIKLE konuşmacı doğrulama API 'sini çağırmalıdır.In the verification phase, the Customer should call the speaker verification API with the ID associated with the individual to be verified. Hizmet, ses özelliklerini ve parolayı giriş konuşma kaydından ayıklar.The service extracts voice features and the passphrase from the input speech recording. Daha sonra, bu özellikler, müşterinin herhangi bir eşleşmeyi doğrulamak ve doğrulamak üzere aradığı konuşmacı için konuşmacı kayıt verilerinin karşılık gelen öğelerine karşı karşılaştırır.Then it compares the features against the corresponding elements of the speaker enrollment data for the speaker the Customer is seeking to verify and determines any match. Yanıt, farklı güven düzeylerine sahip "kabul et" veya "Reddet" döndürür.The response returns "accept" or "reject" with different confidence levels. Müşteri daha sonra bu kişinin kayıtlı konuşmacı olup olmadığına karar vermenize yardımcı olması için sonuçların nasıl kullanılacağını belirler.The Customer then determines how to use the results to help decide whether this person is the enrolled speaker.

Eşik güvenirlik düzeyi, kullanılan senaryoya ve diğer doğrulama faktörlerine bağlı olarak ayarlanmalıdır.The threshold confidence level should be set based on the scenario and other verification factors that are being used. Güven düzeyiyle denemeler yapmanızı ve her bir uygulama için uygun ayarı göz önünde bulundurmalarını öneririz.We recommend you experiment with the confidence level and consider the appropriate setting for each application. API 'Ler, sesin canlı bir kişiden mi yoksa bir imitation ya da kayıtlı konuşmacı kaydından mi olduğunu belirlemektir.The APIs are not intended to determine whether the audio is from a live person or an imitation or a recording of an enrolled speaker.

Hizmet, doğrulama aşamasında hizmete gönderilen konuşma kaydını veya ayıklanan ses özelliklerini korumaz.The service does not retain the speech recording or the extracted voice features that are sent to the service during the verification phase.

Konuşmacı doğrulama hakkında daha fazla ayrıntı için lütfen Konuşmacı - Doğrulama API’sine bakın.For more details about speaker verification, please refer to the API Speaker - Verification.

Konuşmacı BelirlemeSpeaker Identification

Uygulamalar, bir kayıtlı konuşmacı grubu verildiğinde "kimin konuşduğunu" belirlemek için ses kullanabilir.Applications can use voice to identify "who is speaking" given a group of enrolled speakers. Konuşmacı kimliği API 'Leri, verimlilik, kişiselleştirme ve çağrı merkezi dökümü gibi senaryolarda kullanılabilir.Speaker Identification APIs could be used in scenarios like meeting productivity, personalization, and call center transcription.

KayıtEnrollment

Konuşmacı belirleme için kayıt metinden bağımsızdır; başka bir deyişle, konuşmacının ses kaydında söyleyecekleri üzerinde bir kısıtlama yoktur.Enrollment for speaker identification is text-independent, which means that there are no restrictions on what the speaker says in the audio. Parola gerekli değildir.No passphrase is required.

Kayıt aşamasında hoparlörün sesi kaydedilir ve benzersiz bir ses imzası oluşturmak için ses özellikleri ayıklanır.In the enrollment phase, the speaker's voice is recorded, and voice features are extracted to form a unique voice signature. Konuşma sesi ve ayıklanan Özellikler güvenli bir sistemde depolanır.The speech audio and features extracted are stored in a secured system. Müşteri ne kadar süreyle tutulacağını denetler.The Customer controls how long it is retained. Müşteriler, API çağrıları aracılığıyla bireysel Konuşmacılar için bu konuşmacı kayıt verilerini oluşturabilir, güncelleştirebilir ve kaldırabilir.Customers can create, update, and remove this speaker enrollment data for individual speakers through API calls. Abonelik silindiğinde, abonelikle ilişkili tüm konuşmacı kaydı verileri de silinir.When the subscription is deleted, all the speaker enrollment data associated with the subscription will also be deleted.

Müşteriler, konuşmacı tanımlaması için kullanıcılardan uygun izinleri almış olduklarından emin olmalıdır.Customers should ensure they have received the appropriate permissions from the users for speaker identification.

İsiIdentification

Tanıtım aşamasında, konuşmacı tanımlama hizmeti giriş konuşma kaydından ses özelliklerini ayıklar.In the identification phase, the speaker identification service extracts voice features from the input speech recording. Ardından, özellikleri belirtilen konuşmacı listesinin kayıt verileriyle karşılaştırır.Then it compares the features against the enrollment data of the specified list of speakers. Kayıtlı konuşmacı ile eşleşme bulunduğunda, yanıt, bir güven düzeyi olan konuşmacı KIMLIĞINI döndürür.When a match is found with an enrolled speaker, the response returns the ID of the speaker with a confidence level. Aksi takdirde, hiçbir konuşmacı kayıtlı konuşmacı ile eşleşmezse yanıt "Reddet" i döndürür.Otherwise, the response returns "reject" when no speaker is a match to an enrolled speaker.

Eşik güven düzeyi, senaryoya bağlı olarak ayarlanmalıdır.The threshold confidence level should be set based on the scenario. Güven düzeyiyle denemeler yapmanızı ve her bir uygulama için uygun ayarı göz önünde bulundurmalarını öneririz.We recommend you experiment with the confidence level and consider the appropriate setting for each application. API 'Ler, sesin canlı bir kişiden mi yoksa bir imitation ya da kayıtlı konuşmacı kaydından mi olduğunu belirlemektir.The APIs are not intended to determine whether the audio is from a live person or an imitation or a recording of an enrolled speaker.

Hizmet, kimlik aşaması için hizmete gönderilen konuşma kaydını veya ayıklanan ses özelliklerini korumaz.The service does not retain the speech recording or the extracted voice features that are sent to the service for the identification phase.

Konuşmacı tanımlama hakkında daha fazla ayrıntı için lütfen API Konuşmacı kimliği' ne bakın.For more details about speaker identification, please refer to the API Speaker - Identification.