Ses yardımcısı nedir?

Geliştiriciler, sesli yardımcıları Konuşma hizmetiyle birlikte kullanarak uygulamaları ve deneyimleri için doğal, insan benzeri konuşma arabirimleri oluşturabilir. Sesli yardımcı hizmeti, bir cihaz ile yardımcı uygulaması arasında hızlı ve güvenilir etkileşim sağlar.

Yardımcı çözüm seçme

Sesli yardımcı oluşturmanın ilk adımı, ne yapmak istediğinize karar vermektir. Konuşma tanıma hizmeti, yardımcı etkileşimleri oluşturmak için birden çok tamamlayıcı çözüm sağlar. Uygulamanızın "Seattle'a gitmem gerekiyor" veya "Ne tür pizza sipariş edebilirim?" gibi ifadelerle açık uçlu bir konuşmayı desteklemesini isteyebilirsiniz. Esneklik ve çok yönlülük için Doğrudan Çizgi Konuşma kanalıyla Azure AI Bot Hizmeti kullanarak bota ses ekleme ve ses çıkarma özellikleri ekleyebilirsiniz.

Yardımcınızın ne yapmak istediğinden henüz emin değilseniz, en iyi seçenek olarak Direct Line Speech'ı öneririz. Ortak desenler oluşturmak ve mevcut bilgi kaynaklarınızı kullanmak için Sanal Yardımcı çözümü ve kurumsal şablon ve Soru-Cevap Oluşturma hizmeti gibi zengin araçlar ve yazma yardımlarıyla tümleştirme sunar.

Konuşma SDK'sını kullanarak sesli yardımcı oluşturmaya yönelik başvuru mimarisi

Conceptual diagram of the voice assistant orchestration service flow.

Temel özellikler

İster Direct Line Speech'ı ister yardımcı etkileşimlerinizi oluşturmak için başka bir çözüm seçin, yardımcınızı markanıza, ürününüze ve kişiliğinize göre özelleştirmek için zengin bir özelleştirme özellikleri kümesi kullanabilirsiniz.

Kategori Özellikler
Özel anahtar sözcük Kullanıcılar, "Hey Contoso" gibi özel bir anahtar sözcük kullanarak yardımcılarla konuşma başlatabilir. Bir uygulama bunu Konuşma SDK'sında özel anahtar sözcük altyapısıyla yapar ve özel anahtar sözcükleri kullanmaya başlama bölümüne giderek yapılandırabilirsiniz. Sesli yardımcılar, anahtar sözcük etkinleştirmenin doğruluğunu geliştirmek için hizmet tarafı anahtar sözcük doğrulamasını kullanabilir (yalnızca cihazı kullanmak yerine).
Konuşmayı metne dönüştürme Sesli yardımcılar, Konuşma tanıma hizmetindeki konuşmayı metne dönüştürerek gerçek zamanlı sesi tanınan metne dönüştürür. Bu metin, hem yardımcı uygulamanız hem de istemci uygulamanız için döküm olarak kullanılabilir.
Metin okuma Yardımcınızdan gelen metinsel yanıtlar, Konuşma tanıma hizmetinden metinden konuşmaya doğru sentezlenir. Bu sentez daha sonra istemci uygulamanız için bir ses akışı olarak kullanılabilir hale getirilir. Microsoft, markanıza ses veren kendi özel, yüksek kaliteli Nöral Metin okuma (Nöral TTS) sesinizi oluşturma olanağı sunar.

Sesli yardımcıları kullanmaya başlama

Kodu 10 dakikadan kısa sürede çalıştırmanız için tasarlanmış aşağıdaki hızlı başlangıç makalesini sunuyoruz: Hızlı Başlangıç: Direct Line Speech kullanarak özel bir sesli yardımcı oluşturma

Örnek kod ve öğreticiler

Sesli yardımcı oluşturmaya yönelik örnek kod GitHub'da mevcuttur. Örnekler, yardımcınıza çeşitli popüler programlama dillerinde bağlanmaya yönelik istemci uygulamasını kapsar.

Özelleştirme

Konuşma tanıma hizmetini kullanarak oluşturduğunuz sesli yardımcılar, çeşitli özelleştirme seçeneklerini kullanabilir.

Not

Özelleştirme seçenekleri dile ve yerel ayara göre değişir. Daha fazla bilgi edinmek için bkz . Desteklenen diller.

Sonraki adımlar