Mi az a hangvezérelt asszisztens?

A Beszédszolgáltatás hangsegédjeinek használatával a fejlesztők természetes, emberi jellegű, beszélgetési felületeket hozhatnak létre az alkalmazásaikhoz és a felhasználói élményükhöz. A hangsegéd szolgáltatás gyors és megbízható interakciót biztosít egy eszköz és egy asszisztens implementációja között.

Segédmegoldás kiválasztása

A hangsegéd létrehozásának első lépése, hogy eldöntse, mit szeretne tenni. A Speech Service több kiegészítő megoldást kínál a segédek közötti interakciókhoz. Előfordulhat, hogy azt szeretné, hogy az alkalmazása támogassa a nyílt beszélgetéseket olyan kifejezésekkel, mint a "Seattle-be kell mennem" vagy a "Milyen pizzát rendelhetek?" A rugalmasság és a sokoldalúság érdekében hang- és hangátviteli képességeket adhat hozzá egy robothoz az Azure AI Bot Service és a Direct Line Speech csatorna használatával.

Ha még nem tudja biztosan, hogy mit szeretne az asszisztense elvégezni, javasoljuk , hogy a Direct Line Speech legyen a legjobb megoldás. Számos eszközzel és szerzői segédmel, például a Virtual Assistant megoldással, vállalati sablonnal és a QnA Maker szolgáltatással való integrációt kínál, hogy közös mintákra építsen, és használja a meglévő tudásforrásokat.

Referenciaarchitektúra a Beszéd SDK használatával hangsegéd létrehozásához

Conceptual diagram of the voice assistant orchestration service flow.

Alapvető funkciók

Akár a Direct Line Speechet, akár egy másik megoldást választ az asszisztensi interakciók létrehozásához, számos testreszabási funkcióval testre szabhatja az asszisztenst a márka, a termék és a személyiség alapján.

Kategória Funkciók
Egyéni kulcsszó A felhasználók egyéni kulcsszóval, például a "Hey Contoso" kulcsszóval kezdeményezhetnek beszélgetéseket az asszisztensekkel. Az alkalmazás ezt egy egyéni kulcsszómotorral teszi meg a Speech SDK-ban, amelyet az egyéni kulcsszavak használatának megkezdésével konfigurálhat. A hangsegédek szolgáltatásoldali kulcsszó-ellenőrzéssel javíthatják a kulcsszóaktiválás pontosságát (szemben az eszköz egyedüli használatával).
Beszéd szöveggé A hangsegédek felismert szöveggé alakítják a valós idejű hangot a Speech szolgáltatásból származó beszédből szöveggé . Ez a szöveg átíráskor elérhető az asszisztens implementációjához és az ügyfélalkalmazáshoz is.
Szövegfelolvasás Az asszisztens szöveges válaszait szövegről beszédre szintetizálja a Speech szolgáltatás. Ez a szintézis ezután elérhetővé válik az ügyfélalkalmazás számára hangstreamként. A Microsoft saját egyéni, kiváló minőségű neurális szövegfelolvasási (Neurális TTS-) hang készítését teszi lehetővé, amely hangot ad a márkának.

A hangsegédek használatának első lépései

A következő rövid útmutatót ajánljuk, amely úgy lett kialakítva, hogy 10 percnél kevesebb perc alatt futtassa a kódot: Rövid útmutató: Egyéni hangsegéd létrehozása a Direct Line Speech használatával

Mintakódok és oktatóanyagok

A hangsegéd létrehozására szolgáló mintakód a GitHubon érhető el. A minták az ügyfélalkalmazást fedik le, amely több népszerű programozási nyelven csatlakozik az asszisztenséhez.

Testreszabás

A Speech szolgáltatással létrehozott hangsegédek számos testreszabási lehetőséget használhatnak.

Feljegyzés

A testreszabási lehetőségek nyelvtől és területi beállításoktól függően változnak. További információ: Támogatott nyelvek.

Következő lépések