什麼是語音助理?

藉由搭配語音服務使用語音助理,開發人員可以為其應用程式和體驗建立自然、類似人類、交談的介面。 語音助理服務可讓裝置與助理實作之間的互動快速又可靠。

選擇助理解決方案

建立語音助理的第一個步驟是決定您想要執行哪些動作。 語音服務提供多個互補的解決方案來製作助理互動。 您可能希望您的應用程式支援開放式對話,例如「我需要前往西雅圖」或「我可以訂購哪種披薩?」如需彈性和多用途,您可以使用 Azure AI Bot Service 搭配 Direct Line Speech 通道,將語音輸入和語音輸出功能新增至 Bot。

如果您還不確定您的助理想要做什麼,建議您 使用 Direct Line Speech 作為最佳選項。 它提供與一組豐富的工具和撰寫輔助工具的整合,例如 虛擬助理 解決方案和企業範本和企業範本,以及 QnA Maker 服務,以建置一般模式並使用您現有的知識來源。

使用語音 SDK 建置語音助理的參考架構

Conceptual diagram of the voice assistant orchestration service flow.

核心功能

無論您選擇 Direct Line Speech 或其他解決方案來建立您的助理互動,您都可以使用一組豐富的自訂功能,根據您的品牌、產品和特質自訂您的助理。

類別 功能
自訂關鍵字 使用者可以使用自定義關鍵詞,例如 「Hey Contoso」 來開始與助理交談。應用程式會在語音 SDK 中使用自訂關鍵字引擎來執行此作業,您可以移至 開始使用自定義關鍵字來進行設定。 語音助理可以使用服務端關鍵詞驗證來改善關鍵詞啟用的正確性(與單獨使用裝置)。
語音轉換文字 語音助理使用語音服務的語音轉換文字,將即時音訊轉換成可辨識的文字。 此文字可供您轉譯為助理實作和用戶端應用程式的轉譯。
文字到語音轉換 助理的文字回應是透過語音服務的文字轉換語音進行合成。 接著,此合成會以音訊串流的形式提供給用戶端應用程式使用。 Microsoft 提供的功能可讓您建置自己的自訂高品質神經文字轉換語音 (神經 TTS),為您的品牌提供語音。

開始使用語音助理

我們提供下列快速入門文章,其設計目的是讓您在 10 分鐘內執行程式碼:快速入門:使用 Direct Line Speech 建立自訂語音助理

範例程式代碼和教學課程

GitHub 上提供用來建立語音助理的範例程序代碼。 這些範例涵蓋用戶端應用程式,以數種熱門的程式設計語言連線到您的小幫手。

自訂

您使用語音服務建置的語音助理可以使用完整的自訂選項。

注意

自訂選項會依語言和地區設定而有所不同。 若要深入瞭解,請參閱 支援的語言

下一步