聽寫

聽寫可讓使用者錄製音訊剪輯並取得轉譯。 若要使用它,請確定已在 輸入系統設定檔 中註冊聽寫系統。 Windows 聽寫輸入提供者 是現成提供的聽寫系統,但是可以建立執行替代的聽寫系統 IMixedRealityDictationSystem

規格需求

聽寫系統會使用 Unity 的 DictationRecognizer ,其本身會使用基礎 Windows 語音 api 來處理聽寫。 請注意,這表示這項功能只存在於 Windows 架構的平臺上。

使用聽寫系統需要 PlayerSettings 功能一節中的「網際網路用戶端」和「麥克風」應用程式功能。 如需 Unity 中語音輸入的詳細資訊,請參閱 Windows Mixed Reality 檔

組態

Data provider

設定好聽寫服務之後,您可以使用 DictationHandler 腳本來啟動和停止錄製會話,並透過 UnityEvents 取得轉譯結果。

Dictation Handler
  • 當使用者在到目前為止所捕獲音訊的早期轉譯時,會引發 聽寫假設
  • 聽寫結果 會在每個句子的結尾引發 (也就是當使用者) 暫停時,會產生截至目前為止所捕獲音訊的最後轉譯。
  • 錄製會話的結尾會產生 聽寫完成,並包含音訊的完整、最後轉譯。
  • 引發 聽寫錯誤,以通知聽寫服務中的錯誤。 此案例中的轉譯包含錯誤的描述。

範例場景

中的 聽寫 場景會 MRTK/Examples/Demos/Input/Scenes/Dictation 顯示 DictationHandler 使用中的腳本。 如果您需要更多控制,您可以擴充此腳本或建立自己的執行 IMixedRealityDictationHandler ,以直接接收聽寫事件。

Dictation Demo