聽寫 - MRTK2

聽寫可讓使用者錄製音訊剪輯並取得轉譯。 若要使用它,請確定聽寫系統已在 輸入系統設定檔中註冊。 Windows 聽寫輸入提供者 是現成提供的聽寫系統,但可以建立替代聽寫系統來實作 IMixedRealityDictationSystem

規格需求

聽寫系統使用 Unity 的 DictationRecognizer ,其本身會使用基礎 Windows 語音 API 來處理聽寫。 請注意,這表示此功能只存在於 Windows 平臺上。

使用聽寫系統需要 PlayerSettings - Capabilities 區段中的「網際網路用戶端」和「麥克風」應用程式功能。 如需 Unity 語音輸入的詳細資訊,請參閱Windows Mixed Reality檔

設定

資料提供者

設定聽寫服務之後,您可以使用 DictationHandler 腳本來啟動和停止錄製會話,並透過 UnityEvents 取得轉譯結果。

聽寫處理常式
  • 聽寫假設 會在使用者到目前為止擷取的音訊早期粗略轉譯時引發。
  • 聽寫結果 會在每個句子結尾引發 (,也就是當使用者暫停) 時,到目前為止擷取的音訊最終轉譯。
  • 聽寫完成 會在錄製會話結束時引發,其中包含音訊的完整最終轉譯。
  • 聽寫錯誤 會引發,以通知聽寫服務中的錯誤。 在此案例中,轉譯包含錯誤的描述。

範例場景

中的 MRTK/Examples/Demos/Input/Scenes/Dictation聽寫場景會顯示 DictationHandler 使用的腳本。 如果您需要更多控制權,您可以擴充此腳本,或建立自己的實作 IMixedRealityDictationHandler 來直接接收聽寫事件。

聽寫示範