聽寫 — MRTK2

聽寫可讓使用者錄製音訊剪輯並取得轉譯。 若要使用它,請確定已在 輸入系統設定檔中註冊聽寫系統。 Windows聽寫輸入提供者是現成提供的聽寫系統,但可以建立實作 IMixedRealityDictationSystem 替代聽寫系統。

規格需求

聽寫系統使用 Unity 的DictationRecognizer,其本身會使用基礎Windows語音 API 來處理聽寫。 請注意,這表示此功能只存在於以Windows為基礎的平臺上。

使用聽寫系統需要 PlayerSettings - Capabilities 區段中的「網際網路用戶端」和「麥克風」應用程式功能。 如需 Unity 語音輸入的詳細資訊,請參閱Windows Mixed Reality檔

組態

Data provider

設定聽寫服務之後,您可以使用 DictationHandler 腳本來啟動和停止錄製會話,並透過 UnityEvents 取得轉譯結果。

Dictation Handler
  • 聽寫假設 會在使用者與到目前為止擷取之音訊的早期粗略轉譯交談時引發。
  • 聽寫結果 會在每個句子結尾引發 (亦即,當使用者暫停) 時,目前為止擷取的音訊最終轉譯。
  • 聽寫完成 會在錄製會話結尾引發,並具有音訊的完整最終轉譯。
  • 聽寫錯誤 會引發,以通知聽寫服務中的錯誤。 在此案例中,轉譯包含錯誤的描述。

範例場景

中的 MRTK/Examples/Demos/Input/Scenes/Dictation聽寫場景會顯示 DictationHandler 正在使用中的腳本。 如果您需要更多控制,您可以擴充此腳本,或建立自己的實作 IMixedRealityDictationHandler 來直接接收聽寫事件。

Dictation Demo