听写 - MRTK2

用户可以通过听写录制音频片段并获取脚本。 若要使用它,请确保在输入系统配置文件中注册了听写系统。 Windows 听写输入提供程序是提供的现成听写系统,但可以实现 IMixedRealityDictationSystem 以创建替代听写系统。

要求

听写系统使用 Unity 的 DictationRecognizer,它本身使用基本的 Windows 语音 API 来处理听写。 请注意,这意味着此功能只存在于基于 Windows 的平台上。

使用听写系统需要 PlayerSettings - 功能部分的“Internet 客户端”和“麦克风”应用程序功能。 有关 Unity 中语音输入的更多详细信息,请参阅 Windows Mixed Reality 文档

配置

Data provider

设置听写服务后,可以使用 DictationHandler 脚本来启动和停止录制会话,并通过 UnityEvents 获取脚本结果。

Dictation Handler
  • 在用户说话时引发听写假设,以及迄今为止录制的音频的早期粗放式脚本。
  • 在每个句子的末尾(例如当用户暂停时)引发“听写结果”,以及迄今为止录制的音频的最终脚本。
  • 在录制会话结束时引发“听写完成”,以及音频的最终完整脚本。
  • 引发“听写错误”以告知听写服务中的错误。 此示例中的脚本包含错误说明。

示例场景

MRTK/Examples/Demos/Input/Scenes/Dictation 中的“听写”场景显示正在使用 DictationHandler 脚本。 如果需要更多控制,可以扩展此脚本或实现 IMixedRealityDictationHandler 以创建自己的脚本来直接接收听写事件。

Dictation Demo