你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Windows 上的语音助理入门

本指南指导你完成在 Windows 上开发语音助理的步骤。

设置开发环境

若要开始开发适用于 Windows 的语音助理,需要确保具有适当的开发环境。

  • Visual Studio:需要安装 Microsoft Visual Studio 2017 Community Edition 或更高版本
  • Windows 版本:具有 Windows 的 Windows 预览体验成员快速循环内部版本和 Windows SDK 的 Windows 预览体验成员版本的 PC。 此示例代码经验证可使用 Windows SDK 19018 在 Windows 预览体验成员发布版本 19025.vb_release_analog.191112-1600 上工作。 高于指定版本的任何内部版本或 SDK 都应兼容。
  • UWP 开发工具:Visual Studio 中的通用 Windows 平台开发工作负载。 请参阅 UWP 设置页面,使计算机准备好开发 UWP 应用程序。
  • 可正常工作的麦克风和音频输出

从 Microsoft 获取资源

Windows 上自定义语音代理所需的某些资源需要 Microsoft 提供的资源。 UWP 语音助理示例为初始开发和测试提供了这些资源的示例版本,因此初始开发不需要此部分。

  • 关键字模型:语音激活需要 Microsoft 提供的关键字模型(形式为 .bin 文件)。 UWP 语音助理示例中提供的 .bin 文件针对关键字 Contoso 进行训练。
  • 受限访问功能令牌:由于 ConversationalAgent API 提供对麦克风音频的访问,因此它们由受限访问功能限制进行保护。 若要使用受限访问功能,需要从 Microsoft 获取连接到应用程序的包标识的受限访问功能令牌。 有关任何受限访问功能或请求解锁令牌的详细信息,请联系 Microsoft 支持

建立对话服务

若要获得完整的语音助理体验,应用程序需要具有以下功能的对话服务

  • 在给定音频文件中检测关键字
  • 侦听用户输入并将其转换为文本
  • 向机器人提供文本
  • 将机器人的文本响应转换为音频输出

下面是使用 Direct Line Speech 创建基本对话服务的要求。

  • 语音资源:Azure 的语音功能(例如语音转文本和文本转语音)资源。 在 Azure 门户中创建语音资源。 有关详细信息,请参阅创建 Azure AI 服务资源
  • Bot Framework 机器人:使用 Bot Framework 4.2 或更高版本创建的机器人,它订阅了 Direct Line Speech 以启用语音输入和输出。 本指南包含创建“回显机器人”并使它订阅 Direct Line Speech 的分步说明。 还可以参阅此 Bot Framework 文章,了解有关如何创建自定义机器人的步骤。 然后按照此处的相同步骤订阅 Direct Line Speech(不过是使用新机器人,而不是“回显机器人”)。

尝试示例应用

通过语音资源密钥和回显机器人的机器人 ID,可以直接试用 UWP 语音助理示例。 按照自述文件中的说明运行应用并输入凭据。

为 Windows 创建自己的语音助理

从 Microsoft 收到受限访问功能令牌和 bin 文件后,便可以在 Windows 上开始运行自己的语音助理。

后续步骤