你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

什么是语音设备?

语音服务适用于多种设备和音频源。 可以使用设备上提供的默认音频处理。 或者,可以使用语音 SDK 提供的另一种选择,即使用我们的高级音频处理算法,这些算法旨在与语音服务很好地配合使用。 它通过噪声抑制、回声消除、波束赋形和混响消减来提供准确的远场语音识别

音频处理

音频处理是应用于音频流的增强功能,以提高音频质量。 常见的增强功能示例包括自动增益控制 (AGC)、噪音抑制和回声消除 (AEC)。 语音 SDK 集成 Microsoft 音频堆栈 (MAS),允许任何应用程序或产品对输入音频使用其音频处理功能。

麦克风阵列建议

语音 SDK 最适合与根据推荐指南设计的麦克风阵列配合使用。 有关详细信息,请参阅麦克风阵列建议

设备开发工具包

语音 SDK 旨在与特制的开发工具包和各种麦克风阵列配置配合使用。 例如,你可以使用下列其中一个 Azure 开发工具包。

  • Azure Percept DK 包含预配置的音频处理器和四麦克风线性阵列。 你可以借助 Azure AI 服务使用语音命令、关键字辨识和远场语音。
  • Azure Kinect DK 是一个空间计算开发人员工具包,配有先进的 AI 传感器,提供复杂的 Azure AI 视觉和语音模型。 作为具有多种模式的一体式小型设备,它包含了深度传感器、附带视频相机的空间麦克风阵列和方向传感器。

后续步骤