你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

什么是多设备对话?

使用多设备对话可以轻松地在多个客户端之间创建语音或文本对话,并协调在它们之间发送的消息。

注意

多设备对话访问是一项预览功能。

使用多设备对话可以:

  • 将多个客户端连接到同一对话,并管理这些客户端之间的消息发送和接收。
  • 轻松听录来自每个客户端的音频,并将听录内容(以及可选的翻译)发送到其他客户端。
  • 在客户端之间轻松发送文本消息,并提供可选的翻译。

可以生成可跨一组设备工作的功能或解决方案。 每个设备可以独立地将消息(音频听录内容或即时消息)发送到所有其他设备。

会议听录适用于配备多声道麦克风阵列的单个设备,而多设备对话则适合用于采用多个设备且每个设备配备一个麦克风的方案。

重要

多设备对话不支持在客户端之间发送音频文件:只能发送听录内容和/或翻译。

主要功能

  • 实时听录:每个人都将收到对话的脚本,因此,他们可以实时跟进文本,或保存该脚本供以后使用。
  • 实时翻译:借助 70 多种支持的语言进行文本翻译,用户可以将对话翻译成他们喜欢的语言。
  • 可读脚本:听录内容和翻译包含标点和断句符号,易于用户跟进。
  • 语音或文本输入:根据为参与者所选语言启用的语言支持功能,每个用户可以在自己的设备上讲话或键入内容。 请参阅语言支持
  • 消息中继:多设备对话服务会将一个客户端发送的消息以其选择的语言分发到所有其他客户端。
  • 消息标识:用户在对话中收到的每条消息将以发送该消息的用户的昵称进行标记。

用例

轻型对话

创建和加入对话的过程非常简单。 一个用户充当“主持人”并创建一个对话,这会生成一个随机的五字母对话代码和一个 QR 码。 所有其他用户可以通过键入对话代码或扫描 QR 码加入该对话。

由于用户是通过对话代码加入的,且不需要共享联系信息,因此当场就能快速轻松地创建对话。

包容性的会议

实时听录和翻译可以方便讲不同语言的人员和/或聋哑人士访问对话。 每个人还能通过以其首选语言讲话或发送即时消息来主动参与对话。

演示文稿

还可以在屏幕上以及观众自己的设备上提供演示文稿和讲座的字幕。 观众在使用对话代码加入对话后,他们可以在自己的设备上看到以其首选语言提供的脚本。

工作原理

所有客户端使用语音 SDK 来创建或加入对话。 语音 SDK 与多设备聊天服务交互,该服务管理着会话的生存期。 对话包括参与者列表、每个客户端选择的语言以及发送的消息。

每个客户端可以发送音频或即时消息。 该服务使用语音识别将音频转换为文本,并按原样发送即时消息。 如果客户端选择不同的语言,则该服务会将所有消息翻译成每个客户端的指定语言。

Multi-device Conversation Overview Diagram

对话、主持人和参与者概述

对话是一个用户启动(以供其他参与用户加入)的会话。 所有客户端使用五字母对话代码连接到该对话。

每个对话会创建包括以下属性的元数据:

  • 对话的开始和结束时间的时间戳
  • 对话中所有参与者的列表,包括每个用户所选的昵称,以及语音或文本输入的主要语言。

对话中有两种类型的用户:主持人和参与者。

主持人是发起对话的用户,充当该对话的管理员。

  • 每个对话只能有一个主持人
  • 主持人必须在对话期间连接到对话。 如果主持人离开对话,则对所有其他参与者而言,该对话也会结束。
  • 主持人可以通过几个附加的控制操作来管理对话:
    • 锁定对话 - 防止更多参与者加入
    • 将所有参与者静音 - 防止其他参与者在对话中发送任何消息(无论是从语音中听录的内容还是即时消息)
    • 将单个参与者静音
    • 为所有参与者取消静音
    • 为单个参与者取消静音

参与者是加入对话的用户。

  • 参与者可以随时离开和重新加入同一会话,而不会对其他参与者结束该对话。
  • 参与者无法锁定对话,也无法将其他参与者静音/取消静音

注意

每个对话最多可以有 100 名参与者,在任意给定时间,其中可以有 10 名参与者同时讲话。

语言支持

每个用户在加入对话时必须选择主要语言。 他们选择的语言是他们说话和发送即时消息所用的语言,也是他们看到其他用户的消息所用的语言。

有两种类型的语言:“语音转文本”和“仅文本”:

  • 如果用户选择了某种“语音转文本”语言作为主要语言,则他们在对话中既可以使用语音输入,也可以使用文本输入。

  • 如果用户选择了某种仅文本语言,则他们在对话中只能使用文本输入和发送即时消息。 “仅文本”语言是文本翻译支持的语言,但不受语音转文本的支持。 可以在语言支持页上查看可用语言。

除了指定主要语言以外,每个参与者还可以指定用于翻译对话的更多语言。

下表根据用户所选的主要语言,汇总了用户在多设备对话中可以执行的操作。

用户可以在对话中执行的操作 语音转文本 仅文本
使用语音输入
发送即时消息
翻译对话

注意

有关可用语音转文本和文本翻译语言的列表,请参阅支持的语言

后续步骤