你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

SpeechRecognizer 类

public final class SpeechRecognizer
extends Recognizer

从麦克风、文件或其他音频输入流执行语音识别,并获取转录文本作为结果。 注意:必须调用 close () 才能释放对象持有的基础资源。

字段摘要

修饰符和类型 字段和描述
final EventHandlerImpl<SpeechRecognitionCanceledEventArgs> canceled

取消事件表示已取消识别。

final EventHandlerImpl<SpeechRecognitionEventArgs> recognized

识别的事件表示收到最终识别结果的信号。

final EventHandlerImpl<SpeechRecognitionEventArgs> recognizing

识别事件表示收到中间识别结果的信号。

构造函数摘要

构造函数 说明
SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig)

初始化用于嵌入式语音识别的语音识别器的新实例。

SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig)

初始化用于嵌入式语音识别的语音识别器的新实例。

SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig, AudioConfig audioConfig)

初始化用于嵌入式语音识别的语音识别器的新实例。

SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig, AudioConfig audioConfig)

初始化用于嵌入式语音识别的语音识别器的新实例。

SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig)

初始化用于混合语音识别的语音识别器的新实例。

SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig)

初始化用于混合语音识别的语音识别器的新实例。

SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig, AudioConfig audioConfig)

初始化用于混合语音识别的语音识别器的新实例。

SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig, AudioConfig audioConfig)

初始化用于混合语音识别的语音识别器的新实例。

SpeechRecognizer(SpeechConfig speechConfig)

初始化语音识别器的新实例。

SpeechRecognizer(SpeechConfig speechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig)

初始化语音识别器的新实例。

SpeechRecognizer(SpeechConfig speechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig, AudioConfig audioConfig)

初始化语音识别器的新实例。

SpeechRecognizer(SpeechConfig speechConfig, SourceLanguageConfig sourceLanguageConfig)

初始化语音识别器的新实例。

SpeechRecognizer(SpeechConfig speechConfig, SourceLanguageConfig sourceLanguageConfig, AudioConfig audioConfig)

初始化语音识别器的新实例。

SpeechRecognizer(SpeechConfig speechConfig, AudioConfig audioConfig)

初始化语音识别器的新实例。

SpeechRecognizer(SpeechConfig speechConfig, String sourceLanguage)

初始化语音识别器的新实例。

SpeechRecognizer(SpeechConfig speechConfig, String sourceLanguage, AudioConfig audioConfig)

初始化语音识别器的新实例。

方法摘要

修饰符和类型 方法和描述
protected void dispose(boolean disposing)

此方法执行资源的清理。

java.lang.String getAuthorizationToken()

获取用于与服务通信的授权令牌。

java.lang.String getEndpointId()

获取用于语音识别的自定义语音模型的终结点 ID。

OutputFormat getOutputFormat()

获取识别的输出格式。

PropertyCollection getProperties()

为此语音识别器定义的属性及其值的集合。

java.lang.String getSpeechRecognitionLanguage()

获取识别的口语。

java.util.concurrent.Future<SpeechRecognitionResult> recognizeOnceAsync()

启动语音识别,并在识别单个言语后返回。

void setAuthorizationToken(String token)

设置用于与服务通信的授权令牌。

java.util.concurrent.Future<java.lang.Void> startContinuousRecognitionAsync()

在连续音频流上启动语音识别,直到停止调用连续识别异步 () 。

java.util.concurrent.Future<java.lang.Void> startKeywordRecognitionAsync(KeywordRecognitionModel model)

使用给定的关键字 (keyword) 模型配置识别器。

java.util.concurrent.Future<java.lang.Void> stopContinuousRecognitionAsync()

尽快停止正在运行的识别操作,并根据到目前为止已处理的输入立即请求结果。

java.util.concurrent.Future<java.lang.Void> stopKeywordRecognitionAsync()

结束关键字 (keyword) 发起的识别。

方法继承自 Recognizer

方法继承自 java.lang.Object

java.lang.Object.clone java.lang.Object.equals java.lang.Object.finalize java.lang.Object.getClass java.lang.Object.hashCode java.lang.Object.notify java.lang.Object.notifyAll java.lang.Object.toString java.lang.Object.wait java.lang.Object.wait java.lang.Object.wait

字段详细信息

canceled

public final EventHandlerImpl canceled

取消事件表示已取消识别。

recognized

public final EventHandlerImpl recognized

识别的事件表示收到最终识别结果的信号。

recognizing

public final EventHandlerImpl recognizing

识别事件表示收到中间识别结果的信号。

构造函数详细信息

SpeechRecognizer

public SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig)

初始化用于嵌入式语音识别的语音识别器的新实例。 在版本 1.19.0 中添加

Parameters:

embeddedSpeechConfig - 嵌入式语音配置。

SpeechRecognizer

public SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig)

初始化用于嵌入式语音识别的语音识别器的新实例。 在版本 1.20.0 中添加

Parameters:

embeddedSpeechConfig - 嵌入式语音配置。
autoDetectSourceLangConfig - 用于自动检测源语言的配置。

SpeechRecognizer

public SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig, AudioConfig audioConfig)

初始化用于嵌入式语音识别的语音识别器的新实例。 在版本 1.20.0 中添加

Parameters:

embeddedSpeechConfig - 嵌入式语音配置。
autoDetectSourceLangConfig - 用于自动检测源语言的配置。
audioConfig - 音频配置。

SpeechRecognizer

public SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig, AudioConfig audioConfig)

初始化用于嵌入式语音识别的语音识别器的新实例。 在版本 1.19.0 中添加

Parameters:

embeddedSpeechConfig - 嵌入式语音配置。
audioConfig - 音频配置。

SpeechRecognizer

public SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig)

初始化用于混合语音识别的语音识别器的新实例。

Parameters:

hybridSpeechConfig - 混合语音配置。

SpeechRecognizer

public SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig)

初始化用于混合语音识别的语音识别器的新实例。

Parameters:

hybridSpeechConfig - 混合语音配置。
autoDetectSourceLangConfig - 自动检测源语言的配置

SpeechRecognizer

public SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig, AudioConfig audioConfig)

初始化用于混合语音识别的语音识别器的新实例。

Parameters:

hybridSpeechConfig - 混合语音配置。
autoDetectSourceLangConfig - 自动检测源语言的配置
audioConfig - 音频配置。

SpeechRecognizer

public SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig, AudioConfig audioConfig)

初始化用于混合语音识别的语音识别器的新实例。

Parameters:

hybridSpeechConfig - 混合语音配置。
audioConfig - 音频配置。

SpeechRecognizer

public SpeechRecognizer(SpeechConfig speechConfig)

初始化语音识别器的新实例。

Parameters:

speechConfig - 语音配置。

SpeechRecognizer

public SpeechRecognizer(SpeechConfig speechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig)

初始化语音识别器的新实例。

Parameters:

speechConfig - 语音配置。
autoDetectSourceLangConfig - 自动检测源语言的配置

SpeechRecognizer

public SpeechRecognizer(SpeechConfig speechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig, AudioConfig audioConfig)

初始化语音识别器的新实例。

Parameters:

speechConfig - 语音配置。
autoDetectSourceLangConfig - 自动检测源语言的配置
audioConfig - 音频配置。

SpeechRecognizer

public SpeechRecognizer(SpeechConfig speechConfig, SourceLanguageConfig sourceLanguageConfig)

初始化语音识别器的新实例。

Parameters:

speechConfig - 语音配置。
sourceLanguageConfig - 源语言的配置

SpeechRecognizer

public SpeechRecognizer(SpeechConfig speechConfig, SourceLanguageConfig sourceLanguageConfig, AudioConfig audioConfig)

初始化语音识别器的新实例。

Parameters:

speechConfig - 语音配置。
sourceLanguageConfig - 源语言的配置
audioConfig - 音频配置。

SpeechRecognizer

public SpeechRecognizer(SpeechConfig speechConfig, AudioConfig audioConfig)

初始化语音识别器的新实例。

Parameters:

speechConfig - 语音配置。
audioConfig - 音频配置。

SpeechRecognizer

public SpeechRecognizer(SpeechConfig speechConfig, String sourceLanguage)

初始化语音识别器的新实例。

Parameters:

speechConfig - 语音配置。
sourceLanguage - 识别源语言

SpeechRecognizer

public SpeechRecognizer(SpeechConfig speechConfig, String sourceLanguage, AudioConfig audioConfig)

初始化语音识别器的新实例。

Parameters:

speechConfig - 语音配置。
sourceLanguage - 识别源语言
audioConfig - 音频配置。

方法详细信息

dispose

protected void dispose(boolean disposing)

此方法执行资源的清理。 布尔参数释放指示在释放) 为 true 时,是从 Dispose (调用方法,还是从终结器 (如果释放为 false) 调用方法。 派生类应重写此方法,以便根据需要释放资源。

Overrides:

SpeechRecognizer.dispose(boolean disposing)

Parameters:

disposing

getAuthorizationToken

public String getAuthorizationToken()

获取用于与服务通信的授权令牌。

Returns:

授权令牌。

getEndpointId

public String getEndpointId()

获取用于语音识别的自定义语音模型的终结点 ID。

Returns:

用于语音识别的自定义语音模型的终结点 ID。

getOutputFormat

public OutputFormat getOutputFormat()

获取识别的输出格式。

Returns:

识别的输出格式。

getProperties

public PropertyCollection getProperties()

为此 SpeechRecognizer 定义的属性及其值的集合。

Returns:

为此 SpeechRecognizer 定义的属性及其值的集合。

getSpeechRecognitionLanguage

public String getSpeechRecognitionLanguage()

获取识别的口语。

Returns:

识别的口语。

recognizeOnceAsync

public Future recognizeOnceAsync()

启动语音识别,并在识别单个言语后返回。 单个言语的结束是通过在结束时倾听静音或处理最长 15 秒音频时确定的。 该任务返回作为结果的识别文本。 注意:由于 recognizeOnceAsync () 仅返回单个言语,因此它仅适用于单次识别(如命令或查询)。 对于长时间运行的多言语识别,请改用 startContinuousRecognitionAsync () 。

Returns:

表示识别操作的任务。 该任务返回 SpeechRecognitionResult 的值

setAuthorizationToken

public void setAuthorizationToken(String token)

设置用于与服务通信的授权令牌。 注意:调用方需要确保授权令牌有效。 在授权令牌过期之前,调用方需要使用新的有效令牌调用此资源库来刷新它。 否则,识别器将在识别过程中遇到错误。

Parameters:

token - 授权令牌。

startContinuousRecognitionAsync

public Future startContinuousRecognitionAsync()

在连续音频流上启动语音识别,直到调用 stopContinuousRecognitionAsync () 。 用户必须订阅事件才能接收识别结果。

Returns:

表示启动识别的异步操作的任务。

startKeywordRecognitionAsync

public Future startKeywordRecognitionAsync(KeywordRecognitionModel model)

使用给定的关键字 (keyword) 模型配置识别器。 调用此方法后,识别器正在侦听关键字 (keyword) 以启动识别。 调用 stopKeywordRecognitionAsync () 以结束关键字 (keyword) 发起的识别。 用户必须订阅事件才能接收识别结果。

Parameters:

model - 指定要识别关键字 (keyword) 的关键字 (keyword) 识别模型。

Returns:

表示启动识别的异步操作的任务。

stopContinuousRecognitionAsync

public Future stopContinuousRecognitionAsync()

尽快停止正在运行的识别操作,并根据到目前为止已处理的输入立即请求结果。 这适用于所有识别操作,而不仅仅是连续识别操作,并有助于使用一键通或“立即完成”按钮进行手动音频终结点。

Returns:

输入处理已停止时将完成的未来。 结果生成(如果适用于提供的输入)可能会在此任务完成后发生,应使用适当的事件进行处理。

stopKeywordRecognitionAsync

public Future stopKeywordRecognitionAsync()

结束关键字 (keyword) 发起的识别。

Returns:

表示停止识别的异步操作的任务。

适用于