SpeechRecognizer クラス

public final class SpeechRecognizer
extends Recognizer

マイク、ファイル、またはその他のオーディオ入力ストリームから音声認識を実行し、結果として文字起こしされたテキストを取得します。 注: オブジェクトが保持する基になるリソースを解放するには、close() を呼び出す必要があります。

フィールドの概要

修飾子と型 フィールドと説明
final EventHandlerImpl<SpeechRecognitionCanceledEventArgs> canceled

イベントが取り消されると、認識が取り消されたことを通知します。

final EventHandlerImpl<SpeechRecognitionEventArgs> recognized

イベントが認識されると、最終的な認識結果が受信されたことを通知します。

final EventHandlerImpl<SpeechRecognitionEventArgs> recognizing

イベント認識は、中間認識結果が受信されたことを通知します。

コンストラクターの概要

コンストラクター 説明
SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig)

埋め込み音声認識用に Speech Recognizer の新しいインスタンスを初期化します。

SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig)

埋め込み音声認識用に Speech Recognizer の新しいインスタンスを初期化します。

SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig, AudioConfig audioConfig)

埋め込み音声認識用に Speech Recognizer の新しいインスタンスを初期化します。

SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig, AudioConfig audioConfig)

埋め込み音声認識用に Speech Recognizer の新しいインスタンスを初期化します。

SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig)

ハイブリッド音声認識用に Speech Recognizer の新しいインスタンスを初期化します。

SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig)

ハイブリッド音声認識用に Speech Recognizer の新しいインスタンスを初期化します。

SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig, AudioConfig audioConfig)

ハイブリッド音声認識用に Speech Recognizer の新しいインスタンスを初期化します。

SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig, AudioConfig audioConfig)

ハイブリッド音声認識用に Speech Recognizer の新しいインスタンスを初期化します。

SpeechRecognizer(SpeechConfig speechConfig)

Speech Recognizer の新しいインスタンスを初期化します。

SpeechRecognizer(SpeechConfig speechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig)

Speech Recognizer の新しいインスタンスを初期化します。

SpeechRecognizer(SpeechConfig speechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig, AudioConfig audioConfig)

Speech Recognizer の新しいインスタンスを初期化します。

SpeechRecognizer(SpeechConfig speechConfig, SourceLanguageConfig sourceLanguageConfig)

Speech Recognizer の新しいインスタンスを初期化します。

SpeechRecognizer(SpeechConfig speechConfig, SourceLanguageConfig sourceLanguageConfig, AudioConfig audioConfig)

Speech Recognizer の新しいインスタンスを初期化します。

SpeechRecognizer(SpeechConfig speechConfig, AudioConfig audioConfig)

Speech Recognizer の新しいインスタンスを初期化します。

SpeechRecognizer(SpeechConfig speechConfig, String sourceLanguage)

Speech Recognizer の新しいインスタンスを初期化します。

SpeechRecognizer(SpeechConfig speechConfig, String sourceLanguage, AudioConfig audioConfig)

Speech Recognizer の新しいインスタンスを初期化します。

メソッドの概要

修飾子と型 メソッドと説明
protected void dispose(boolean disposing)

このメソッドは、リソースのクリーンアップを実行します。

java.lang.String getAuthorizationToken()

サービスとの通信に使用される承認トークンを取得します。

java.lang.String getEndpointId()

音声認識に使用されるカスタマイズされた音声モデルのエンドポイント ID を取得します。

OutputFormat getOutputFormat()

認識の出力形式を取得します。

PropertyCollection getProperties()

この SpeechRecognizer に対して定義されているプロパティとその値のコレクション。

java.lang.String getSpeechRecognitionLanguage()

認識の読み上げ言語を取得します。

java.util.concurrent.Future<SpeechRecognitionResult> recognizeOnceAsync()

音声認識を開始し、1 つの発話が認識された後に を返します。

void setAuthorizationToken(String token)

サービスとの通信に使用する承認トークンを設定します。

java.util.concurrent.Future<java.lang.Void> startContinuousRecognitionAsync()

継続的なオーディオ ストリームで音声認識を開始し、継続的認識Async() が呼び出されるまで開始します。

java.util.concurrent.Future<java.lang.Void> startKeywordRecognitionAsync(KeywordRecognitionModel model)

指定したキーワード (keyword) モデルを使用して認識エンジンを構成します。

java.util.concurrent.Future<java.lang.Void> stopContinuousRecognitionAsync()

実行中の認識操作をできるだけ早く停止し、これまでに処理された入力に基づいてすぐに結果を要求します。

java.util.concurrent.Future<java.lang.Void> stopKeywordRecognitionAsync()

キーワード (keyword)開始された認識を終了します。

メソッドの継承元: Recognizer

メソッドの継承元: java.lang.Object

java.lang.Object.clone java.lang.Object.equals java.lang.Object.finalize java.lang.Object.getClass java.lang.Object.hashCode java.lang.Object.notify java.lang.Object.notifyAll java.lang.Object.toString java.lang.Object.wait java.lang.Object.wait java.lang.Object.wait

フィールドの詳細

canceled

public final EventHandlerImpl canceled

イベントが取り消されると、認識が取り消されたことを通知します。

recognized

public final EventHandlerImpl recognized

イベントが認識されると、最終的な認識結果が受信されたことを通知します。

recognizing

public final EventHandlerImpl recognizing

イベント認識は、中間認識結果が受信されたことを通知します。

コンストラクターの詳細

SpeechRecognizer

public SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig)

埋め込み音声認識用に Speech Recognizer の新しいインスタンスを初期化します。 バージョン 1.19.0 で追加されました

Parameters:

embeddedSpeechConfig - 埋め込み音声構成。

SpeechRecognizer

public SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig)

埋め込み音声認識用に Speech Recognizer の新しいインスタンスを初期化します。 バージョン 1.20.0 で追加されました

Parameters:

embeddedSpeechConfig - 埋め込み音声構成。
autoDetectSourceLangConfig - ソース言語を自動検出するための構成。

SpeechRecognizer

public SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig, AudioConfig audioConfig)

埋め込み音声認識用に Speech Recognizer の新しいインスタンスを初期化します。 バージョン 1.20.0 で追加されました

Parameters:

embeddedSpeechConfig - 埋め込み音声構成。
autoDetectSourceLangConfig - ソース言語を自動検出するための構成。
audioConfig - オーディオ構成。

SpeechRecognizer

public SpeechRecognizer(EmbeddedSpeechConfig embeddedSpeechConfig, AudioConfig audioConfig)

埋め込み音声認識用に Speech Recognizer の新しいインスタンスを初期化します。 バージョン 1.19.0 で追加されました

Parameters:

embeddedSpeechConfig - 埋め込み音声構成。
audioConfig - オーディオ構成。

SpeechRecognizer

public SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig)

ハイブリッド音声認識用に Speech Recognizer の新しいインスタンスを初期化します。

Parameters:

hybridSpeechConfig - ハイブリッド音声構成。

SpeechRecognizer

public SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig)

ハイブリッド音声認識用に Speech Recognizer の新しいインスタンスを初期化します。

Parameters:

hybridSpeechConfig - ハイブリッド音声構成。
autoDetectSourceLangConfig - ソース言語を自動検出するための構成

SpeechRecognizer

public SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig, AudioConfig audioConfig)

ハイブリッド音声認識用に Speech Recognizer の新しいインスタンスを初期化します。

Parameters:

hybridSpeechConfig - ハイブリッド音声構成。
autoDetectSourceLangConfig - ソース言語を自動検出するための構成
audioConfig - オーディオ構成。

SpeechRecognizer

public SpeechRecognizer(HybridSpeechConfig hybridSpeechConfig, AudioConfig audioConfig)

ハイブリッド音声認識用に Speech Recognizer の新しいインスタンスを初期化します。

Parameters:

hybridSpeechConfig - ハイブリッド音声構成。
audioConfig - オーディオ構成。

SpeechRecognizer

public SpeechRecognizer(SpeechConfig speechConfig)

Speech Recognizer の新しいインスタンスを初期化します。

Parameters:

speechConfig - 音声構成。

SpeechRecognizer

public SpeechRecognizer(SpeechConfig speechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig)

Speech Recognizer の新しいインスタンスを初期化します。

Parameters:

speechConfig - 音声構成。
autoDetectSourceLangConfig - ソース言語を自動検出するための構成

SpeechRecognizer

public SpeechRecognizer(SpeechConfig speechConfig, AutoDetectSourceLanguageConfig autoDetectSourceLangConfig, AudioConfig audioConfig)

Speech Recognizer の新しいインスタンスを初期化します。

Parameters:

speechConfig - 音声構成。
autoDetectSourceLangConfig - ソース言語を自動検出するための構成
audioConfig - オーディオ構成。

SpeechRecognizer

public SpeechRecognizer(SpeechConfig speechConfig, SourceLanguageConfig sourceLanguageConfig)

Speech Recognizer の新しいインスタンスを初期化します。

Parameters:

speechConfig - 音声構成。
sourceLanguageConfig - ソース言語の構成

SpeechRecognizer

public SpeechRecognizer(SpeechConfig speechConfig, SourceLanguageConfig sourceLanguageConfig, AudioConfig audioConfig)

Speech Recognizer の新しいインスタンスを初期化します。

Parameters:

speechConfig - 音声構成。
sourceLanguageConfig - ソース言語の構成
audioConfig - オーディオ構成。

SpeechRecognizer

public SpeechRecognizer(SpeechConfig speechConfig, AudioConfig audioConfig)

Speech Recognizer の新しいインスタンスを初期化します。

Parameters:

speechConfig - 音声構成。
audioConfig - オーディオ構成。

SpeechRecognizer

public SpeechRecognizer(SpeechConfig speechConfig, String sourceLanguage)

Speech Recognizer の新しいインスタンスを初期化します。

Parameters:

speechConfig - 音声構成。
sourceLanguage - 認識ソース言語

SpeechRecognizer

public SpeechRecognizer(SpeechConfig speechConfig, String sourceLanguage, AudioConfig audioConfig)

Speech Recognizer の新しいインスタンスを初期化します。

Parameters:

speechConfig - 音声構成。
sourceLanguage - 認識ソース言語
audioConfig - オーディオ構成。

メソッドの詳細

dispose

protected void dispose(boolean disposing)

このメソッドは、リソースのクリーンアップを実行します。 Boolean パラメーターの破棄は、メソッドが Dispose から呼び出されるか (破棄が true の場合)、ファイナライザーから呼び出されるか (破棄が false の場合) を示します。 必要に応じて、派生クラスがこのメソッドをオーバーライドしてリソースを破棄する必要があります。

Overrides:

SpeechRecognizer.dispose(boolean disposing)

Parameters:

disposing

getAuthorizationToken

public String getAuthorizationToken()

サービスとの通信に使用される承認トークンを取得します。

Returns:

承認トークン。

getEndpointId

public String getEndpointId()

音声認識に使用されるカスタマイズされた音声モデルのエンドポイント ID を取得します。

Returns:

音声認識に使用されるカスタマイズされた音声モデルのエンドポイント ID。

getOutputFormat

public OutputFormat getOutputFormat()

認識の出力形式を取得します。

Returns:

認識の出力形式。

getProperties

public PropertyCollection getProperties()

この SpeechRecognizer に対して定義されているプロパティとその値のコレクション。

Returns:

この SpeechRecognizer に対して定義されているプロパティとその値のコレクション。

getSpeechRecognitionLanguage

public String getSpeechRecognitionLanguage()

認識の読み上げ言語を取得します。

Returns:

認識の話し言葉。

recognizeOnceAsync

public Future recognizeOnceAsync()

音声認識を開始し、1 つの発話が認識された後に を返します。 1 つの発話の終わりは、終了時の無音状態をリッスンするか、最大 15 秒のオーディオが処理されるまで待機することによって決定されます。 このタスクからは、結果として認識テキストが返されます。 注: recognizeOnceAsync() は 1 つの発話のみを返すので、コマンドやクエリなどのシングル ショット認識にのみ適しています。 実行時間の長い複数発話認識の場合は、代わりに startContinuousRecognitionAsync() を使用します。

Returns:

認識操作を表すタスク。 タスクは SpeechRecognitionResult の値を返します

setAuthorizationToken

public void setAuthorizationToken(String token)

サービスとの通信に使用する承認トークンを設定します。 注: 呼び出し元は、承認トークンが有効であることを確認する必要があります。 認証トークンの有効期限が切れる前に、呼び出し元は、新しい有効なトークンを使用してこのセッターを呼び出すことによって、認証トークンを更新する必要があります。 そうしないと、認識中に認識エンジンでエラーが発生します。

Parameters:

token - 承認トークン。

startContinuousRecognitionAsync

public Future startContinuousRecognitionAsync()

stopContinuousRecognitionAsync() が呼び出されるまで、継続的なオーディオ ストリームで音声認識を開始します。 ユーザーは、認識結果を受け取るためにイベントをサブスクライブする必要があります。

Returns:

認識を開始する非同期操作を表すタスク。

startKeywordRecognitionAsync

public Future startKeywordRecognitionAsync(KeywordRecognitionModel model)

指定したキーワード (keyword) モデルを使用して認識エンジンを構成します。 このメソッドを呼び出した後、認識エンジンは認識を開始するキーワード (keyword)をリッスンしています。 stopKeywordRecognitionAsync() を呼び出して、キーワード (keyword)開始された認識を終了します。 ユーザーは、認識結果を受け取るためにイベントをサブスクライブする必要があります。

Parameters:

model - 認識するキーワード (keyword)を指定するキーワード (keyword)認識モデル。

Returns:

認識を開始する非同期操作を表すタスク。

stopContinuousRecognitionAsync

public Future stopContinuousRecognitionAsync()

実行中の認識操作をできるだけ早く停止し、これまでに処理された入力に基づいてすぐに結果を要求します。 これは、継続的な操作だけでなく、すべての認識操作に対して機能し、手動オーディオ エンドポイントのプッシュツートークまたは "今すぐ終了" ボタンの使用を容易にします。

Returns:

入力処理が停止されたときに完了する未来。 指定された入力に該当する場合、結果の生成は、このタスクが完了した後に発生する可能性があり、適切なイベントで処理する必要があります。

stopKeywordRecognitionAsync

public Future stopKeywordRecognitionAsync()

キーワード (keyword)開始された認識を終了します。

Returns:

認識を停止する非同期操作を表すタスク。

適用対象