SpeechSynthesizer クラス

音声シンセサイザー。

継承
builtins.object
SpeechSynthesizer

コンストラクター

SpeechSynthesizer(speech_config: ~azure.cognitiveservices.speech.SpeechConfig, audio_config: ~azure.cognitiveservices.speech.audio.AudioOutputConfig | None = <azure.cognitiveservices.speech.audio.AudioOutputConfig object>, auto_detect_source_language_config: ~azure.cognitiveservices.speech.languageconfig.AutoDetectSourceLanguageConfig = None)

パラメーター

名前 説明
speech_config
必須

音声シンセサイザーの構成

audio_config

オーディオ出力の構成。 このパラメーターは省略可能です。 指定されていない場合は、既定のスピーカー デバイスがオーディオ出力に使用されます。 [なし] の場合、出力オーディオは削除されます。 パフォーマンス テストなどのシナリオでは使用できません。

auto_detect_source_language_config

自動検出ソース言語の構成

既定値: None

メソッド

get_voices_async

使用可能な音声を非同期で取得します。

speak_ssml

ブロック (同期) モードで ssml で合成を実行します。

speak_ssml_async

非ブロッキング (非同期) モードで ssml で合成を実行します。

speak_text

ブロッキング (同期) モードでプレーン テキストに対して合成を実行します。

speak_text_async

非ブロッキング (非同期) モードでプレーン テキストに対して合成を実行します。

start_speaking_ssml

ブロック (同期) モードで ssml で合成を開始します。

start_speaking_ssml_async

非ブロッキング (非同期) モードで ssml で合成を開始します。

start_speaking_text

ブロック (同期) モードでプレーン テキストで合成を開始します。

start_speaking_text_async

非ブロッキング (非同期) モードでプレーン テキストで合成を開始します。

stop_speaking

進行中の合成操作を同期的に終了します。 このメソッドは、PullAudioOutputStream の再生を停止し、未読データを消去します。

stop_speaking_async

進行中の合成操作を非同期的に終了します。 このメソッドは、PullAudioOutputStream の再生を停止し、未読データを消去します。

get_voices_async

使用可能な音声を非同期で取得します。

get_voices_async(locale: str = '') -> ResultFuture

パラメーター

名前 説明
locale
必須

音声のロケールを BCP-47 形式で指定します。または空のままにして、使用可能なすべての音声を取得します。

戻り値

説明

音声を取得する非同期操作を表すタスク。

speak_ssml

ブロック (同期) モードで ssml で合成を実行します。

speak_ssml(ssml: str) -> SpeechSynthesisResult

パラメーター

名前 説明
ssml
必須

戻り値

説明

SpeechSynthesisResult。

speak_ssml_async

非ブロッキング (非同期) モードで ssml で合成を実行します。

speak_ssml_async(ssml: str) -> ResultFuture

パラメーター

名前 説明
ssml
必須

戻り値

説明

SpeechSynthesisResult の未来。

speak_text

ブロッキング (同期) モードでプレーン テキストに対して合成を実行します。

speak_text(text: str) -> SpeechSynthesisResult

パラメーター

名前 説明
text
必須

戻り値

説明

SpeechSynthesisResult。

speak_text_async

非ブロッキング (非同期) モードでプレーン テキストに対して合成を実行します。

speak_text_async(text: str) -> ResultFuture

パラメーター

名前 説明
text
必須

戻り値

説明

SpeechSynthesisResult の未来。

start_speaking_ssml

ブロック (同期) モードで ssml で合成を開始します。

start_speaking_ssml(ssml: str) -> SpeechSynthesisResult

パラメーター

名前 説明
ssml
必須

戻り値

説明

SpeechSynthesisResult。

start_speaking_ssml_async

非ブロッキング (非同期) モードで ssml で合成を開始します。

start_speaking_ssml_async(ssml: str) -> ResultFuture

パラメーター

名前 説明
ssml
必須

戻り値

説明

SpeechSynthesisResult の未来。

start_speaking_text

ブロック (同期) モードでプレーン テキストで合成を開始します。

start_speaking_text(text: str) -> SpeechSynthesisResult

パラメーター

名前 説明
text
必須

戻り値

説明

SpeechSynthesisResult。

start_speaking_text_async

非ブロッキング (非同期) モードでプレーン テキストで合成を開始します。

start_speaking_text_async(text: str) -> ResultFuture

パラメーター

名前 説明
text
必須

戻り値

説明

SpeechSynthesisResult の未来。

stop_speaking

進行中の合成操作を同期的に終了します。 このメソッドは、PullAudioOutputStream の再生を停止し、未読データを消去します。

stop_speaking() -> None

stop_speaking_async

進行中の合成操作を非同期的に終了します。 このメソッドは、PullAudioOutputStream の再生を停止し、未読データを消去します。

stop_speaking_async() -> ResultFuture

戻り値

説明

合成が停止されると実現される未来。

属性

authorization_token

サービスへの接続に使用される承認トークン。

注意

呼び出し元は、認証トークンが有効であることを確認する必要があります。 の前に

承認トークンの有効期限が切れます。呼び出し元は、 を使用してこのセッターを呼び出して更新する必要があります。

新しい有効なトークン。 そうしないと、シンセサイザーで音声合成中にエラーが発生します。

bookmark_reached

ブックマークに到達したことを示すイベントのシグナル。

このシグナルに接続されているコールバックは、インスタンスを SpeechSynthesisBookmarkEventArgs 1 つの引数として呼び出します。

注意

バージョン 1.16.0 で追加されました。

properties

この SpeechSynthesizer に対して定義されているプロパティとその値のコレクション。

synthesis_canceled

合成が取り消されたことを示すイベントのシグナル。

このシグナルに接続されているコールバックは、インスタンスを SpeechSynthesisEventArgs 1 つの引数として呼び出します。

synthesis_completed

合成が完了したことを示すイベントのシグナル。

このシグナルに接続されているコールバックは、インスタンスを SpeechSynthesisEventArgs 1 つの引数として呼び出します。

synthesis_started

合成が開始されたことを示すイベントのシグナル。

このシグナルに接続されているコールバックは、インスタンスを SpeechSynthesisEventArgs 1 つの引数として呼び出します。

synthesis_word_boundary

単語の境界を示すイベントのシグナル。

このシグナルに接続されているコールバックは、インスタンスを SpeechSynthesisWordBoundaryEventArgs 1 つの引数として呼び出します。

synthesizing

合成が進行中であることを示すイベントのシグナル。

このシグナルに接続されているコールバックは、インスタンスを SpeechSynthesisEventArgs 1 つの引数として呼び出します。

viseme_received

口形素が受信されたことを示すイベントのシグナル。

このシグナルに接続されているコールバックは、インスタンスを SpeechSynthesisVisemeEventArgs 1 つの引数として呼び出します。

注意

バージョン 1.16.0 で追加されました。