音声翻訳とは何か

この記事では、オーディオ ストリームのリアルタイムの多言語音声間および音声テキスト変換の翻訳を可能にする音声翻訳サービスの利点と機能について学びます。

Speech SDK または Speech CLI を使用すると、アプリケーション、ツール、デバイスから、提供されたオーディオのソース トランスクリプションや翻訳出力にアクセスできます。 音声の検出中には中間トランスクリプションと翻訳結果が返され、最終的な結果は、合成された音声に変換することができます。

音声翻訳でサポートされている言語の一覧については、「言語と音声のサポート」を参照してください。

コア機能

  • 認識結果を使用した音声テキスト翻訳。
  • 音声間翻訳。
  • 複数のターゲット言語への翻訳をサポート。
  • 中間認識と翻訳結果。

はじめに

最初の手順として、音声翻訳のクイック スタートをお試しください。 音声翻訳サービスは、Speech SDKSpeech CLI を介して利用できます。

GitHub には、Speech SDK の音声テキスト変換と翻訳のサンプルがあります。 これらのサンプルは、ファイルやストリームからの音声の読み取り、連続的および単発の認識と翻訳、カスタム モデルの使用など、一般的なシナリオを対象としています。

次のステップ