音声翻訳とは何か

[アーティクル]
01/22/2024

この記事では、オーディオストリームのリアルタイムの多言語音声間および音声テキスト変換の翻訳を可能にする音声翻訳サービスの利点と機能について学びます。

Speech SDK または Speech CLI を使用すると、アプリケーション、ツール、デバイスから、提供されたオーディオのソーストランスクリプションや翻訳出力にアクセスできます。音声の検出中には中間トランスクリプションと翻訳結果が返され、最終的な結果は、合成された音声に変換することができます。

音声翻訳でサポートされている言語の一覧については、「言語と音声のサポート」を参照してください。

コア機能

認識結果を使用した音声テキスト翻訳。
音声間翻訳。
複数のターゲット言語への翻訳をサポート。
中間認識と翻訳結果。

はじめに

最初の手順として、音声翻訳のクイックスタートをお試しください。音声翻訳サービスは、Speech SDK と Speech CLI を介して利用できます。

GitHub には、Speech SDK の音声テキスト変換と翻訳のサンプルがあります。これらのサンプルは、ファイルやストリームからの音声の読み取り、連続的および単発の認識と翻訳、カスタムモデルの使用など、一般的なシナリオを対象としています。

次のステップ

音声翻訳のクイックスタートを試す
Speech SDK をインストールする
Speech CLI をインストールする

音声翻訳とは何か

コア機能

はじめに

次のステップ

その他のリソース