音声翻訳とは何か

この概要では、多言語のオーディオ ストリームをリアルタイムで音声間の翻訳または音声テキスト変換できる音声翻訳サービスの利点と機能について説明します。 Speech SDK を使用すると、アプリケーション、ツール、およびデバイスから、提供されたオーディオのソース トランスクリプションや翻訳出力にアクセスすることができます。 音声の検出中には中間トランスクリプションと翻訳結果が返され、最終的な結果は、合成された音声に変換することができます。

このドキュメントには、次の種類の記事が含まれています。

  • クイックスタート は、サービスへの要求の実行方法を説明する概要手順です。
  • 攻略ガイド には、より具体的またはカスタマイズした方法でサービスを使用するための手順が記載されています。
  • 概念 では、サービスの機能と特徴について詳しく説明します。
  • チュートリアル はより長文のガイドであり、より広範なビジネス ソリューションの 1 コンポーネントとしてこのサービスを使用する方法を示すものです。

コア機能

  • 認識結果を使用した音声テキスト翻訳。
  • 音声間翻訳。
  • 複数のターゲット言語への翻訳をサポート。
  • 中間認識と翻訳結果。

はじめに

音声翻訳の使用を開始するには、クイックスタートを参照してください。 音声翻訳サービスは、Speech SDKSpeech CLI を介して利用できます。

サンプル コード

Speech SDK のサンプル コードは、GitHub 上で入手できます。 これらのサンプルは、ファイルやストリームからの音声の読み取り、連続的および開始時の認識や翻訳、カスタム モデルの使用など、一般的なシナリオを対象としています。

移行ガイド

アプリケーション、ツール、または製品で Translator Speech API をご使用の方に向けて、Speech Service への移行に役立つガイドを作成しました。

リファレンス ドキュメント

次のステップ