Bing Speech から Speech Service に移行する

アプリケーションを Bing Speech API から Speech Service に移行するにあたっては、この記事を参考にしてください。

重要

Speech Service は、Bing Speech API に代わるものです。 アプリケーションを Speech Service に移行してください。

この記事では、Bing Speech API と Speech Service の違いを簡単に説明し、アプリケーションの移行方法を提案します。 Bing Speech API サブスクリプション キーは Speech Service では機能しません。新たに Speech Service サブスクリプションが必要です。

1 つの Speech Service サブスクリプション キーで、次の機能にアクセスできます。 それぞれが個別に測定されるため、課金は使用した機能に対するものだけです。

Speech SDK は Bing Speech クライアント ライブラリの機能を代替するものですが、使用している API は異なります。

機能の比較

Speech Service と Bing Speech はよく似ていますが、次のような違いがあります。

機能 Bing Speech Speech サービス 詳細
C# SDK ✔️ ✔️ Speech Service は、Windows 10、Universal Windows Platform (UWP)、および .NET Standard 2.0 に対応します。
C++ SDK ✔️ Speech Service は Windows および Linux に対応します。
Java SDK ✔️ ✔️ Speech Service は Android および Speech Devices に対応します。
連続音声認識 10 分 無制限 Speech SDK は、無制限の連続認識をサポートし、タイムアウトまたは切断時には自動的に再接続します。
部分的または中間結果 ✔️ ✔️ Speech SDK でサポートされています。
カスタム音声モデル ✔️ ✔️ Bing Speech には別個の Custom Speech サブスクリプションが必要です。
カスタム音声フォント ✔️ ✔️ Bing Speech には別個の Custom Voice サブスクリプションが必要です。
24 KHz の音声 ✔️
音声意図認識 別途 LUIS API 呼び出しが必要 統合済み (SDK) Speech Service では LUIS キーを利用できます。
簡単な意図認識 ✔️
長い音声ファイルの一括文字起こし ✔️
認識モード エンドポイント URI 経由での手動 自動 Speech Service には認識モードはありません。
エンドポイントの地域性 グローバル 地域 地域のエンドポイントによって、待機時間が改善されます。
REST API ✔️ ✔️ Speech Service REST API は Bing Speech と互換性があります (エンドポイントは異なる)。 REST API はテキスト読み上げ機能と音声テキスト変換機能(限定的) をサポートしています。
WebSockets プロトコル ✔️ サービスへの常時接続を必要とする機能に向けた Web ソケット接続が Speech SDK によって抽象化されるため、手動でのサブスクライブはサポートされなくなりました。
Service-to-service API 呼び出し ✔️ Bing Speech では、C# サービス ライブラリで提供。
オープンソース SDK ✔️

Speech Service では、トランザクション ベースではなく時間ベースの価格モデルが採用されています。 詳しくは、Speech Service の価格に関するページをご覧ください。

移行方法

Bing Speech API を使用しているアプリケーションを開発中の場合、あるいはそうしたアプリケーションを運用している場合は、できるかぎり速やかに Speech Service を使用するように更新することをお勧めします。 使用できる SDK やサンプル コード、チュートリアルについては、Speech Service のドキュメントをご覧ください。

Speech Service の REST API Bing Speech の API 互換性があります。 現在 Bing Speech REST API をご利用の場合は、REST エンドポイントのみを変更し、Speech Service サブスクリプション キーに切り替えるだけで済みます。

ただし、特定のプログラミング言語で Bing Speech クライアント ライブラリを使用している場合、Speech SDK に移行するには、API が異なるため、アプリケーションそのものを変更する必要があります。 Speech SDK により、新しい機能を利用できる一方でコードを簡略化できるようになります。 Speech SDK は、さまざまなプログラミング言語で使用できます。 どのプラットフォームの API も似ており、マルチプラットフォーム開発が容易になります。

Speech Service では、グローバル エンドポイントは提供されません。 アプリケーションのすべてのトラフィックに単一のリージョン エンドポイントを使用しているときにアプリケーションが効率的に機能するかどうかを判断します。 効率的に機能しない場合は、geolocation を使って最も効率的なエンドポイントを探してください。 使用するリージョンごとに Speech Service サブスクリプションが必要になります。

Speech SDK を使ってみる

  1. Speech SDK をダウンロードします。
  2. Speech Service クイック スタート ガイドチュートリアルに従って作業します。 また、コード サンプルを見て、新しい API に関する経験を得ます。
  3. Speech Service を使用するようにアプリケーションを更新します。

サポート

Bing Speech のお客様はサポート チケットを開いて、カスタマー サービスに問い合わせることをお勧めします。 サポートでテクニカル サポート プランが必要な場合もお問い合わせください。

Speech Service、SDK、および API サポートについては、Speech Service のサポート ページをご覧ください。

次のステップ