Direct Line Speech とは

Direct Line Speech は、柔軟で拡張可能な音声アシスタントを作成するための堅牢なエンドツーエンドのソリューションです。 これは、Bot Framework とその Direct Line Speech チャネル (音声によるボットとの対話のために最適化されています) を利用しています。

音声アシスタントはユーザーの音声を聞き取り、応答としてアクションを実行します (多くの場合は音声で応答します)。 これは、音声テキスト変換を使用してユーザーの音声を文字に変換し、そのテキストの自然言語理解に対してアクションを実行します。 このアクションには、多くの場合、テキスト読み上げで生成されたアシスタントからの音声出力が含まれます。

Direct Line Speech は、音声アシスタントのための最高レベルのカスタマイズと精緻化を提供します。 これは、タスクの完了または指示と制御が目的の、自由形式な、自然な、またはその 2 つの性質を持った会話のシナリオ向けに設計されています。 このような高度の柔軟性はさらなる複雑化を伴うため、自然言語入力を使用して十分に定義されたタスクを扱うシナリオでは、ソリューションのエクスペリエンスを簡素化するために、Custom Commands を検討することができます。

Direct Line Speech の使用を開始する

Direct Line Speech を使用して音声アシスタントを作成する最初の手順では、Speech のサブスクリプション キーを取得し、そのサブスクリプションに関連付けられた新しいボットを作成し、そのボットを Direct Line Speech チャネルに接続します。

Direct Line Speech のオーケストレーション サービス フローの概念図

Direct Line Speech を使用して簡単な音声アシスタントを作成するための完全なステップ形式ガイドについては、Speech SDK と Direct Line Speech チャネルを使用してボットを音声対応にするチュートリアルを参照してください。

また、コードを実行し、API を迅速に学習できるように設計されたクイックスタートも用意しています。 以下の表は、音声アシスタントのクイックスタートの一覧を言語とプラットフォーム別に整理して示しています。

クイック スタート プラットフォーム API リファレンス
C#、UWP Windows [参照]
Java Windows、macOS、Linux [参照]
Java Android [参照]

サンプル コード

音声アシスタントを作成するためのサンプル コードは GitHub から入手できます。 これらのサンプルは、いくつかの一般的なプログラミング言語でアシスタントに接続するためのクライアント アプリケーションに対応しています。

カスタマイズ

音声サービスを使用して構築された音声アシスタントでは、音声変換テキスト読み上げ、およびカスタム キーワードの選択に利用できるさまざまなカスタム オプションを使用できます。

注意

カスタマイズのオプションは、言語やロケールによって異なります (サポートされる言語に関するページを参照してください)。

Direct Line Speech と音声アシスタントのための関連する機能は、仮想アシスタント ソリューションとエンタープライズ テンプレートに最適な補足機能です。 Direct Line Speech は任意の互換性のあるボットで機能しますが、これらのリソースは、高品質の会話エクスペリエンスだけでなく、すぐに開始できる一般的なサポート スキルおよびモデルに再利用できるベースラインとして役立ちます。

リファレンス ドキュメント

次のステップ