音声入力 — MRTK3

概要

MRTK での音声入力は、PhraseRecognitionSubsystem の実装によって実現されます。 既定では、UNITY KeywordRecognizerを利用するWindowsPhraseRecognitionSubsystemを MRTK が出荷します。 MRTK v2 と同様に、この既定の実装は、Windows エディター、スタンドアロン Windows、および UWP でのみサポートされます。

注意

このガイドでは、新しい MRTK プロジェクトで音声サブシステムを有効にする手順について説明します。基本的な非音声関連のセットアップが既に行われていると仮定します。 サンプル プロジェクトを使用している場合は、いくつかの手順が実行されていることがわかります。

重要

HoloLens 2 で WindowsPhraseRecognitionSubsystem が実行されると "select" キーワードが認識されませんが、これは外部バグが原因です。 この問題については、関係者と協力して対処中です。 軽減するには、 音声認識キーワードをStatefulInteractableのもと(またはPressableButtonなどのサブクラス)で変更してください。-> Advanced StatefulInteractable 設定 -> 声による選択を許可 ->音声認識キーワード

セットアップ

音声サブシステムを有効にする

  1. プロジェクト設定 - >Mixed Reality ツールキット -> 使用可能な MRTK サブシステムに移動します。
  2. 使用したい音声サブシステムを有効にします。 現時点では、MRTK には WindowsPhraseRecognitionSubsystem のみが付属しています。

プロファイルを正しく構成します

一部のサブシステムでは、正常に実行するためにプロファイルが必要です。 現在出荷されている WindowsPhraseRecognitionSubsystem はプロファイルを必要としないため、この設定は省略できます。 今後の PhraseRecognitionSubsystem の実装ではプロファイルが必要になる可能性があるので注意してください。

MRTK Speech GameObject がアクティブであることを確認する

関連するスクリプトがアクティブであることを確認するには、MRTK XR Rig -> MRTK Speech がアクティブであることを確認します。

プレーヤーの設定で適切な機能が設定されていることを確認する

たとえば UWP プラットフォームを使用する場合は、[プロジェクトの設定] - >[プレーヤー] ->[発行設定] -> [機能] に移動し、マイク機能が設定されていることを確認します。

デバイス/エディター内でシーンを実行する

プロジェクトは、デバイスまたはエディターで実行する準備ができている必要があります。

>StatefulInteractable (または PressableButton などのサブクラス) は、音声サブシステムと連動させるために音声コマンドを受け入れるように設定する必要があります。 より調整可能な設定については、そのインスペクター (詳細な StatefulInteractable 設定下) と同様に SpeechInteractor (MRTK XR Rig -> MRTK Speech) を参照してください。