音声入力Voice input

Voice は、HoloLens での3つの主要な入力形式の1つです。Voice is one of the three key forms of input on HoloLens. これにより、ジェスチャを使用せずに、ホログラムに直接コマンドを実行できます。It allows you to directly command a hologram without having to use gestures. ホログラムを見つめて、コマンドを話すだけです。You simply gaze at a hologram and speak your command. 音声入力は、意図したとおりに通信するための自然な方法である可能性があります。Voice input can be a natural way to communicate your intent. 複雑なインターフェイスを走査するのは、ユーザーが1つのコマンドで入れ子になったメニューを使用できるようにするため、音声は特に便利です。Voice is especially good at traversing complex interfaces because it lets users cut through nested menus with one command.

音声入力は、他のすべてのユニバーサル Windows アプリで音声をサポートするのと同じエンジンによって機能します。Voice input is powered by the same engine that supports speech in all other Universal Windows Apps.


デバイスのサポートDevice support

機能Feature HoloLens (第 1 世代)HoloLens (1st gen) HoloLens 2HoloLens 2 イマーシブ ヘッドセットImmersive headsets
音声入力Voice input ✔️✔️ ✔️✔️ ✔️ (マイクを使用)✔️ (with microphone)

"Select" コマンドThe "select" command

特に音声サポートをアプリに追加しなくても、ユーザーは "select" と言って、ホログラムをアクティブにすることができます。Even without specifically adding voice support to your app, your users can activate holograms simply by saying "select". これは、HoloLens でのエアタップと同じように動作します。また、 hololens clickerの [選択] ボタンを押すか、 Windows Mixed Reality モーションコントローラーでトリガーを押します。This behaves the same as an air tap on HoloLens, pressing the select button on the HoloLens clicker, or pressing the trigger on a Windows Mixed Reality motion controller. サウンドが聞こえ、[選択] というヒントが確認として表示されます。You will hear a sound and see a tooltip with "select" appear as confirmation. "Select" は、低電力キーワード検出アルゴリズムによって有効にされているため、ユーザー側でも、バッテリ寿命の影響を最小限に抑えていつでもいつでも使用できます。"Select" is enabled by a low power keyword detection algorithm so it is always available for you to say at any time with minimal battery life impact, even with your hands at your side.

注意

HoloLens 2 に固有のその他のガイダンスは近日対応予定です。More guidance specific to HoloLens 2 coming soon.

選択に音声コマンドを使用するには、[選択] を言います。Say "select" to use the voice command for selection
選択に音声コマンドを使用するには、[選択] を言います。Say "select" to use the voice command for selection

[コルタナさん]Hey Cortana

また、いつでも cortana を立ち上げることができます。You can also say "Hey Cortana" to bring up Cortana at anytime. 自分の質問を続けたり、指示を与えたりすることができるようになるまで待つ必要はありません。たとえば、「Cortana はどうでしょうか。」と言ってください。You don't have to wait for her to appear to continue asking her your question or giving her an instruction - for example, try saying "Hey Cortana what's the weather?" 1つの文として。as a single sentence. Cortana とその対処方法の詳細については、For more information about Cortana and what you can do, simply ask her! 「Cortana が何を言うことができるか」と言ってください。Say "Hey Cortana what can I say?" 次に、作業と推奨されるコマンドの一覧を取得します。and she'll pull up a list of working and suggested commands. 既に Cortana アプリを使用している場合は、[?] をクリックすることもできます。If you're already in the Cortana app you can also click the ? 同じメニューをプルするためのサイドバーのアイコン。icon on the sidebar to pull up this same menu.

HoloLens 固有のコマンドHoloLens-specific commands

  • 音声操作の項目"What can I say?"
  • [スタート] メニューを表示するには、ブルームの代わりに [ホーム] または [スタートに移動] を実行します。"Go home" or "Go to Start" - instead of bloom to get to Start Menu
  • "起動""Launch "
  • "ここに移動""Move here"
  • "写真を撮る""Take a picture"
  • "記録の開始""Start recording"
  • "記録の停止""Stop recording"
  • 「明るさを上げる」"Increase the brightness"
  • 「明るさを下げる」"Decrease the brightness"
  • "ボリュームを増やす""Increase the volume"
  • "音量を下げる""Decrease the volume"
  • "ミュート" または "ミュート解除""Mute" or "Unmute"
  • "デバイスをシャットダウンする""Shut down the device"
  • "デバイスを再起動する""Restart the device"
  • "スリープ状態に移行""Go to sleep"
  • "どのような時間がかかりますか。""What time is it?"
  • 「どのくらいのバッテリが残っていますか?」"How much battery do I have left?"
  • "通話" (Skype for HoloLens が必要)"Call " (requires Skype for HoloLens)

「言ってください。"See It, Say It"

HoloLens には、音声入力用の "it it はこれを見る" モデルがあります。ボタンのラベルはユーザーに対して、どのような音声コマンドを伝えることもできます。HoloLens has a "see it, say it" model for voice input, where labels on buttons tell users what voice commands they can say as well. たとえば、2D アプリを見ると、ユーザーはアプリバーに表示される "調整" コマンドを使用して、世界中のアプリの位置を調整することができます。For example, when looking at a 2D app, a user can say the "Adjust" command which they see in the App bar to adjust the position of the app in the world.

2D アプリまたはホログラムを見ると、ユーザーはアプリバーに表示される "調整" コマンドを使用して、世界中のアプリの位置を調整することができます。

アプリがこの規則に従うと、ユーザーはシステムを制御する方法を簡単に理解できます。When apps follow this rule, users can easily understand what to say to control the system. これを補強するために、ボタンをクリックすると、ボタンが音声に対応している場合は1秒後に表示される "voice 熟考" というツールヒントが表示され、"press" を押すコマンドが表示されます。To reinforce this, while gazing at a button, you will see a "voice dwell" tooltip that comes up after a second if the button is voice-enabled and displays the command to speak to "press" it.

ボタンの下にコマンドが表示されるとします。See it, say it commands appear below the buttons
「これを見ると、ボタンの下にコマンドが表示される"See it, say it" commands appear below the buttons

迅速なホログラム操作のための音声コマンドVoice commands for fast Hologram Manipulation

また、ホログラムを使用して操作を簡単に実行できる音声コマンドも多数あります。There are also a number of voice commands you can say while gazing at a hologram to quickly perform manipulation tasks. これらの音声コマンドは、世界中に配置した3D オブジェクトだけでなく、2D アプリでも機能します。These voice commands work on 2D apps as well as 3D objects you have placed in the world.

ホログラム操作コマンドHologram Manipulation Commands

  • Face me
  • 大規模 |用Bigger | Enhance
  • Smaller

ディクテーションDictation

音声ディクテーションで入力するのではなく、アプリケーションにテキストを入力する方が効率的です。Rather than typing with air taps, voice dictation can be more efficient to enter text into an app. これにより、ユーザーの負担を軽減しながら、入力を大幅に高速化できます。This can greatly accelerate input with less effort for the user.

音声ディクテーションを開始するには、マイクボタンを選択します。Voice dictation starts by selecting the microphone button
音声ディクテーションを開始するには、キーボードのマイクボタンを選択します。Voice dictation starts by selecting the microphone button on the keyboard

Holographic キーボードがアクティブなときはいつでも、入力せずにディクテーションモードに切り替えることができます。Any time the holographic keyboard is active, you can switch to dictation mode instead of typing. 開始するには、テキスト入力ボックスの横にあるマイクを選択します。Select the microphone on the side of the text input box to get started.

通信Communication

HoloLens が提供するカスタマイズされたオーディオ入力処理オプションを利用する必要があるアプリケーションでは、アプリが使用できるさまざまなオーディオストリームのカテゴリを理解することが重要です。For applications that want to take advantage of the customized audio input processing options provided by HoloLens, it is important to understand the various audio stream categories your app can consume. Windows 10 では、さまざまなストリームカテゴリがサポートされています。 HoloLens では、これらのうちの3つを使用して、音声、通信、およびアンビエント環境のオーディオ用に調整されたマイクオーディオの品質を最適化するカスタム処理を可能にします。キャプチャ ("カムコーダー" など) シナリオ。Windows 10 supports several different stream categories and HoloLens makes use of three of these to enable custom processing to optimize the microphone audio quality tailored for speech, communication and other which can be used for ambient environment audio capture (i.e. "camcorder") scenarios.

  • AudioCategory_Communications stream カテゴリは、通話の品質とナレーションのシナリオに合わせてカスタマイズされ、クライアントにユーザーの声の 16kHz 24bit mono オーディオストリームを提供します。The AudioCategory_Communications stream category is customized for call quality and narration scenarios and provides the client with a 16kHz 24bit mono audio stream of the user's voice
  • AudioCategory_Speech stream カテゴリは、HoloLens (Windows) 音声エンジン用にカスタマイズされており、ユーザーの声の 16kHz 24bit mono ストリームを提供します。The AudioCategory_Speech stream category is customized for the HoloLens (Windows) speech engine and provides it with a 16kHz 24bit mono stream of the user's voice. このカテゴリは、サードパーティの音声エンジンで必要に応じて使用できます。This category can be used by 3rd party speech engines if needed.
  • AudioCategory_Other stream カテゴリはアンビエント環境オーディオ記録用にカスタマイズされており、クライアントには 48 Khz 24 ビットのステレオオーディオストリームが用意されています。The AudioCategory_Other stream category is customized for ambient environment audio recording and provides the client with a 48kHz 24 bit stereo audio stream.

このようなオーディオ処理はすべてハードウェアアクセラレータです。これは、HoloLens CPU で同じ処理が行われた場合と比べて、機能の電力消費が多くなることを意味します。All this audio processing is hardware accelerated which means the features drain a lot less power than if the same processing was done on the HoloLens CPU. システムのバッテリ寿命を最大化し、組み込みのオフロードオーディオ入力処理を活用するために、CPU で他のオーディオ入力処理を実行しないようにします。Avoid running other audio input processing on the CPU to maximize system battery life and take advantage of the built in, offloaded audio input processing.

トラブルシューティングTroubleshooting

"Select" と "Cortana" を使用して問題が発生している場合は、静かな領域に移動するか、ノイズの発生源から離れるか、音を大きくしてみてください。If you're having any issues using "select" and "Hey Cortana", try moving to a quieter space, turning away from the source of noise, or by speaking louder. 現時点では、HoloLens の音声認識はすべて米国英語のネイティブスピーカーに対して調整および最適化されています。At this time, all speech recognition on HoloLens is tuned and optimized specifically to native speakers of United States English.

Windows Mixed Reality Developer Edition release 2017 では、オーディオエンドポイント管理ロジックは、最初の HMD 接続の後、いったんログアウトして PC デスクトップに戻すと、正常に機能します。For the Windows Mixed Reality Developer Edition release 2017, the audio endpoint management logic will work fine (forever) after logging out and back in to the PC desktop after the initial HMD connection. ユーザーは、WMR OOBE を通過した後に初めてサインアウト/イベントが発生する前に、HMD を初めて接続する前にシステムがどのように設定されているかによって、オーディオの切り替えなしのさまざまなオーディオ機能の問題が発生する可能性があります。Prior to that first sign out/in event after going through WMR OOBE, the user could experience various audio functionality issues ranging from no audio to no audio switching depending on how the system was set up prior to connecting the HMD for the first time.

関連項目See also