音声入力Voice input

音声では、3 つのキー入力での HoloLens の形式の 1 つです。Voice is one of the three key forms of input on HoloLens. ホログラムを使用することがなく直接コマンドできますジェスチャします。It allows you to directly command a hologram without having to use gestures. 単に視線ホログラムでと、コマンドを読み上げます。You simply gaze at a hologram and speak your command. 音声入力には、ユーザーの意図を通信するために、自然な方法を指定できます。Voice input can be a natural way to communicate your intent. 音声はユーザーが 1 つのコマンドを使用して入れ子になったメニューを切り抜けることができるため、複雑なインターフェイスを通過するに特に適してします。Voice is especially good at traversing complex interfaces because it lets users cut through nested menus with one command.

音声入力が搭載されています、同じエンジン他のすべてのユニバーサル Windows アプリに音声認識をサポートします。Voice input is powered by the same engine that supports speech in all other Universal Windows Apps.


デバイスのサポートDevice support

機能Feature HoloLens (第 1 世代)HoloLens (1st gen) HoloLens 2HoloLens 2 イマーシブ ヘッドセットImmersive headsets
音声入力Voice input ✔️✔️ ✔️✔️ (マイク) を使って ✔️✔️ (with microphone)

"Select"コマンドThe "select" command

具体的には、アプリに音声のサポートを追加、しなくてもユーザーは、ホログラムを"select"と答えるとするだけでアクティブ化することができます。Even without specifically adding voice support to your app, your users can activate holograms simply by saying "select". これは、動作は同じ、エア タップHoloLens、上の select ボタンを押して、 HoloLens clickerトリガーを押したり、 Windows Mixed Reality アニメーション コント ローラー.This behaves the same as an air tap on HoloLens, pressing the select button on the HoloLens clicker, or pressing the trigger on a Windows Mixed Reality motion controller. 音が聞こえるされ、"select"を含む確認として表示されるヒントを参照してください。You will hear a sound and see a tooltip with "select" appear as confirmation. 低電力キーワードの検出アルゴリズムでは"select"が有効になっているため、いつでもあなたの側に手を使用しても、最小限のバッテリ寿命の影響をいつでも記述することができます。"Select" is enabled by a low power keyword detection algorithm so it is always available for you to say at any time with minimal battery life impact, even with your hands at your side.

注意

HoloLens 2 に固有のガイダンスについて近日します。More guidance specific to HoloLens 2 coming soon.

選択範囲に音声コマンドを使用するには、"select"Say "select" to use the voice command for selection
選択範囲に音声コマンドを使用するには、"select"Say "select" to use the voice command for selection

[コルタナさん]Hey Cortana

コルタナさん」はいつでも、Cortana を起動することも言えます。You can also say "Hey Cortana" to bring up Cortana at anytime. 彼女に質問は彼女の続行またはという命令に与えることなど、表示されるまで待機する必要はありません"Hey Cortana、天気とは何ですか"。You don't have to wait for her to appear to continue asking her your question or giving her an instruction - for example, try saying "Hey Cortana what's the weather?" として 1 つの文。as a single sentence. Cortana と何ができるかについての詳細については、単にもらいます。For more information about Cortana and what you can do, simply ask her! たとえば「what can Hey Cortana と言ったでしょうか。」Say "Hey Cortana what can I say?" 機能し、推奨されるコマンドの一覧を彼女をプルします。and she'll pull up a list of working and suggested commands. Cortana アプリになっている場合は、クリックすることも、でしょうか。If you're already in the Cortana app you can also click the ? このメニューを取得するサイドバー上のアイコン。icon on the sidebar to pull up this same menu.

HoloLens に固有のコマンドHoloLens-specific commands

  • 音声操作の項目"What can I say?"
  • 「家に帰る」または"の先頭へ移動"- の代わりにブルーム[スタート] メニュー"Go home" or "Go to Start" - instead of bloom to get to Start Menu
  • "起動""Launch "
  • "移動ここで""Move here"
  • 「画像を撮影する」"Take a picture"
  • 「記録の開始」"Start recording"
  • [記録を停止する]"Stop recording"
  • 「明るさを」"Increase the brightness"
  • 「明るさを下げる」"Decrease the brightness"
  • 「の音量を上げる」"Increase the volume"
  • 「の音量を下げる」"Decrease the volume"
  • 「ミュート」または「ミュートを解除」"Mute" or "Unmute"
  • 「デバイスをシャット ダウン」"Shut down the device"
  • [デバイスを再起動する]"Restart the device"
  • "スリープ状態に移動"Go to sleep"
  • 「どのような時間は?」"What time is it?"
  • 「どのくらいのバッテリは残っているでしょうか。」"How much battery do I have left?"
  • "呼び出す"(HoloLens の Skype が必要)"Call " (requires Skype for HoloLens)

「認識, に言って」"See It, Say It"

HoloLens がも言うことがどのような音声コマンド ボタンにラベル指示がユーザーの音声入力、モデルを「認識,」ということ」を持ちます。HoloLens has a "see it, say it" model for voice input, where labels on buttons tell users what voice commands they can say as well. たとえば、2D アプリを調べるときにユーザーには、世界中で、アプリの位置を調整して、アプリ バーに表示されている「調整」コマンドは、できるとします。For example, when looking at a 2D app, a user can say the "Adjust" command which they see in the App bar to adjust the position of the app in the world.

2D アプリまたはホログラムを見ると、ユーザー、アプリの世界での位置を調整して、アプリ バーに表示されている「調整」コマンドと言いますできます。

アプリでは、この規則に従う、ときにユーザー簡単に理解できる何を言おうシステムを制御します。When apps follow this rule, users can easily understand what to say to control the system. ボタンに gazing 中に、これを補強、するために、ボタンは、ボイスが有効なし、「押す」ことを話すコマンドが表示される場合、その後話題になる「音声ドウェル」ツールヒントが表示されます。To reinforce this, while gazing at a button, you will see a "voice dwell" tooltip that comes up after a second if the button is voice-enabled and displays the command to speak to "press" it.

表示に言って、ボタンの下にコマンドが表示されますSee it, say it commands appear below the buttons
ボタンの下に表示されるコマンド「に言ってを参照してください」"See it, say it" commands appear below the buttons

高速ホログラム操作の音声コマンドVoice commands for fast Hologram Manipulation

さまざまな音声コマンドにすばやく操作タスクを実行するホログラム gazing 中に指定するとします。There are also a number of voice commands you can say while gazing at a hologram to quickly perform manipulation tasks. これらの音声コマンドは、2D アプリだけでなく、世界中に配置した 3D オブジェクトで機能します。These voice commands work on 2D apps as well as 3D objects you have placed in the world.

ホログラム操作コマンドHologram Manipulation Commands

  • 私が発生します。Face me
  • 大きな |強化Bigger | Enhance
  • Smaller

ディクテーションDictation

型指定ではなくエア タップ、音声認識をアプリにテキストを入力する方が効率的にすることができます。Rather than typing with air taps, voice dictation can be more efficient to enter text into an app. 入力をユーザーには、少ない労力でこれが大幅に迅速に行えます。This can greatly accelerate input with less effort for the user.

音声認識がマイク ボタンを選択して開始します。Voice dictation starts by selecting the microphone button
音声認識をキーボード上にあるマイク ボタンを選択して開始します。Voice dictation starts by selecting the microphone button on the keyboard

Holographic キーボードがアクティブで、いつでも入力する代わりにディクテーション モードに切り替えることができます。Any time the holographic keyboard is active, you can switch to dictation mode instead of typing. 開始するのには、テキスト入力ボックスの横のマイクを選択します。Select the microphone on the side of the text input box to get started.

通信Communication

処理オプションの HoloLens によって提供されるカスタマイズされたオーディオ入力を活用する必要があるアプリケーションは、さまざまなを理解しておく必要オーディオ ストリーム カテゴリアプリを使用できます。For applications that want to take advantage of the customized audio input processing options provided by HoloLens, it is important to understand the various audio stream categories your app can consume. これらの 3 つのいくつかの別のストリームのカテゴリと HoloLens では、Windows 10 のサポートを使用して、音声、通信、およびその他に使用できるオーディオのアンビエント環境に合わせたマイクのオーディオの品質を最適化するためにカスタム処理を有効にするにはキャプチャ (つまり"camcorder") のシナリオ。Windows 10 supports several different stream categories and HoloLens makes use of three of these to enable custom processing to optimize the microphone audio quality tailored for speech, communication and other which can be used for ambient environment audio capture (i.e. "camcorder") scenarios.

  • AudioCategory_Communications ストリーム カテゴリの呼び出しの品質とナレーションのシナリオ用にカスタマイズされた、ユーザーの声の 16 kHz 24 ビットのモノラル オーディオ ストリームをクライアントに提供The AudioCategory_Communications stream category is customized for call quality and narration scenarios and provides the client with a 16kHz 24bit mono audio stream of the user's voice
  • AudioCategory_Speech ストリーム カテゴリでは、HoloLens (Windows) の音声認識エンジン用にカスタマイズされた、ユーザーの声の 16 kHz 24 ビット mono ストリームが提供されます。The AudioCategory_Speech stream category is customized for the HoloLens (Windows) speech engine and provides it with a 16kHz 24bit mono stream of the user's voice. このカテゴリは、必要な場合は、サード パーティの音声認識エンジンによって使用できます。This category can be used by 3rd party speech engines if needed.
  • AudioCategory_Other ストリーム カテゴリでは、オーディオ録音のアンビエント環境用にカスタマイズされた、48 kHz 24 ビットのステレオ オーディオ ストリームをクライアントに提供します。The AudioCategory_Other stream category is customized for ambient environment audio recording and provides the client with a 48kHz 24 bit stereo audio stream.

このオーディオのすべての処理は、ハードウェア アクセラレーション機能は、ドレイン、HoloLens CPU 上で同じ処理が行った場合よりも大幅 power つまりです。All this audio processing is hardware accelerated which means the features drain a lot less power than if the same processing was done on the HoloLens CPU. その他のオーディオの入力をシステムのバッテリ寿命を最大化し、組み込みの利用、CPU 上で処理を実行しないように、オーディオ入力の処理をオフロードします。Avoid running other audio input processing on the CPU to maximize system battery life and take advantage of the built in, offloaded audio input processing.

トラブルシューティングTroubleshooting

コルタナさん」、"select"を使用して問題が生じる場合は、ノイズ、または大きな声で話すことによって、ソースから離れた場所にすると、静か空間に移動してみてください。If you're having any issues using "select" and "Hey Cortana", try moving to a quieter space, turning away from the source of noise, or by speaking louder. 現時点では、HoloLens のすべての音声認識はチューニングし、米国英語を母国に特に最適化します。At this time, all speech recognition on HoloLens is tuned and optimized specifically to native speakers of United States English.

Windows Mixed Reality Developer Edition リリース 2017 では、オーディオ エンドポイント管理のロジックが数列 (無限) 後、最初のッドマウント接続後に PC のデスクトップ アウトされ、ログ記録します。For the Windows Mixed Reality Developer Edition release 2017, the audio endpoint management logic will work fine (forever) after logging out and back in to the PC desktop after the initial HMD connection. その最初の兆候アウト/経由 WMR OOBE 後のイベントで、前に、ユーザーから音声の入っていない切り替え、システムが、ッドマウントを最初に接続する前に設定する方法に応じて音声の入っていないまでさまざまなのオーディオ機能問題が発生する可能性があります。Prior to that first sign out/in event after going through WMR OOBE, the user could experience various audio functionality issues ranging from no audio to no audio switching depending on how the system was set up prior to connecting the HMD for the first time.

関連項目See also